Meta刚发了一篇魔改Transformer的论文：TheFreeTrans

蚁工厂 2025-10-23 09:22:42

Meta刚发了一篇魔改Transformer的论文：The Free Transformer

论文作者François Fleuret在FAIR任职（杨立昆领导的那个研究机构）

大概意思是，现在的Transformer还是遵循一个词一个词预测的模式。该论文用了一种叫“条件变分自编码器”（Conditional Variational Autoencoder, VAE）的方法，让模型在生成文本前先在内部形成一个高层的、抽象的“规划”或“主题”，然后再基于这个规划进行具体的遣词造句。这种方法更符合自然的创作过程，并且以极小的代价换来了在复杂推理任务上明显的性能提升。

在 1.5B 和 8B 两种规模的模型上进行了评估，用这种方法，大概都有5%左右的性能提升。

0 阅读：0

感谢大家的关注

作者最新文章

1

赤鸡

2

rentry.org/samplers《现代大语言模型采样入门指南》，一篇长文，

3

斯坦福大学，Transformer 与大语言模型备忘单github.com/af

4

[柯基]明天麦当劳有程序员节活动。不过力度一般，答题或认证github账号可得一

5

LangChain 和 LangGraph 终于到1.0版本啦~~

6

应该是因为之前那个不同供应商之前模型性能差异的评测，openrouter官方也要

7

2025年大语言模型（LLM）主要技术路线图图片作者：Sebastian Ras

8

Meta刚发了一篇魔改Transformer的论文：The Free Trans

9

2004年10月20日，Ubuntu的第一个版本发布。21年啦。

10

GLM 刚发了 Glyph 技术，和 DeepSeek-OCR 有点像啊。都是将

热门分类

科技TOP

1

这是做什么工作的？电脑上也看不懂

2

华为官宣鸿蒙操作系统610月22日特别发布，官宣更好看，更好用，更智能，更安

3

华为Mate80会在2025年11月发布，大家最关心的是它用的芯片，麒麟9030

4

HarmonyOS6来了，10月22日14:30，鸿蒙操作系统6

5

我发誓，我的Mate60Pro还没捂热乎呢，Mate80的消息就直接要上王

6

荣耀最新一轮系统更新，支持适配的手机名单，看看你的手机上榜没有上周荣耀公布了

7

这是iQOO15首销战报1、iQOO15是发布即开售，根据官方的信息iQOO

8

努比亚Z80Ultra不止影像，也是骁龙最强旗舰芯，搭配上巅峰版LPDDR5X和

9

真正懂手机的人，这四款旗舰选哪款？2025下半年又一波中杯旗舰上新，想换手机

10

家人们速码！2025荣耀手机闭眼入清单来啦宝子们，2025想换荣耀手机却挑花

科技最新文章

1

看到一张华子mate70pro和mate80pro的对比图，mate80pro拥

2

红米K90系列这次确实够猛，简直要把小米数字系列按在地上摩擦。K90标准版就很夸

3

余承东被拍到的这个手机应该是PuraX，不是华为Mate80。感觉Mate8

4

卢伟冰开展调研，了解消费者对屏幕尺寸的偏好，他给出了三个屏幕尺寸选项：6.3、6

5

这几天一直有传言说，余总手里拿的是即将要发布的Mate80系列，这是彻头彻尾的谣

6

nubiaZ80Ultra这次存在感是真的足~首场在影视飓风发布的

7

10月22日鸿蒙6正式发布！余总又爆金句：“用户的心愿单是鸿蒙重要原动力”。有了

8

华为发布鸿蒙星河互联架构连接更强，感知更强，传输速率高达160MB/s，跨端分

9

努比亚Z80Ultra不止影像，也是骁龙最强旗舰芯，搭配上巅峰版LPDDR5X和

10

OpenAI发布Atlas浏览器，向谷歌和微软发起挑战该公司周二表示，这