小众架构飙出892tokens/秒速度谁能想到啊，在自回归模型（Autoreg

量子位看科技 2026-02-11 11:03:06

小众架构飙出892tokens/秒速度

谁能想到啊，在自回归模型（Autoregressive，AR）当道的现在，一个非主流架构的模型突然杀了回马枪——

被长期视为学术玩具的扩散语言模型，直接在复杂编程任务中飙出了892 tokens/秒的速度！【图1】

你没看错，当主流大模型还在以几十token的速度逐字蹦词时，这个非主流模型已经在100B参数规模上，跑出了如此的速度。

2025年，蚂蚁集团资深技术专家赵俊博曾经带着LLaDA2.0登上量子位MEET大会的舞台，而如今，他们的最新版本LLaDA2.1来了，蚂蚁技术研究院重磅开源！

三个月前，在LLaDA2.0时代，这更多是一个充满挑战的研究性模型。

而这一次，LLaDA2.1的诞生，标志着这个路线的历史性转折。它不再只是一个“学术研究”，而是真正可用、甚至在效率上更为优越的强大工具。

那么在整个行业都在卷更大的自回归模型时，蚂蚁到底是怎么低调修了另一条“能跑通的高速公路”的？

接下来，我们就再一起扒一扒这个非共识技术背后的原理。网页链接

0 阅读：5

量子位看科技

感谢大家的关注

作者最新文章

1

万亿赛道格局初定，谁在第一梯队？ 2025具身智能创投全景：554亿热钱，4大估

2

小众架构飙出892tokens/秒速度谁能想到啊，在自回归模型（Autoreg

3

：《人类画了100年的脑图，AI仅用几小时！还绘制出新脑区》人类画了100年

4

：《Qwen-Image-2.0炸场：1K长文本硬吃，中文生图彻底不拧巴了》

5

面壁智能开源全模态模型MiniCPM-o4.5，边看边听还能主动抢答空气炸锅“叮

6

大模型通往现实世界的“最后三公里”，Agent已然成为最具代表性的入场券。但当下

7

用多邻国方式学OpenClaw Skills AI来了，学习方式也变样了。就好比

8

阿里达摩院开源具身大脑基模扭头就忘事的机器人有救了今天，达摩院开源了RynnB

9

：《1分钱部署OpenClaw！4步搞定，全图形界面10分钟跑通专属AI助手》

10

马年未至，春节档新模型已经提前开卷了。OpenRouter 悄悄上线了一款神秘模

热门分类

科技TOP

1

雷军明天早上8:00又要做直播！就是刚才，雷军在社交网络上给大家拜早年了，这

2

宇树机器人三上春晚，宇树机器人今后就是春晚界的“赵本山”，今年宇树机器人又会带给

3

华为第二代阔折叠机型曝光华为PuraX2终于要来了，华为这个产品其实挺有意

4

影石年会直接送5套房打工人看完直接破防了！影石Insta360这波年会操

5

ProAir正式发布了：6.1mm厚，155g重，6.3寸屏幕小尺寸天

6

TikTok因应用程序的成瘾功能被指控违反欧盟规定TikTok、周五、被指控违反

7

鸿蒙微信消费者版本邀请内测8.0.15.161.设置-朋友权限新增“添加我的

8

宇树机器人的主要供应链曝光了，果然，制造业是一个大的生态，一荣俱荣。#宇树#

9

刚刚！400万粉丝大V曝光流量收益！流量原来真的可以变现，就在刚刚，拥有400

10

我去小米澎湃OS3深夜上热搜。

科技最新文章

1

影石年会直接送5套房打工人看完直接破防了！影石Insta360这波年会操

2

去年是DeepSeek，今年是Seedance！去年deepseek让大模型的硬

3

LCD党终于等来了一款主流品牌新机，它就是iQOOZ11X，这款手机搭载了6.

4

全体起立！荣耀X80配置曝光，这次性能和续航将全面升级，再加上一如既往的出色外观

5

曝华为阔屏直板机立项确实听说了，而且好像不止华为哦，还有两家也在考虑阔直屏，这让

6

华为要出阔屏直板机？看到传了好久的阔屏直板机要来了，16：9的屏幕确实怀念，但

7

谁也没想到，三星S26标准版一曝光就扔出王炸！😯机身狂减重，相机彻底变

8

华为nova14Ultra512GB版发布仅半年，价格从首发4499元直降至

9

雷军确认第一代SU7停产实话实说，su7是一款划时代的车型绝大多数人在当时都小看

10

雷军宣布初代苏7正式停产！2年卖了37万辆，平均一辆25万，卖了925亿！23个