小众架构飙出892tokens/秒速度谁能想到啊,在自回归模型(Autoreg

量子位看科技 2026-02-11 11:03:06

小众架构飙出892tokens/秒速度

谁能想到啊,在自回归模型(Autoregressive,AR)当道的现在,一个非主流架构的模型突然杀了回马枪——

被长期视为学术玩具的扩散语言模型,直接在复杂编程任务中飙出了892 tokens/秒的速度!【图1】

你没看错,当主流大模型还在以几十token的速度逐字蹦词时,这个非主流模型已经在100B参数规模上,跑出了如此的速度。

2025年,蚂蚁集团资深技术专家赵俊博曾经带着LLaDA2.0登上量子位MEET大会的舞台,而如今,他们的最新版本LLaDA2.1来了,蚂蚁技术研究院重磅开源!

三个月前,在LLaDA2.0时代,这更多是一个充满挑战的研究性模型。

而这一次,LLaDA2.1的诞生,标志着这个路线的历史性转折。它不再只是一个“学术研究”,而是真正可用、甚至在效率上更为优越的强大工具。

那么在整个行业都在卷更大的自回归模型时,蚂蚁到底是怎么低调修了另一条“能跑通的高速公路”的?

接下来,我们就再一起扒一扒这个非共识技术背后的原理。网页链接

0 阅读:5
量子位看科技

量子位看科技

感谢大家的关注