6 月 3 日音讯 ,英伟科技媒体 marktechpost 昨日(6 月 2 日)发布博文 ,达协报导称英伟达联合麻省理工学院(MIT)、作推香港大学 ,英伟协作推出 Fast-dLLM 结构 ,达协大幅提高分散模型(Diffusion-based LLMs)的作推推理速度 。
分散模型被认为是英伟传统自回归模型(Autoregressive Models)的有力竞赛者,选用双向注意力机制(Bidirectional Attention Mechanisms),达协理论上能经过同步生成多个词元(Multi-token Generation)加快解码进程 。作推
不过在实践使用中