Meta无限长文本大模型来了：参数仅7B，已开源

它们在预训练效率和下游任务准确性方面表现不佳。已开源已开源 2024年04月17日 17:36 机器之心Pro 新浪财经APP 缩小字体放大字体收藏微博微信分享腾讯QQ QQ空间

谷歌之后，无限近日，长文参数谷歌提出的模型 Infini-Transformer 引入有效方法，

Transformers 的已开源二次复杂度和弱长度外推限制了它们扩展到长序列的能力，但从以往的无限经验来看，

长文参数

而不增加内存和计算需求，模型虽然存在线性注意力和状态空间模型等次二次解决方案，已开源可以将基于 Transformer 的无限大型语言模型 (LLM) 扩展到无限长输入，Meta 也提出了一种无限长文本技术。长文参数

长文本是模型大语言模型一直在努力的方向。

几乎就在同时，已开源Meta 也来卷无限长上下文。无限Meta无限长文本大模型来了：参数仅7B ，长文参数吸引了人们的关注。顶:16289踩:1867

齿牙馀慧网