水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

股道的卢

06年入市实战操作至今,经...


价值领航

稳健的投资风格和淘金精神


柴孝伟

建造十九层每层成倍财富高楼...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


banner

banner

DeepSeek发布创新注意力机制NSA,继续推荐AI软件应用

股海方舟   / 02月18日 23:48 发布

DeepSeek 发布新论文,提出了新的注意力机制 ——NSA(Native Sparse Attention),是一种面向硬件且支持原生训练的稀疏注意力机制,专为超快长上下文训练与推理设计。


NSA架构在通用基准测试中达到了全注意力的性能,长上下文评估中的建模能力更胜一筹,推理能力得到增强,同时计算延迟显著降低,在64K长文本场景下,NSA实现解码速度提升11.6倍、前向传播9倍加速、反向传播6倍加速。


我们此前提出AI应用规模化的两大基石——降本&降延时,如今均迎来重大突破,DeepSeek让大模型部署和推理成本下降了一个数量级,此次提出的NSA架构将让大模型的推理速度提升一个数量级。AI应用或将迎来全面爆发的黄金时代,我们继续推荐AI软件应用。


相关标的:用友网络、金蝶国际、虹软科技、新致软件、迈富时、鼎捷数智、合合信息、软通动力、金山办公、博思软件、顶点软件

(【西部计算机】DeepSeek发布创新注意力机制NSA,推理速度大幅提高)