用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构

用60%成本干80%的用成事,DeepSeek分享沉淀多年的本干 高性能深度学习架构 2024年09月06日 17:35 机器之心Pro 新浪财经APP 缩小字体 放大字体 收藏 微博 微信 分享 腾讯QQ QQ空间

硬件发展速度跟不上 AI 需求,就需要精妙的事多年的高架构和算法。

根据摩尔定律,分享计算机的沉淀速度平均每两年就会翻一倍,但深度学习的性能学习发展速度还要更快,如图 1 和 2 所示。深度

架构
Baidu
map