-
A股龙空龙 / 03月03日 07:24 发布
刚刚研究了Deepseek真实利润率之争,篇幅问题直接说结论,ds服务器真正的瓶颈不是推理,而是输入。联网搜.索功能要把检索到的长文全部阅读一遍。多轮对话时,上文也需要全部阅读。
大量输入消耗了近半算力,这和前几天阿里云副飞飞的发言完全对上了:
目前,阿里云正在GPU加CPU的异构资源池上做优化,未来,数据库要研发的关键能力也是要将昂贵的GPU尽可能地省下来做最珍贵的计算和缓存,将次要的计算和缓存推到CPU加内存和存储的三层池化中,让在线推理变得更低成本。
举个例子,我问了问题1,回复我A;又问2,回复我B;问3的时候,模型要把1A2B3全部拿去输入计算,推理出C。这就有优化空间,如果用便宜的存储把上文存起来,就可以尽可能节省推理算力。
存储,正是ds部署能达到理想利润率的关键。加上最近一直在涨价,个人认为存储是接下来资金共振的核心板块。
另外可以关注的低位方向有:ds应用某公司订单落地,机器人应用,美国外交政策利好台湾问题解决,钴涨价等等。