-
AI算力紧缺的破局点
大铭法度 / 2023-10-26 12:52 发布
一,自研存算一体芯片在路上
华为在自研芯片上的突破
, 似乎已经出现骨牌效应, 漂亮国已不得不重新审视并调整策略。 近日
, 清华大学基于存算一体计算范式, 研制出全球首颗全系统集成的、 支持高效片上学习( 机器学习能在硬件端直接完成) 的忆阻器存算一体芯片, 在支持片上学习的忆阻器存算一体芯片领域取得重大突破, 有望促进人工智能、 自动驾驶可穿戴设备等领域发展。 相关成果在线发表于最新一期的《 科学》。 存算一体芯片 , 尽管这个词不算新鲜, 而且多个头部厂商已经入局, 但这次成果是直接发表在《 科学》 正刊, 正常来讲, 机器学习相关的内容发布在《 Science》 会是出圈的成果, 至少可以用“ 很厉害” 来形容。三星和SK海力士恢复供应半导体设备
, 肯定是利好。 从链条上看, 设备端是半导体产业链国产化“ 卡脖子” 的关键环节, 放开可以给国产设备商国产替代予更加充分的准备时间。 二,存算一体架构,根源上解决能效墙和存储墙问题 存算一体对应的是传统的冯诺依曼架构
, 也就是现有我们电脑使用的CPU架构, 如图, 存储器和处理器分别完成计算和存储功能, 随着计算需求的几何级别增长, 存储器和处理器之前性能的剪刀差会越来越大, 形成低效的“ 存储墙” 问题, 中间搬运的时间往往是计算时间的上百倍。 而存算一体是对应传统CPU架构的新架构
, 核心理念是将计算和存储放在一起, 存算一体一般指存内计算( CIM) , 实际上有三种: 近存计算( PNM) , 存内处理( PIM) , 存内计算( CIM) 。 现在上马存算一体的大厂的产品和项目大多都是近存计算
, 提高了效率, 但也没有从根源上解决能效墙和存储墙问题。 清华研发的
, 具体来说, 是用交叉阵列的方式做忆阻器, 获得一种与矩阵很类似的结构, 这种结构既可以存数据, 也可以做计算。 需要存储时, 忆阻器本身就是存储器; 而需要运算时, 也无需把数据从存储器中搬到运算器里, 因为忆阻器可直接用欧姆定律来做乘法运算。 也就是说实现原位计算
, 是真正意义的存算一体。 能效与效率都会是指数级提升突破。 三,盘点目前市场上的存算一体技术路径
存算一体技术的底层特征包括减少数据搬运,降低能耗至十分之一到百分之一,实现存储单元具备计算能力,等效于在面积不变的情况下规模化增加计算核心数或提升工艺代,以及单个存算单元替代计算逻辑和寄存器更小更快。
这些底层特征共同实现了存算一体技术的优势,使其成为极具潜力的新型计算架构。
虽然学术界和产业界尚未就存算一体技术的分类达成共识,但目前已经发展出多种技术路径,包括近内存计算(NMC)、存储级内存(SCM)、近存储计算(NSC)和存内计算(IMC)等。这些技术路径各有特点,适用于不同的应用场景。
目前,Flash、SRAM、DRAM等成熟的存储介质已经被广泛用于存算一体技术,同时ReRAM、MRAM等新型存储介质也在不断发展。
NorFlash是一种非易失性存储介质,但其在工艺制程上存在明显瓶颈,因此适用于小规模的数据存储。
DRAM的成本低、容量大,但速度较慢,需要不断刷新以保持数据存储。
SRAM在速度和能效比方面具有优势,特别是在存内逻辑技术发展起来之后具有高能效和高精度的特点。
HBM(高带宽内存)方案是近存计算的典型技术,可以解决存算分离导致的“存储墙”问题,包括存储单元的带宽问题和存储单元与计算单元之间键数据传输的能效问题。HBM方案中存储Die的垂直堆叠也增大了容量,因此HBM技术完美契合当前GPU对更多内存和更高带宽的刚性需求。
HBM结构:
2016年,来自美国加州大学的研究团队提出了使用RRAM构建存算一体架构的深度学习神经网络(PRIME)。相较于传统的冯诺伊曼架构方案,PRIME可以实现约20倍的功耗降低和约50倍的速度提升。
但是,虽然RRAM具有高速和结构简单的优点,但其距离工艺成熟还需要2-5年,且材料稳定性有待提高。
长期来看,RRAM仍然有望成为未来发展最快的新型存储器,并成为下一代主流研究方向。
四,存算一体市场格局梳理
存算一体技术起源于国外
, 其产业化进程比国内要早3-5年左右。 由于存算一体技术的配套工具尚处于探索阶段, 缺乏成熟的配套工具, 因此基于存算一体技术的产品在短期内( 5年左右) 主要以小规模量产为主。 从存算一体发展历程来看
, 自2017年起, 英伟达、 微软、 三星等大厂提出了存算一体原型, 同年国内存算一体芯片企业开始涌现。 大厂对存算一体架构的需求是实用且落地快
, 而作为最接近工程落地的技术, 近存计算成为大厂们的首选。 诸如特斯拉、 三星、 阿里巴巴等拥有丰富生态的大厂以及英特尔、 IBM等传统芯片大厂都在布局近存计算。 从方案落地情况来看
, 英特尔选择了基于SRAM的可配置存储器, 而三星则选择在DRAM的DRISA架构上进行存算一体解决方案。 国内初创企业则聚焦于无需考虑先进制程技术的存内计算
。 其中, 知存科技、 亿铸科技、 智芯科、 九天睿芯等初创公司都在押注“ 存” 与“ 算” 更亲密的存算一体技术路线。 亿铸科技
、 千芯科技、 阿里达摩院等专注于大模型计算、 自动驾驶等AI大算力场景; 闪易、 新忆科技、 苹芯科技、 知存科技等则专注于物联网、 可穿戴设备、 智能家居等边缘小算力场景。 此外
, 包括恒烁股份、 杭州柯林、 中科微至、 润欣科技和罗普特等在介质和技术上具备先发优势。五,存算一体概念股一览:
1
算力核心概念:, 1) 海光信息
, 市值1897.8亿, 2023股价大涨103.51%, 国际上少数几家全面系统掌握了通用型智能芯片及其基础系统软件研发和产品化核心技术的企业之一2) 寒武纪-U
, 市值903.8亿, 2023股价大涨313.31%, 中国最具代表性的本土AI芯片厂商3) 景嘉微
, 市值579.4亿, 2023股价大涨133.28%, 国产GPU龙头企业, 新一代JM9系列有望打开商用市场4) 浪潮信息
, 市值558.8亿, 2023股价大涨77.42%, 浪潮信息是全球领先的新型IT基础架构产品、 方案及服务提供商5) 龙芯中科
, 市值613.5亿, 2023股价大涨79.05%, 2K2000系列集成自主GPU6) 神州数码
, 市值209.1亿, 2023股价大涨42.43%, 开创性的提出“ 数云融合” 战略和技术体系框架, 着力在云原生、 数字原生、 数云融合关键技术和信创产业上架构产品和服务能力7) 首都在线
, 市值89.5亿, 2023股价大涨97.02%, 8) 拓息
, 市值187.9亿, 2023股价大涨125.64%, 领先的软硬一体化解决方案提供商9) 中科曙光
, 市值586.8亿, 2023股价大涨81.03%, 国内高性能计算领域领军企业, 亚洲第一大高性能计算机厂商2
存储模组概念, : 1) 佰维存储
, 市值324.0亿, 2023股价大涨368.87%, 专注于存储芯片研发与封测制造, 是国家高新技术企业, 国家级专精特新小巨人企业2) 德明利
, 市值65.0亿, 2023股价大涨52.85%, 积极布局人机交互触控领域完成初步业务并完成自研触摸控制芯片投片3) 江波龙
, 市值438.9亿, 2023股价大涨80.23%, 聚焦NAND Flash闪存应用和存储芯片定制、 存储软硬件开发, 处于国内存储器领先地位3
存储相关其他概念, : 1) 恒烁股份
, 市值49.3亿, 2023股价大涨57.06%, 致力于开发CiNOR存算一体终端推理AI芯片2) 同有科技
, 市值56.2亿, 2023股价大涨69.44%, 中国存储第一股, 同有科技是业界少数拥有超过百项自主知识产权的专业存储厂商, 也是国内完全拥有存储架构、 存储管理软件及存储核心算法的自主研发企业3) 易华录
, 市值304.1亿, 2023股价大涨123.76%, 易华录数据要素先行者, 旗下蓝光存储产品与“ 数据湖” 优势显著中科曙光
, 市值586.8亿, 2023股价大涨81.03%, 构建了完整的AI计算服务体系4
存储芯片概念, : 1) 北京君正
, 市值544.1亿, 2023股价大涨60.39%, "多年来在自主创新CPU技术、 视频编解码技术、 图像和声音信号处理技术、 SoC芯片技术、 软件平台技术等多个领域形成多项核心技术"2) 东芯股份
, 市值187.1亿, 2023股价大涨61.64%, 独立自主的知识产权, 努力打造中国领先的存储设计企业3) 聚辰股份
, 市值131.8亿, 2023股价大涨7.72%, 体长期致力于为客户提供存储、 模拟和混合信号集成电路产品并提供应用解决方案和技术支持服务4) 澜起科技
, 市值866.8亿, 2023股价大涨21.88%, 业界领先的集成电路设计公司, 澜起股份为全球仅有的3家内存接口芯片供应商之一5) 普冉股份
, 市值95.9亿, 2023股价大涨24.46%, 国内低功耗SPI NOR Flash存储墙芯片和高可靠性IIC EEPROM存储器芯片NOR Flash和EEPROM的主要供应商之一6) 兆易创新
, 市值924.5亿, 2023股价大涨35.26%, 作为全球化芯片设计公司, 兆易创新致力于存储器、 控制器及周边产品的设计研发。免责申明:这是个人操作记录,仅供学习交流,不构成 投资建议,最终是否买卖自己定,盈亏自负!