管理
东吴计算机:龙芯用户大会纪要20191224
拙政江南 / 2019-12-26 18:53 发布
王紫敬2019.12.26
内容整理自公开会议龙芯用户大会上发表的主题演讲
信创研究请联系东吴计算机:郝彪/王紫敬 18510169296
要点:
1.【龙芯新产品】2月24日,龙芯中科技术有限公司发布了龙芯新一代通用CPU产品3A4000/3B4000,运用28nm工艺,性能得到成倍提升。 3A4000通用处理性能与AMD公司28nm工艺最后产品“挖掘机”处理器相当。在此基础上,龙芯公司将于明后年推出使用12nm工艺的四核3A5000和16核3C5000,其主频将提高到2.5GHz以上,通用处理性能将达到当时AMD的水平。
2.【卫士通】龙芯3A4000/3B4000在片内集成了安全机制,实现自主可控和安全可靠的统一。通过卫士通自主研发的高性能嵌入式安全SE,将安全可信能力融入龙芯处理器芯片设计,与传统CPU只是在处理器核外增加安全可信模块相比更安全。在市场推广方面,商业的大众市场由龙芯主推,而对安全需求较高的客户,由卫士通主导并通过定制化实现“安全赋能”。此外,卫士通也基于龙芯开发了安全整机、安全中间件以及各类安全应用。
3.【芯片差距】我国CPU与国外CPU的主要差距在于通用处理性能,而不是专用处理性能;在于单核性能不足,而不是核数不够多;在于设计能力不足,而不是工艺不够先进。因此,龙芯中科公司一直致力于通过优化设计提高单核通用处理性能,直到3A4000完成设计能力“补课”。目前发布的产品在工艺上不够先进,功耗偏大,同时DDR4内存频率不够高。
4.【第三套生态体系才是根本出路】应用不够丰富和产业不配套成为自主CPU和OS发展的下一个瓶颈。过去我国的信息化应用主要构建在国外Wintel和AA(ARM+Android)等体系上,在CPU、GPU、网络等的产业链配套不足。因此,未来CPU与应用软硬件企业应该相向而行。
我国信息产业的根本出路在于建立独立于Wintel和ARM+Android体系外的第三套生态体系。为此,龙芯提供开源的基础版操作系统支持下游的操作系统企业、整机设备企业、解决方案企业推出产品版操作系统。
龙芯的合作伙伴已经增至近千家,下游基于龙芯的开发人员达到数万人,在政企、安全、金融、能源、交通、教育等各个应用场景中都有了应用。会议当天,包括联想、中科曙光、浪潮、同方、超越数控等产业链下游也发布了基于龙芯芯片的桌面计算机、笔记本、一体机、服务器、云终端、网络安全设备、工业控制计算机等产品。
5. 【推广路径和商业模式】龙芯的打法是以党政为根据地,向民用市场拓展。按“农村包围城市”的做法,先从中小企业入手,再和一些高校合作,建立试点。 优秀的生态有三个重要特点:一是开放,越开放合作伙伴越多,产业生态力量越大,Google和ARM做得最好;二是兼容,越兼容越容易形成合力,产业生态不易碎片化,Intel和微软做得最好;三是优化,以用户体验为中心,通过软硬件紧密结合进行优化,苹果做得最好。
经过多年探索,龙芯形成了“Intel+ Google+ Apple”的商业与技术模式。一是学 Intel商业上形成CPU、OS、ODM核心并向外辐射,技术上做好 Outside规范,保持结构的兼容和稳定,实现操作系统级二进制兼容。二是学 Google“做OS但不卖OS”,谷歌研制 Android但不卖 Android操作系统,而小米的米OS和华为的麒麟OS均基于 Google的 Android;龙芯研制 Loongnix形成龙芯CPU的基础版操作系统并免费开放给合作伙伴,支持合作伙伴推出发行版操作系统产品。三是学 Apple以用户体验为中心从全系统角度进行优化,把细节做精。
6.【发展成果】2019年龙芯芯片出货量已经达到50万颗以上。这在国产化应用中市场份额遥遥领先。
原文纪要:
新产品的三大特点
相同工艺性能(28nm)成倍提高。龙芯3A4000/3B4000使用与上一代产品3A3000/3B3000相同的28nm工艺,通过设计优化成倍提升性能。3A4000/3B4000使用龙芯公司最新研制的新一代处理器核GS464V,主频1.8GHz-2.0GHz,SPEC CPU2006定点和浮点单核分值均超过20分,是上一代产品的两倍以上。通过优化功耗管理,基于龙芯3A4000的笔记本工作时间比上一代产品延长一倍以上。通过CPU直连形成的3B4000四路服务器综合性能是上一代产品3B3000双路服务器的四倍以上,虚拟机效率也从上一代产品的85%以上提高到95%以上。
片内安全机制。龙芯3A4000/3B4000在片内集成了安全机制,实现自主可控和安全可靠的统一。龙芯3A4000/3B4000能够从机制上有效防范Meltdown和Spectre等漏洞,支持MD5、AES、SHA等加解密算法,支持专用安全可信模块及国密算法,支持“影子栈”等访问控制机制。传统的CPU安全机制只是在处理器核外增加安全可信模块,龙芯3A4000/3B4000专门在处理器核内设计了安全控制机制,从而达到本质安全。,3A4000/3B4000还存在一些问题,例如DDR4内存频率不够高,功耗偏大,但这也是龙芯进一步改进的动力。
坚持自主可控。龙芯3A4000/3B4000一如既往地强调自主研发。芯片中的所有功能模块,包括CPU核心、片内互联总线、DDR4内存控制器及各种IO接口模块等的所有源代码均自主设计。芯片中所有定制模块,包括多端口寄存器堆、锁相环、DDR4 PHY、高速IO接口PHY等版图均自主研发。除了流片厂家提供的基本设计环境,龙芯3A4000/3B4000没有使用任何第三方IP。
龙芯研发历程
自主CPU与国外先进水平主要差距。龙芯团队自2010年从中科院计算所转型成立企业以后,发现原来学术界认可的“世界先进水平”与用户需求差距很大。通过在市场中试错,龙芯团队认识到我国CPU与国外CPU的主要差距一是通用处理性能不足,而不是专用处理性能不足;二是单核性能不足,而不是核数不够多;三是设计能力不足,而不是工艺不够先进。因此,龙芯中科公司一直致力于通过优化设计提高单核通用处理性能,直到3A4000完成设计能力“补课”。 3A4000通用处理性能与AMD公司28nm工艺最后产品“挖掘机”处理器相当。在此基础上,龙芯公司将于明后年推出使用12nm工艺的四核3A5000和16核3C5000,其主频将提高到2.5GHz以上,通用处理性能将达到当时AMD的水平,标志着龙芯经过20年的努力,通用处理性能达到产品级的世界先进水平。
信息产业的生态“三层楼”。世界上做CPU的企业中,凡是不做生态或者跟生态的CPU企业都活不好。Intel是一个做生态的企业,佛教《百喻经》中有一个“三重楼喻”,在信息产业技术也有“三重楼喻”,第一层是CPU技术+操作系统技术,即通用CPU;第二层是网络技术+图形/媒体技术,即GPU,Intel的通用打败思科的专用,片内集成GPU摆脱对英伟达的依赖;第三层是AI技术+虚拟化技术,如NPU。在芯片内部结构复杂度上,如果CPU的微结构复杂度是1,GPU的复杂度为0.3-0.5,神经网络处理器NPU的复杂度则小于0.1。
龙芯的三层楼要一层层盖。经过20年的发展,到2020年自主CPU和OS基本完成“补课”,CPU通用处理性能已达到AMD水平,OS成熟度也已接近Windows XP。但应用不够丰富和产业不配套成为自主CPU和OS发展的下一个瓶颈,过去我国的信息化应用主要构建在国外Wintel和AA等平台上,在CPU、GPU、网络等的产业链配套不足。因此未来CPU与应用软硬件企业应该相向而行,龙芯将不断完善基础软件环境(如NET等)和配套芯片(如GU、电源时钟芯片),信息化应用软件企业应把 Windows上的应用软件往Linux平台上迁移。
国产CPU应“不怕远征难”。纵观历史,高复杂系统能力建设需要以30年为周期,例如“运十”1996年拆解,“C919”2017年首飞。那么有没有办法避免上述耗时的多轮试错,一步就上楼?对此,龙芯进行了各种尝试:造不如买,市场换技术、研不如买、弯道超车。事实证明,这些都不是根本的解决办法。正所谓不同产品需要不同周期,CPU就是个孩子,千万不能指望2~3年把他养好。在核心技术产业“爬楼梯”的过程中,必须要有愚公移山的精神和实事求是的作风,不要幻想弯道超车,建立自主IT产业体系需要30年的努力,目前龙芯已发展19年,正呈现加速发展态势。
走“市场带技术”的道路。胡伟武介绍到,改革开放以来,我国发展核心技术形成了以“市场换技术”和“市场带技术”为主要特点的两条道路。所谓市场换技术,就是通过合资等方式把中国市场给予国外企业,希望在合资过程中得到先进技术;我国汽车产业是“市场换技术”道路的典型代表,事实证明,走这条道路在发展核心技术方面没有取得预期的效果。境外主要CPU企业均通过合资或授权方式成为“自主CPU”,要强调自主CPU需“融入”已有生态。所谓“市场带技术”,就是充分发挥我国体制优势和市场优势,通过体制内市场引导,形成技术能力,带动技术进步,再参与体制外市场竞争;我国航天产业是“市场带技术”道路的典型代表。事实证明,走“市场带技术”道路更有利于我国发展和掌握核心技术。龙芯走的正是市场带技术的道路,龙芯CPU通过自主编写CPU源代码,并在应用中不断演进,强调自主CPU要建立自主生态(独立于 intel体系和AA体系)。要同台竞技需先通过楼梯“上台”,一步楼梯就是一次在市场应用中试错,不断的试错,才能促使性能的提高和生态的完善。龙芯OS在试错中不断趋于成熟:第一功能丰富,在主要的功能软件和大量的IO驱动上功能更加丰富;第二架构稳定,实现了操作系统对不同主板及升级后的CPU二进制兼容,涉及CPU、桥片、BIOS、OS的大量细节更加规范化;第三性能优化,性能成倍提高,从被动优化逐渐到主动优化,另外打造技术链,在每个局部都不如国外的情况相爱啊,整体性能优于国外系统;第四问题收敛,应用现场问题追溯到CPU和OS的越来越少,成熟度更接近Windows XP的水平。走“市场带技术”的道路,通过自主研发掌握CPU的核心技术,建立自主可控的信息技术体系,我们失去的只有锁链,得到的将是整个世界。走“市场换技术”的道路,通过引进技术发展自主CPU产品,只是将一副锁链换成另外一副锁链。
3.龙芯生态
建立第三套生态体系。我国信息产业的根本出路在于建立独立于Wintel和ARM+Android体系外的第三套生态体系。为此,龙芯提供开源的基础版操作系统支持下游的操作系统企业、整机设备企业、解决方案企业推出产品版操作系统。龙芯通过基础版操作系统统一系统架构,实现操作系统跨主板兼容和CPU代际兼容,实现应用在不同整机平台的兼容。本次发布会龙芯中科发布了统一系统架构的标准规范体系,并通过与OEM/ODM厂商签署认证协议建立产品认证体系。从龙芯3A4000/3B4000起,龙芯CPU和主板升级均不影响操作系统及应用的兼容性。在民用市场,服务器、PC市场的CPU早已是Intel、AMD的天下,Intel更是建立起涵盖知识产权、技术积累、规模成本、软件生态于一体的整个商业模式壁垒,而且“这种壁垒从未衰退”。在中科院自动化所研究员林啸看来,这样的生态搭建困难重重。对于生态问题最直观的理解是,在芯片领域投入1人,则在芯片上开发的底层固件需要6个人,底层固件上做对应操作系统和生态开发,则需要36人。
龙芯操作系统的“三条线、两个面”。龙芯的“初心”是打造独立于Wintel和AA (ARM+Android)的第三大生态体系。优秀的生态有三个重要特点:一是开放,越开放合作伙伴越多,产业生态力量越大,Google和ARM做得最好;二是兼容,越兼容越容易形成合力,产业生态不易碎片化,Intel和微软做得最好;三是优化,以用户体验为中心,通过软硬件紧密结合进行优化,苹果做得最好。经过多年探索,龙芯形成了“Intel+ Google+ Apple”的商业与技术模式。一是学 Intel商业上形成CPU、OS、ODM核心并向外辐射,技术上做好 Outside规范,保持结构的兼容和稳定,实现操作系统级二进制兼容。二是学 Google“做OS但不卖OS”,谷歌研制 Android但不卖 Android操作系统,而小米的米OS和华为的麒麟OS均基于 Google的 Android;龙芯研制 Loongnix形成龙芯CPU的基础版操作系统并免费开放给合作伙伴,支持合作伙伴推出发行版操作系统产品。三是学 Apple以用户体验为中心从全系统角度进行优化,把细节做精。龙芯操作系统的“三条线”包括:Loongnix面向通用信息化系统,基于通用Linux平台进行完善和优化,为统一操作系统龙芯版提供支持;LoongOS面向高可靠实时终端,基于Linux/RT-Linux构建简洁高效的OS,没有Xserver的图形系统;LoongWorks面向实时嵌入式应用,针对历史应用,基于VxWorks内核,完善图形、网络等API,把VxWorks从“DOS”阶段升级到Windows阶段。龙芯操作系统的“两个面”指的是在“三条线”的基础上,通过统一系统架构实现操作系统跨硬件的二进制兼容,完善API实现应用的二进制兼容及优化。一是面向硬件,对不同主板实现二进制兼容,ARM系统做不到OS的二进制兼容,其设计OS、BIOS、桥片等多方面规范,ARM只能管住CPU核及AMBA总线,Intel能管住UEFI、PCI软件协议等;二是面向应用,对不同应用实现二进制兼容,API是OS的指令系统,也是建立生态的必争之地,我国用JS和Java编程的工程师数以百万计,但会写JS和java虚拟机的不到百人,再加上开源软件的不兼容性,使得浏览器升级就会导致应用的不兼容。龙芯通过基础版操作系统管住这“两个面”。
统一架构。龙芯中科发布了统一系统架构的标准规范体系,并通过与OEM/ODM厂商签署认证协议建立产品认证体系。从龙芯3A4000/3B4000起,龙芯的参考设计全面支持统一系统架构,CPU和主板升级均不影响操作系统及应用的兼容性。通过统一系统架构保持操作系统跨硬件平台的进制兼容可以大幅提高系统开发的效率。在 Wintel的平台上,不管是谁做的主板,一套 Windows操作系统都能装。不管是多新的CPU,十年前的 Windows XP还能装。通过指令系统兼容可以实现应用程序的二进制兼容,但要实现操作系统的二进制兼容则需要从包括CPU、桥片、BIOS、操作系统等全系统的角度进行规范并保持长期兼容。在统一系统架构的总要求下,实现了主板、固件、内核层面的兼容,并支持ACPI的UEFI固件,把硬件细节抽象为OS对地址空间的访问,通过ACPI表向OS提供启动配置/运行时配置和以OS为主导的电源管理。除此之外,还有检测工具集合认证协议。
走“市场带技术” 的道路。通过自主研发掌握CPU的核心技术,建立自主可控的信息技术体系,我们失去的只有锁链,得到的将是整个世界;走“市场换技术”的道路,通过引进技术发展自主CPU产品,只是将一副锁链换成另外一副锁链。龙芯的打法是以党政为根据地,向民用市场拓展。按“农村包围城市”的做法,先从中小企业入手,再和一些高校合作,建立试点。没有什么比为人民做龙芯,为国家和民族建设自主创新的信息产业体系更艰苦和更有意义的事业了。自主创新的信息技术体系和产业生态是实现中华民族伟大复兴“”的重要组成部分。龙芯与合作伙伴一起,生逢其时、使命在肩,将为建立自主创新的信息技术体系和产业生态而努力奋斗!
4. 龙芯合作现状
打造从端到云真正开放的全产业链生态体系。龙芯中科副总裁张戈表示,随着相关市场需求的不断拉动,龙芯的合作伙伴已经增至近千家,下游基于龙芯的开发人员达到数万人,龙芯在政企、安全、金融、能源、交通、教育等各个应用场景中都有了诸多广泛的应用,2019年龙芯芯片出货量已经达到50万颗以上。这在国产化应用中市场份额遥遥领先。龙芯集团希望联合众多的产业伙伴,来共建一个开放、共赢、共生的产业生态。龙芯会尽自己的所能,为合作伙伴提供最好的提升和服务。龙芯在具体领域的细分的方案包括如下几个。首先是桌面,这是龙芯最有优势的一面。随着3A4000企业产品的推出,国内一线的所有的品牌,都基于3A4000处理器推出了不同的计算机产品,包括台式机,一体机,笔记本云终端、网络安全设备、工业控制计算机等。这些产品有两个非常明显的改进,第一是性能的提升,龙芯的CPU要的不是高频低能,要的是真正10分的水平。第二是产品品质的提升,本次发布会发布的产品,在品质、形态、外观到质量,各个方面都能很大的弹性,所以希望未来龙芯的桌面产品能够真正的对标商业领域,被越来愈多的客户接受。当然,龙芯的用户体验还有很大的提升来自操作系统,最近在国家有关的组织下,产业界也都在希望达到一个统一的操作系统的平台。目前,文字处理、输入法、互联网应用、安全防护、工具软件、专业软件都已经完成了对平台的支持。一夜之间,互联网的主流的软件网站上都可以下载龙芯版本。外设的支持是龙芯生态的重点和难点,但我们也能看到近两年来的最大的一个进步。首先在外设的种类方面,除了打印机、扫描仪以外,龙芯已经对十多种设备进行支持,比如常见的接口类的和非接口类的扫码枪等。另外一个方面,也发现这些外设本身也是需要国产芯片的支持,也可以进行相应的替代,把他们改造成一个真正的国产化的产品。在服务器方面,主要进行了以下大幅度的改进。首先龙芯服务器加强了对高端多路的支持,包括双路、四路全相连结构,尤其是在多路的大片共连方面,龙芯3B比上一代提高了55%以上。高效云化,虚拟机效率提升至95%以上。高速互连,跨片访存带宽提升至400%以上。存算均衡,内存数量线性扩展,高吞吐率。在云生态方面,龙芯已经支持了包括Docker容器以及KVM虚拟机两种的云平台方案。其中今年四月发布的KVM虚拟机标志着国内技术团队首次完成“从CPU到系统”全链条虚拟机产品自主研制。在案例方面,龙芯已经建立云平台实际案例超过20个,最大案例包括259台龙芯服务器,用户数超过5万。在面向于行业方面的一体机,龙芯联合了南天信息、融威众邦、东软集团推出的面向于金融、医疗、政府等行业的终端设备,仁和诚信推出的基于CPU的智能化运维监控一体机。此外,还有红象的大数据一体机、中科安成和航天开元的智能文件交换柜、互盟光储存一体机等。另外还有一些专业的应用,比如用友网络的财务管理系统,高德数据的评估违约系统以及党建系统等等。
与各行业的合作。在人工智能与大数据应用领域,与天数合作打造的基于核心CPU平台的人工智能的深度神经网络和实时物体检测,与四方伟业合作打造的大数据分析平台,解决方案方面与奥斯睿图打造的智能机器人,此外还有哲林人证比对系统。在视频、安防与会议系统方面,合作的有中电兴发的视频监测系统,航天龙梦会议系统,中标慧安全国产视频监控系统。与政府合作方面,政企办公信息化应用已覆盖全国各省市及100多个部委与行业,典型的办公应用已经涵盖了如电子文件、档案管理、政府门户、邮件系统、机关事务、绩效管理等。目前通过对相关的产业链进行的合作并且借助于龙芯以及建立的各个区域的深层次的平台,我们正在建立一个覆盖全国的技术与服务体系,为后续整体的产业推进进行强有力的支撑。在金融领域的合作,我们分为金融机具、办公系统和业务系统。在金融机具方面,龙芯凭借系列化多样化的优势目前已经和南天信息,兆维,国光等一线的厂商进行合作。在办公系统方面,基于龙芯的系统方案稳定可靠,已经在多家银行陆续使用。在核心业务等方面,我们已经和神州数码公司,常亮等核心厂商进行合作。在交通方面,交通的环境检测系统以及城市的智能检测系统都有这比较成熟的案例,在多个省市得到了批量的应用。在能源与电信领域,龙芯系列CPU已广泛应用多种应用场景。基于龙芯处理器的数据采集、控制系统、网关单元等,实现能源领域控制系统的硬件国产。基于龙芯DCS/PLC设备可替代国外领先设备。在教育领域,推出了龙芯高教计划,提出加强计算机系的学生从使用计算机到会造计算机的转变,因此,龙芯提出了龙芯高校开源计划2.0,免费向高校的师生开放了部分CPU的代码,每年还举办龙芯杯全国大学生系统能力培养大赛等一系列的领域。在安全应用方面,龙芯的高质量等级芯片销售超过10万颗。以北斗卫星为例,自2015年三月份搭载龙芯的北斗导航卫星首次升空以来,运行至今没有出现一次可记录的单粒子翻转事件。另外,龙芯也越来越重视生态培训与适配体系的工作,近年来,在面向开发者方面,龙芯公司率先提出了应用迁移培训理念,从2018年至今,龙芯开设的培训班已经达到四届,直接的培训学员达到1000人以上。在面向用户人员方面,龙芯公司首创了全省地市巡回培训模式,目前已经在山西省开始了巡回培训。为了更好的支撑龙芯在应用的工作,目前龙芯已经搭建全国连通的一体化云平台,为产业链开发商提供远程虚拟机账号200台以上龙芯服务器,打破地域限制,显著缩短适配时间。
龙芯的重要合作伙伴在发布会上发布了数十款基于龙芯平台的最新产品。包括联想、中科曙光、浪潮信息、同方、超越数控、方正、海尔、宝德、华胜信息、升腾资讯、安恒信息、中国网安卫士通、渔翁信息、中国运载火箭技术研究院、北方自动控制技术研究所、北京计算技术及应用研究所、西安微电子技术研究所、北京计算机与电子应用技术研究所、江苏自动化研究所、华东计算技术研究所在内的合作伙伴发布了基于龙芯3A4000/3B4000的桌面计算机、笔记本、一体机、服务器、云终端、网络安全设备、工业控制计算机等产品。此外,龙芯的上百家合作伙伴还展出了数百款基于龙芯芯片的解决方案,互动体验区给现场体验者带来了极佳的使用体验。