水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

柴孝伟

买进就值,越来越值,时享价...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

英大首席


桂浩明

申万证券研究所首席分析师


宋清辉

著名经济学家宋清辉官方账号...


banner

banner

国产大数据软件领航员,星环科技:自主迭代,持续构建市场壁垒

老范说评   / 2022-12-14 10:33 发布

01国产大数据软件领航员

1.1.坚持自主研发的大数据基础软件开发商

国内领先的企业级大数据基础软件开发商。公司成立于2013年,围绕数据的集成、存储、治理、建模、分析、挖掘和流通等数据全生命周期提供基础软件与服务。

成立之初,公司团队在客户实例环境中看到开源组件在产品、功能、性能上的不足,又鉴于国外的开源组件的开发还是依据十几年前的硬件架构,且开发思路不统一,因此确立自己自主研发的道路和思路。

2013年11月,公司发布第一个产品TDH 2.0。2022年10月,公司在科创板挂牌上市,成为首家登陆A股的大数据基础软件企业。目前公司的产品已经应用于金融、政府、能源、电信等七个涉及国家命脉的重要领域。

image.png


目前公司主要业务分为:

大数据基础软件业务

基础软件产品:公司基础软件产品包括三类,分别为大数据与云基础平台软件(TDH和TDC)、分布式关系型数据库(ArgoDB和KunDB)、数据开发与智能分析工具(TDS和Sophon)。公司基础软件产品主要以软件产品授权的方式交付,也可以软硬一体产品形式交付,并根据项目需求提供配套服务。2021年基础软件产品实现收入2亿元。

技术服务:由于大数据基础软件专业性较强且对于整个信息系统的重要性较高,需要提供技术服务支持。主要服务包括安装部署、维保服务、产品升级、数据备份、迁移服务等。2021年实现收入0.64亿元。

应用与解决方案:为了协助用户理解大数据信息系统的使用功效及搭建相关大数据应用,针对一些特定应用场景,公司提供大数据存储、治理以及分析相关的咨询、定制开发等服务的解决方案,为用户如何运用大数据构建相关信息系统提供专业的建议和支持。2021年实现收入0.54亿元。

image.png


1.2.高壁垒产品有望带来业绩持续快速增长与经营质量提升

受益数字经济与国产化,收入快速增长。

2019-2021,公司复合增长率37.8%,2022年前三季度营业收入1.71亿元,同比增长24.8%。由于初期营业收入规模较小,同时前期增加研发、销售等费用的支出,公司目前仍处于亏损状态,2019-2021年,公司归母净利润分别为-2.11亿元、-1.84亿元及-2.45亿元。

我们认为,在国家加快数字化基础设施建设的过程中,公司依托作为数字技术底层必不可少的大数据基础软件业务,随着前期市场、技术投入进入变现期,公司有望逐步实现盈利。

image.png


各项费用率趋于稳定,毛利率基本保持稳定。

公司目前处在成长期,为提升竞争力,市场推广、团队凝聚、技术研发方面投入力度较大。2019-2021,各项费用率总体呈下降趋势,2022年前三季度,销售与管理费用率亦分别同比下降17.2pct和17.5pct,规模效益逐步显现。

毛利率方面,2019-2021年公司软件产品与技术服务毛利率由64.35%逐年提升至71.83%,主要受益于产品与服务标准化程度提升。综合毛利率呈下滑趋势,主要是由于低毛利率的应用与解决方案收入占比提升所致。

image.png


收现比高于100%,合同负债显著增长,彰显产品规模化复制能力。

公司历年来收现比持续高于100%,是公司产品标准化能力与对集成商议价能力的体现。截止2022年9月底,公司合同负债达0.52亿元,环比6月末增加500万元,相比年初增加200万元。

我们认为,随着公司大数据底层平台客户覆盖不断扩大,以其为基础的产品增购不仅体现在表观利润表的增长,同时也将不断优化其现金流数据。

image.png


1.3.股权结构稳定,高管团队技术背景深厚

公司股权结构稳定,高管团队拥有丰富技术与管理经验。

截至2022年9月30日,公司实际控制人为孙元浩,直接持股星环科技比例为9.24%,并与上海赞星投资中心(有限合伙)、范磊为一致行动人,其中上海赞星投资中心(有限合伙)为孙元浩担任执行事务合伙人的有限合伙企业。

公司包括孙元浩在内的多位高管曾担任Intel、Nvidia等企业中高层或工程师岗位,拥有丰富的底层软硬件、分布式计算、hadoop等技术开发与团队管理经验。

image.png


综合毛利率企稳回升,未来产品向高端化、规模化发展,毛利率有望进一步提振。

公司早期借助技术积累,低成本开发定制化产品,产品毛利率较高;2019年公司按照标准化原则进一步完善产品功能及性能指标,单品价值大幅提升,但由于研发成本分摊的影响,毛利率降至71.3%;2021年原材料成本上涨导致毛利率有所下滑,2022 Q1-Q3受益于拳头产品全部完成标准化并实现规模化销售,上游电子元器件价格下降,公司整体毛利率达65.4%,同比提升4.1pct。

费用率整体保持平稳,后续随公司规模增加,高端技术实现降维渗透,费用率有望下行。

公司销售费用率2018-2021年由13.0%降至8.8%,主要由于前期规模较小,高端产品需要直销推广,未来公司可发挥规模优势,销售费用率将进一步下降;管理费用率与研发费用率近年维持平稳,待公司高端频谱分析仪与矢量网络分析仪型号落地量产后,研发费用率有望进入下行通道。

02 大数据市场扩张,国产分布式数据库换道超车

2.1.市场规模:数据资源“4V”特征带来大数据市场快速扩张

随着互联网、物联网、5G等信息通信技术及产业的不断发展,传统产业正在经历数字化转型,全球数据量呈几何级增长态势,2017-2022年全球数据储量CAGR为23.2%。数据逐渐成为和土地、资本、劳动力、技术一样的生产要素,支撑数字经济的发展。

在大数据时代,数据明显表现为“4V”特征:

海量的数据规模(Volume):采集、存储和计算过程中所涉及数据量都非常大;

多样的数据类型(Variety):数据种类和来源多样化,包括结构化、半结构化和非结构化数据,多类型数据对处理能力提出了更高的要求;

价值密度低(Value):有价值数据所占比例低,需要结合业务逻辑并通过强大的机器算法来挖掘数据价值;

快速的数据流转(Velocity):数据增长速度快,处理速度要求快,时效性要求高。

大数据市场稳健增长,软件市场占比快速提升。

根据沙利文研究,2022年全球大数据市场规模预计为718亿美元,中国大数据市场占全球比例为22%(根据Wind数据,截至2022.10.31,中美平均汇率为6.65)。

2015-2022年受益于下游政企单位分析处理海量数据的需求扩张,全球大数据市场规模CAGR约为18%,中国约为26%,仍处于快速增长期。随着硬件成本的下降以及软件附加值的提升,预计软件将超过服务和硬件,成为大数据市场最主要的收入来源。

image.png


2.2.技术演进:数据库与互联网技术协同发展,大数据加速产业变革

数据的存储与共享需求催生了数据库与互联网,大数据技术加速产业变革与创新。

上世纪50年代,数据库与互联网尚处于基础技术积累阶段;至20世纪末,关系型数据库走向成熟,万维网诞生、搜索引擎普及,数据库与互联网应用由此建立连接;21世纪以来,二者发展相互促进,技术和产品趋于成熟和完善:互联网催生了图像、视频等大量非结构化数据传输需求,在大数据技术更迭背景下,NoSQL、NewSQL、云原生数据持续涌现,并反过来促进了云计算技术的发展,实现了多产业协同创新。

通过挖掘海量数据的深度价值,有利于提高政府、企业的决策、运行效率,提升危机应对能力和服务水平,推动社会智慧化、智能化转型。

大数据技术服务于数据源到用户的全产业链条,由硬件、软件与服务实现应用。大数据技术框架包括数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化。其中核心在于大数据管理平台、数据应用中间件、数据智能分析工具、大数据应用等软件。

数据库处于IT架构的核心,作为上层应用的支撑引擎并调动下层计算、网络、存储等基础资源。数据库是一个按数据结构来存储和管理数据的计算机软件系统,是能够合理保管数据的“仓库”,同时也是数据管理的新方法和技术。

数据库管理系统是数据库系统的核心组成部分,主要对数据库进行操作与管理,实现对象的创建、存储数据的查询、添加、修改与删除操作和用户管理、权限管理等。

中国数据库市场规模稳健增长,相比国外成熟市场,国内下游需求有待进一步挖掘。

根据中国信通院,预计2022年中国数据库市场规模达368亿元,未来三年CAGR为23%,维持高速扩张;2021年全球数据库市场规模约为700亿美元,中国市场为47亿美元,占比仅7%,国内数据库市场仍有较大扩容空间。

image.png


2.3.数据库发展趋势:短期多类型共存,长期向分布式架构、云端部署迈进

2.3.1集中式作为传统主流,分布式满足大数据时代增量需求

集中式数据库是传统主流架构,分布式架构逐步兴起。集中式数据库经过近40年的发展,基本实现全行业应用,成熟稳定性高;分布式数据库伴随大数据时代兴起,利用网络将分散的多个数据库连接起来,组成逻辑上统一的数据库,为业务应用提供完整的联机事务处理,具备无限线性扩展能力,逐步成为未来的趋势。

分布式架构更适用于大数据场景,满足新兴增量需求。

集中数据库可以利用位于系统中心的服务器统一管理所有的共享资源,积累了大量的实践经验,在强一致性、稳定性、迁移成本和运维管理方面有明显优势,保障了各资源独立、应用隔离以及数据安全。

分布式数据库在灵活性和扩展性方面具有优势,一方面企业各部门可根据其应用程序的特定需求选择软硬件,另一方面分布式IT架构天生自带可扩展属性,能够根据业务规模实现无限弹性扩展。

随着数据类型丰富、数据采集与处理需求持续高增,集中式数据库对海量、异构、多源数据的处理能力难以适应大数据的应用场景,未来分布式架构将逐步占领新兴增量市场。

2.3.2 关系型主导市场,非关系型作为有力补充

关系型数据库市场发展成熟,新兴非关系型可弥补其局限性。关系型数据库诞生于1970s,相比层次、网状数据库减少了数据冗余、降低了存储费用。

21世纪初,随着互联网和信息技术的发展,关系型数据库在大数据处理分析和读写性能方面的局限性逐渐凸显,而NoSQL数据库解决了关系型数据库只能垂直扩展(即在硬件方面增强)的限制,通过分库分表的方式实现水平扩展,满足不断扩张的业务,以及NewSQL数据库在底层解决了分布式问题,并满足ACID(原子性Atomicity、一致性Consistency、隔离性Isolation、持久性Durability)事务要求,二者对传统关系型数据库形成有力补充。

多模数据库是近年发展的新兴技术,可在多个模型中存储和查询数据,为异构数据处理提供了解决方案,有望成为未来的发展趋势。

2.3.3 由本地部署转向云端部署,云原生让企业轻装上阵

“上云用云”降低企业前期建设与运维成本,数据库云端部署是大势所趋。

云数据库是在云计算背景下发展起来的一种新兴的共享基础架构的方法,极大地增强了数据库的存储能力,消除了人员、硬件、软件的重复配置,便于软、硬件升级迭代,在成本、可用性、易用性、扩展性和并行处理方面较传统数据库有绝对优势。

现阶段云数据库主要包括两种:一种是托管在云厂商上的“传统”数据库,例如阿里云、腾讯云上的MySQL、PostgreSQL、MongoDB、Redis等;一种是基于云环境的云原生数据库,例如AWS的Aurora、阿里云的Lindorm和PolarDB、星环的数据云平台TDC等。

企业深化数字化转型,数据使用进一步深化和多元,多元混合数据库时代即将开启。

数据库技术目前已经从单一架构支持多类应用,演变为多类架构支持多类应用,架构之间并非替代,而是相互共存、共同发展的关系。

在多元混合数据库趋势下,为解决多种数据库、多云架构管理复杂的问题,实现跨数据库、跨云融合管理,提供DBPaaS和DBaaS能力的数据库云管平台应运而生。

2.4.产业推手:政策支持数字经济,大数据软件国产化东风已至

政策驱动数字技术与实体经济深度融合,“战略安全”是国产化重要推手。

“十四五”规划提出要充分发挥国内海量数据和丰富应用场景优势,促进数字技术与实体经济深度融合,赋能传统产业转型升级;《促进大数据发展行动纲要》指出,建立安全可信的大数据技术体系是推进大数据产业基础研究和核心技术攻关的重要目标,当前国内客户对数据与信息安全愈发重视,为国内大数据软件提供了发展土壤。

同时,随着国内基础软件人才增加,技术经验持续积累,目前已形成具备自主研发实力且能与国外厂商竞争的基础软件厂商,并实现一定规模的产业化落地。

2.5.竞争格局:国外龙头垄断成熟市场,国内企业在新兴市场换道超车

国外巨头起步领先占据关系型、集中式成熟市场,随着大数据技术发展,数据管理软件初创企业迎来新的发展空间。

数据处理需求的变化推动了数据管理软件技术的变革,自1970s以来,数据管理软件技术发展历程包括:关系型、集中式,非关系型、分布式,以及多模型、云原生,新需求开创新赛道,初创企业迎来发展新机遇。

image.png


国内数据库领域,Oracle、IBM等国外厂商凭借先发优势垄断市场。

根据赛迪顾问,2019年我国的数据库管理系统市场仍以Oracle、IBM、微软等国外品牌为主导。Oracle成立于1977年,2019年占据47.3%的国内市场份额,由于技术成熟稳定,下游客户对其粘性较强。国内企业基于对数据安全、稳定、低成本的要求,未来有望逐步从Oracle等海外数据库迁移至国产数据库。

随着数据量的快速积累以及非结构化数据类型增加,传统数据库难以解决大数据“4V”问题,国产厂商在大数据平台软件方面有了换道超车的机会。数据处理需求的变化推动了数据管理软件技术的变革,带动了以分布式技术为主的大数据管理平台软件快速发展,并在大数据场景中正逐渐替代传统数据库。

大数据管理平台国内公司综合能力不弱于国外,华为、阿里云、星环科技已成为行业领导者。根据IDC发布的《MarketScape:中国大数据管理平台厂商评估,2020》,通过评估公司关键战略(包含增长、研发速度、生产效率等)、关键能力维度评价(服务范围、客户服务交付等),综合能力排名市场前五的公司包括华为、阿里云、AWS、星环科技、Cloudera,国产厂商已具备弯道超车的实力。

2.6.他山之石:从Snowflake看云原生数据库发展

Snowflake数据云平台可连接全球业务,可满足动态和多样化的数据存

储与分析需求,并开启无缝的数据协作。Snowflake成立于2012年,提供“数据仓库”服务,即为企业提供基于云的数据存储和分析解决方案。Snowflake数据云平台作为一个完全托管的服务,具备加载、集成、分析和共享数据所需的性能、灵活性和可伸缩性。其架构专为无缝的跨云体验而设计,可自动化维护和管理数据仓库:

  • 系统自动更新,没有计划停机时间;

  • 跨云数据复制,实现无缝的全局数据访问;

  • 在数据云中获取并与客户、合作伙伴和供应商共享数据。

Snowflake混合模型架构在物理上实现了存算解耦,但在逻辑上实现了存算集成,同时提供安全和管理等服务。传统数据平台即便是经过改进,也不能充分解决现代数据问题或解决长期存在的可伸缩性问题。

Snowflake构建了一个全新的、现代的数据平台,专门用于云计算,且允许多个用户并发地共享实时数据,其混合模型架构分为三层:云服务层、计算层和数据存储层。云服务层无需管理即可优化每个用例的性能要求;计算层提供专用资源,使用户能够同时访问多个用例的通用数据集,而不会出现延迟;存储层接收海量和各种结构化和半结构化数据,以创建统一的数据记录。

image.png


凭借云原生数据库灵活高弹性、成本优势、可扩展性,Snowflake短期内实现客户的快速开拓,营收实现连续多年翻倍增长。

Snowflake云原生实现计算与存储分离,从而可以在两个层次上独立实现弹性和高可用能力,充分利用云资源并降低成本;提供SaaS能力,降低用户门槛,最小化维护成本;拓展对多类型数据的支持,在大数据时代为企业降本赋能。

2018-2021年Snowflake营业收入CAGR为129%,2022Q1-Q3营业收入增速为98%,基本维持翻倍增长,主要受益于云数据库的推广。

Snowflake经营稳健,财务指标持续向好。

公司软件产品前期研发成本摊销以及议价能力增强,毛利率由2018年的46%快速提升至2022Q1-Q3的65%;依靠“基于关键客户的精准营销(Account-Based Marketing,ABM)”持续攻克大客户,导致前期销售费用率较高,后续建立客户粘性后,费用率有望逐步下行;研发费用率基本趋于稳定,2022H1降至36%。

公司当前亏损的主要原因是年初客户预付费用,但公司尚未完全提供其产品服务,该收入将被计作递延收入被分期到未来的一年中。2021年经营活动现金流量净额转正,可知公司经营逐步向好,未来盈利可期。

03 自主迭代,性能赶超,持续构建市场壁垒

3.1.公司自主迭代能力强,产品持续丰富

自主程度持续提升。公司成立之初产品均基于Apache开源社区,且产品单一。此后经过持续不断的自主研发,2022年TDH第九代产品,已经基本实现核心代码自主编译,其中星环科技大数据平台TDH 1200万行代码里自研代码率超过70%,ArgoDB代码自主率(行数)超过90%,仅2021年新加入的键值数据库与事件存储库产品仍基本源于开源社区。

公司产品部分性能已经达到全球领先。

事务处理性能委员会(TPC)是制定商务应用基准程序(Benchmark)的标准规范、性能和价格度量,并管理测试结果发布的国际权威组织。

公司大数据基础平台TDH产品已按TPC要求,完成了测试,测试结果超过了TPC公布的同等级其他国外开源产品测试结果。

针对各项测试:

TPC-DS:性能指标QphDS代表每小时内执行完毕的结构化数据的统计、报表、联机查询等不同类型的查询数,以描述数据仓库的综合性能;

TPCx-HS:性能指标 HSph代表每小时内可以处理的数据规模,包含了数据生成、排序、验证等步骤,以描述大数据平台数据基础处理能力;

TPCx-BB:性能指标 BBQpm代表每分钟内执行的结构化数据查询及半结构化和非结构化数据机器学习算法数量,以描述大数据平台异构数据处理能力。

性价比指标:代表的含义为系统实现单位性能指标所需投入的资金数量。

image.png


产品功能丰富,灵活部署。

目前公司TDH9.0产品在基础操作系统与基础运行系统之上,共有11款标准化产品,客户可根据自身业务、处理数据类型等差异化需求进行选购,部署灵活性强。同时公司亦提供安全审计、监测的配套功能,使客户更便捷地管理。

我们认为,目前公司产品体系已初步完善,标准化且灵活精细的产品选购模式能平衡客户差异化需求与自身规模化复制需求,未来随着产品持续升级,公司业绩有望加速增长。

3.2.客户粘性高,已过市场教育期,持续构建市场壁垒

提供数据基座,充分解决客户数据痛点。当前以金融、政府为代表的企业历经多年IT建设,均有较高水平的信息化程度,但原有的系统互通性差,数据冗余,计算力差。

公司通过自身TDH产品体系,可为客户提供统一的大数据平台和管理体系,以某农商行项目为例,公司为其实现历史数据平滑迁移,系统计算效率、存储空间等综合效果提升14倍。

客户复购粘性高,有望实现裂变。

2019-2021年,公司老客户复购创收逐年提高,长期可持续增长能力强。同时客户数快速增加,从公司直销前五大客户来看,2019-2021年占收入比重逐年减少,且客户对象亦有变化。

我们认为,随着公司对老客户需求的理解不断加深,相关项目咨询与服务性的投入有望持续减少,从而提升公司盈利能力。同行业内老客户亦有推荐新客户的网络效应,在大数据应用场景不断增加与公司高客户粘性的背景下,公司客户基数有望高速增长。

image.png


随着产品力持续提升,人均创收提升空间广阔。

相比海外同类厂商150-200万元的人均创收相比,公司目前人均创收提升空间巨大,我们认为,随着公司产品不断完善,矩阵不断丰富,会带来更强的规模效应,以大数据操作系统与平台切入客户,形成粘性后,通过功能模块增购不断深度挖掘客户价值,不断打开成长天花板。

image.png


3.3.卡位核心信创发力赛道,高速成长可期

信创需求催化国产数据库加速成长。信创无论是对产业端还是需求端企业都是一个重要的契机。国产数据库厂商借助政策东风,有利于其拓展市场,将产品放到实际场景中打磨,不断更新迭代,实现自己技术实力真正的弯道超车;传统行业企业、政府等也可以借此契机,实现数字化转型和业务的创新发展。

image.png


以金融、政府为代表的信创行业数据库需求旺盛,未来有望加速增长。

根据赛迪顾问测算,2025年中国数据库市场规模有望达到600亿元,2021-2025年复合增速超28%。其中金融和政府在市场规模与增速方面领先,我们认为主要是数字化增量需求叠加国产化存量替代。

国产化产品获得标杆客户认可,有望乘风而上。公司坚持自主研发,产品对标海外顶尖同类产品,目前业务已经广泛渗透到金融、政府、能源、交通等信创关键行业,表明其产品性能获得认可,未来有望充分受益我国数据库行业数字化与国产化浪潮。

image.png


04 盈利预测与估值

软件产品及软件服务:主要以标准化产品输出,配套维保与少量定制化服务。大数据赛道正处于政企国产化与数字化双重需求共振期,赛道高景气确定性强,同时公司产品性能优越,客户粘性高,新客户拓展迅速,未来有望加速成长。综上所述,预计2022-2024年软件产品及软件服务收入增速分别为37.1%、40.4%、43.7%。

应用解决方案:预计2022-2024年收入增速分别为50%、45%、40%。

软硬一体产品与服务:预计2022-2024年收入复合增速为10%。

综上所述,预计2022-2024年公司总收入增速分别为37.6%、39.8%、41.7%。

image.png


毛利率预测:公司软件产品业务处于市场覆盖加速初期,随着后续持续增长,规模效应有望解除个别大批量订单打包折价以及新客户前期拓展技术服务收入提升等带来的短期毛利率压制,我们预计未来毛利率有望持续提升。而公司解决方案业务处于人员培养期,随着相关人员逐步成熟,毛利率有望小幅提升。

我们预计公司2022-2024年综合毛利率分别为60.7%、64.0%、67.9%。

image.png


全球数据量指数级增长趋势下,数据逐步成为核心资产,政企数字化以及对数据处理需求与日俱增。而我国目前包括数据库在内的大数据基础软件仍主要以海外厂商或基于海外开源代码二次开发的产品为主,在科技自立大势下,大数据基础软件国产化需求旺盛。

公司的产品性能优越,坚持自主创新研发,客户粘性高,且新客户拓展快,在核心信创发力赛道有较好的卡位,未来发展空间广阔。

我们预测公司2022-2024年实现收入4.6亿元、6.4亿元和9.0亿元,对应PS估值分别为25倍、18倍和13倍,2024年实现盈亏平衡,选取金山办公(办公Office)、中望软件(CAD)、华大九天(EDA)、麒麟信安(操作系统)等国产基础软件厂商为可比公司。

image.png


05 风险提示

技术研发不及预期:公司产品属于IT架构中的核心底层基础软件,对性能要求高,在海外同类产品具备一定先发优势,同时国内科技巨头纷纷发力的竞争格局下,若公司技术研发不及预期,可能导致其产品竞争力下降。

信创推进不及预期:当前国内政企对于国产大数据基础软件除了内生的数字化增量需求,短期催化更为显著的是存量国产替代,若相关政策推动以及落地执行不及预期,公司业绩增长可能减速。

宏观经济扰动:公司下游客户中,政府、能源、制造业等行业IT支出能力一定程度受宏观经济影响,若经济状况恶化,可能导致下游客户预算不足。