水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

股道的卢

06年入市实战操作至今,经...


价值领航

稳健的投资风格和淘金精神


柴孝伟

建造十九层每层成倍财富高楼...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


banner

banner

深度揭密DeepSeek新大模型的最新进展(附相关概念股更新)

老韭韭   / 01月31日 22:52 发布


一、DeepSeek的最新进展如下:

 

1.技术成果方面:英伟达1月31日宣布,DeepSeek - R1模型现已在build.nvidia.com上作为NVIDIA NIM微服务预览版提供,可在单个NVIDIA HGX H200系统上每秒提供多达3872 tokens。

 

2.合作与应用方面:微软1月30日发文宣布DeepSeek R1已在Azure AI Foundry和GitHub上提供,且很快能在微软AI电脑Copilot+PC上运行;亚马逊云科技1月30日举办了关于在Amazon Bedrock上部署DeepSeek模型的线上直播,符合法规要求的企业和开发者可通过Amazon Bedrock的自定义模型导入功能试用。

 3. 网络安全方面:据奇安信XLab实验室监测,1月30日凌晨针对DeepSeek线上服务的攻击烈度突然升级,攻击指令较1月28日暴增上百倍,至少有2个僵尸网络参与攻击。不过中国红客联盟联合华为、360以及阿里的网络安全团队,72小时之内逆向锁定攻击源,反制瘫痪对方37%的僵尸网络节点。

 

4.舆论与监管方面:美国众议院首席行政事务官通知国会办公室不要使用DeepSeek的服务,意大利已下架DeepSeek的应用,日本表示将密切关注,法国相关机构正在分析该工具。



二、OpenAI和Anthropic指控DeepSeek模型侵权事件相关情况如下:

 

事件起因

 

- OpenAI指控:OpenAI声称发现证据,证明DeepSeek利用他们的模型进行训练,发现了DeepSeek“蒸馏”OpenAI模型的迹象,微软也开始调查DeepSeek是否使用了OpenAI的API,有说法称DeepSeek可能在去年秋天调用了OpenAI的API,导致数据泄露。

 

- Anthropic质疑:Anthropic创始人Dario Amodei称DeepSeek最新模型只达到他们7-10个月前的水准,同时也对DeepSeek提出质疑,认为其可能使用了禁运芯片。

 

相关争议

 

- 技术层面:模型蒸馏技术本身在学术界和工业界是一种常见的模型优化方法,但OpenAI的服务条款禁止用户“使用输出来开发竞争模型”,对于如何界定“竞争模型”存在模糊性,全球大量AI研究都存在使用类似技术的情况。

 

- 法律与道德层面:如果DeepSeek确实违反了OpenAI的服务条款,利用其数据进行模型训练,那么从法律和商业道德角度可能存在问题,但OpenAI自身在训练模型时也存在被指违规使用有版权文章作品等情况。

 

- 商业竞争层面:OpenAI和Anthropic的指控被认为有维护自身在AI领域地位的商业竞争因素,DeepSeek仅用2048块英伟达H800,投入560万美元,就训出了约6710亿参数的V3模型,其R1模型也引起很大轰动,对美国科技公司的行业领先地位造成冲击。

 

各方反应

 

- 行业专家:纽约大学教授马库斯、404media创始人及主编Jason等对OpenAI的行为进行嘲讽,认为其存在双重标准。Meta首席AI科学家Yann LeCun也表示所谓中国克隆OpenAI的说法是对模型训练的片面理解。

 

- 微软:在指控DeepSeek涉嫌侵权之后几个小时,微软的AI平台接入了DeepSeek的模型,举动耐人寻味。

 

- DeepSeek:DeepSeek发表声明严正驳斥,称R1是团队多年自主研发的成果,核心技术均通过公开论文及专利验证,并表示愿意接受第三方技术审计以证清白。




以下是DeepSeek在发布新大模型、多国限制及受到攻击和质疑方面的最新进展: 一、新大模型发布

- Janus-Pro-7B:据参考消息网1月29日报道,1月28日(除夕),DeepSeek发布开源文字生成图像大模型Janus-Pro-7B,在基准测试中超越美国OpenAI的DALL-E 3等,擅长生成逼真图像、执行复杂视觉推理等任务,是2024年11月13日发布的JanusFlow大模型的进阶版本。

- DeepSeek-R1:1月20日发布的开源大语言模型DeepSeek-R1,凭借低训练成本、高效能引发全球科技圈关注。1月30日消息显示,DeepSeek R1已加入微软超1800个模型的多样化产品组合,可在微软Azure AI Foundry和GitHub上获取,能在Copilot+电脑上运行。 

二、 多国限制情况

 1.意大利:1月28日,意大利数据保护局要求DeepSeek提供关于个人数据使用问题的说明,苹果和谷歌应用商店中已无法下载DeepSeek的应用。

 2.爱尔兰:1月30日,爱尔兰数据保护委员会要求DeepSeek就其人工智能大模型如何使用用户数据提交报告。

 3.澳大利亚:1月29日,澳大利亚国库部长呼吁公民使用DeepSeek的人工智能模型时须谨慎。

 4.美国:美国要求部队官兵等不得使用DeepSeek模型,美国官员称正调查DeepSeek对“国家安全”的影响。 

三、 受到攻击情况 

 1.攻击烈度升级:1月30日凌晨,奇安信xlab实验室监测发现,针对DeepSeek线上服务的攻击指令较1月28日暴增上百倍,有2个僵尸网络参与攻击,发起2个波次攻击。 

 2. 攻击阶段回顾:攻击可分为三个阶段,1月3日-7日、13日出现疑似http代理攻击;1月20日、22-26日攻击方法转为ssdp、ntp反射放大,少量http代理攻击;1月27-28日攻击数量激增,手段转为应用层攻击,28日还伴随着大量的暴力破解攻击。 

三、 受到质疑情况 

 1.技术抄袭质疑:美国方面有指责DeepSeek“偷”了他们的技术,但无确凿证据。埃隆·马斯克在X平台上诋毁DeepSeek偷用了大量的英伟达的芯片。

 2.数据安全质疑:多国对DeepSeek的数据使用问题提出质疑并展开调查,如意大利、爱尔兰的数据监管机构要求DeepSeek提供数据使用说明和报告。

 五、更新的DeepSeek相关概念股:

—)与浙江东方、并行科技、每日互动 华金资本等相关概念股的关系如下:

DeepSeek与浙江东方

- 投资关联推测:有网传消息称浙江东方通过旗下杭州东方嘉富基金参与了DeepSeek天使轮投资,但目前没有确凿证据证实这一说法,第一财经记者查询企查查,未在DeepSeek公司股东中发现浙江东方或其相关子公司。

DeepSeek与并行科技$并行科技(SZ839493)$ - 算力及技术合作:并行科技是国内领先的超算云服务和算力运营服务提供商,凭借先进的大规模分布式超算运行数据采集与分析技术,为DeepSeek模型训练等任务提供坚实数据基础。并行科技还通过多地域跨网络跨的算力资源智能调度技术,实现算力高效利用,加速DeepSeek运算。

DeepSeek与每日互动$每日互动(SZ300766)$ 

- 股权关系:每日互动是幻方量化的二股东,而DeepSeek的母公司是幻方量化,所以每日互动可视为DeepSeek的间接二股东。

- 人员关联:每日互动的联合创始人徐进也是幻方量化的技术负责人,为双方在技术交流、业务合作等方面奠定了基础。

- 业务合作:每日互动作为专业的数据智能服务商,SDK累计安装量超1100亿,日活跃独立设备数超4亿,能为DeepSeek提供海量的用户行为语料数据,用于训练和优化DeepSeek的模型。

- 算力支持:每日互动牵头的浙江大数据计算中心可为DeepSeek提供强大的算力支持,有助于DeepSeek更高效地进行模型训练和迭代。

- 市场推广:每日互动凭借在数据智能服务领域的丰富经验和广泛客户资源,能为DeepSeek的市场推广和客户拓展提供有力支持。
华金资本与DeepSeek的关系主要体现在投资层面:华金资本作为珠海国资旗下的投资平台,通过华金领越基金参与了DeepSeek的Pre - A轮融资。这使得华金资本在DeepSeek的发展中具有一定的资本关联,通过投资布局了AI大模型赛道。不过,据21世纪经济报道1月27日消息,华金资本相关工作人员表示,公司与DeepSeek没有业务往来。#DeepSeek出圈,A股相关投资机会在哪?# 







识图:每日互动菲菱科思





识图:每日互动浙江东方

全部10

二)刚刚更新的DeepSeek(深度求索)概念股:

 

1.股权关联类

 

- 浙江东方:通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资。

 

- 华金资本:珠海国资旗下投资平台,通过华金领越基金参与DeepSeek Pre - A轮融资。

 

- 每日互动:DeepSeek母公司幻方量化的二股东。

 

- 卓创资讯:为幻方量化提供金融语料库,从侧面与DeepSeek产生关联。

 

算力支持类

 

- 浪潮信息:为DeepSeek北京亦庄智算中心提供AI服务器,配套英伟达H800芯片及自研AIStation管理平台。

 

- 中科曙光:承建DeepSeek杭州训练中心的液冷系统,保障模型训练环境。

 

- 航锦科技:旗下超擎数智为DeepSeek提供光模块和交换机,助力其模型的研发与应用。

 

- 润泽科技:提供数据中心及机柜资源,为DeepSeek的运行和数据存储等提供基础支撑。

 

数据与场景合作类

 

- 拓尔思:与DeepSeek联合开发金融舆情大模型,已在中信证券等机构部署智能研报生成系统。

 

- 科大讯飞:教育场景接入DeepSeek - Math模型,推出AI数学辅导应用“星火助学”。

 

- 金山办公:在办公软件集成方面与DeepSeek合作,大幅提升办公效率。

 

业务协同类

 

- 汉得信息:与DeepSeek存在深度生态合作关系。

 

- 飞利信:架构与DeepSeek相似,有较大协同潜力。

 

- 南威软件:与DeepSeek在技术方面相契合,共同探索新应用。

 

- 并行科技:为DeepSeek提供多种技术手段,提升其计算能力。

 

- 竞业达:与DeepSeek大模型处于对接过程中。

附:与深度探索DeepSeek在并行算法技术上有深度合作的公司为并行科技,以下是该公司高科技高成长情况及其未来三年的发展趋势分析:

 

一、高科技高成长情况

 

1.技术实力:并行科技是国内领先的超算云服务和算力运营服务提供商,拥有大规模的关键算力资源,约65万个计算核心。公司在核心技术方面具有多项专利和软件著作权,能够为DeepSeek提供并行计算技术,优化其分布式训练架构,提升整体算力利用率。

 

2.成长能力:公司营业收入增长迅速,2021-2023年全年营收分别为2.2亿元、3.1亿元和5.0亿元,CAGR为50%。2024年上半年,公司实现营业收入2.7亿元,同比增长33.51%。其行业云业务和AI云业务近三年的复合增长率分别为138%和253%。

 

二、未来三年发展趋势

 1.技术创新方面:将持续优化并行计算技术,针对DeepSeek等客户在大模型训练和推理方面的需求,开发更高效的分布式训练算法和优化策略,进一步提升计算效率和资源利用率。

 2. 业务拓展方面:随着DeepSeek等AI企业的发展,对算力的需求将不断增加,并行科技有望借助与DeepSeek的合作,拓展更多AI相关业务,扩大在AI云服务市场的份额。同时,“算海计划”的推进将为公司带来新的算力资源和业务增长点。

 3.市场竞争方面:超级计算行业竞争激烈,未来三年并行科技需不断提升自身竞争力,在与阿里云、华为云等互联网云服务商以及国家超级计算中心的竞争中,凭借与DeepSeek等企业的深度合作,强化差异化优势,以获取更多市场份额。