-
深度揭密DeepSeek新大模型的最新进展(附相关概念股更新)
老韭韭 / 01月31日 22:52 发布
一、DeepSeek的最新进展如下:
1.技术成果方面:英伟达1月31日宣布,DeepSeek - R1模型现已在build.nvidia.com上作为NVIDIA NIM微服务预览版提供,可在单个NVIDIA HGX H200系统上每秒提供多达3872 tokens。
2.合作与应用方面:微软1月30日发文宣布DeepSeek R1已在Azure AI Foundry和GitHub上提供,且很快能在微软AI电脑Copilot+PC上运行;亚马逊云科技1月30日举办了关于在Amazon Bedrock上部署DeepSeek模型的线上直播,符合法规要求的企业和开发者可通过Amazon Bedrock的自定义模型导入功能试用。
3. 网络安全方面:据奇安信XLab实验室监测,1月30日凌晨针对DeepSeek线上服务的攻击烈度突然升级,攻击指令较1月28日暴增上百倍,至少有2个僵尸网络参与攻击。不过中国红客联盟联合华为、360以及阿里的网络安全团队,72小时之内逆向锁定攻击源,反制瘫痪对方37%的僵尸网络节点。
4.舆论与监管方面:美国众议院首席行政事务官通知国会办公室不要使用DeepSeek的服务,意大利已下架DeepSeek的应用,日本表示将密切关注,法国相关机构正在分析该工具。
二、OpenAI和Anthropic指控DeepSeek模型侵权事件相关情况如下:
事件起因
- OpenAI指控:OpenAI声称发现证据,证明DeepSeek利用他们的模型进行训练,发现了DeepSeek“蒸馏”OpenAI模型的迹象,微软也开始调查DeepSeek是否使用了OpenAI的API,有说法称DeepSeek可能在去年秋天调用了OpenAI的API,导致数据泄露。
- Anthropic质疑:Anthropic创始人Dario Amodei称DeepSeek最新模型只达到他们7-10个月前的水准,同时也对DeepSeek提出质疑,认为其可能使用了禁运芯片。
相关争议
- 技术层面:模型蒸馏技术本身在学术界和工业界是一种常见的模型优化方法,但OpenAI的服务条款禁止用户“使用输出来开发竞争模型”,对于如何界定“竞争模型”存在模糊性,全球大量AI研究都存在使用类似技术的情况。
- 法律与道德层面:如果DeepSeek确实违反了OpenAI的服务条款,利用其数据进行模型训练,那么从法律和商业道德角度可能存在问题,但OpenAI自身在训练模型时也存在被指违规使用有版权文章作品等情况。
- 商业竞争层面:OpenAI和Anthropic的指控被认为有维护自身在AI领域地位的商业竞争因素,DeepSeek仅用2048块英伟达H800,投入560万美元,就训出了约6710亿参数的V3模型,其R1模型也引起很大轰动,对美国科技公司的行业领先地位造成冲击。
各方反应
- 行业专家:纽约大学教授马库斯、404media创始人及主编Jason等对OpenAI的行为进行嘲讽,认为其存在双重标准。Meta首席AI科学家Yann LeCun也表示所谓中国克隆OpenAI的说法是对模型训练的片面理解。
- 微软:在指控DeepSeek涉嫌侵权之后几个小时,微软的AI平台接入了DeepSeek的模型,举动耐人寻味。
- DeepSeek:DeepSeek发表声明严正驳斥,称R1是团队多年自主研发的成果,核心技术均通过公开论文及专利验证,并表示愿意接受第三方技术审计以证清白。
以下是DeepSeek在发布新大模型、多国限制及受到攻击和质疑方面的最新进展: 一、新大模型发布
- Janus-Pro-7B:据参考消息网1月29日报道,1月28日(除夕),DeepSeek发布开源文字生成图像大模型Janus-Pro-7B,在基准测试中超越美国OpenAI的DALL-E 3等,擅长生成逼真图像、执行复杂视觉推理等任务,是2024年11月13日发布的JanusFlow大模型的进阶版本。
- DeepSeek-R1:1月20日发布的开源大语言模型DeepSeek-R1,凭借低训练成本、高效能引发全球科技圈关注。1月30日消息显示,DeepSeek R1已加入微软超1800个模型的多样化产品组合,可在微软Azure AI Foundry和GitHub上获取,能在Copilot+电脑上运行。
二、 多国限制情况
1.意大利:1月28日,意大利数据保护局要求DeepSeek提供关于个人数据使用问题的说明,苹果和谷歌应用商店中已无法下载DeepSeek的应用。
2.爱尔兰:1月30日,爱尔兰数据保护委员会要求DeepSeek就其人工智能大模型如何使用用户数据提交报告。
3.澳大利亚:1月29日,澳大利亚国库部长呼吁公民使用DeepSeek的人工智能模型时须谨慎。
4.美国:美国要求部队官兵等不得使用DeepSeek模型,美国官员称正调查DeepSeek对“国家安全”的影响。
三、 受到攻击情况
1.攻击烈度升级:1月30日凌晨,奇安信xlab实验室监测发现,针对DeepSeek线上服务的攻击指令较1月28日暴增上百倍,有2个僵尸网络参与攻击,发起2个波次攻击。
2. 攻击阶段回顾:攻击可分为三个阶段,1月3日-7日、13日出现疑似http代理攻击;1月20日、22-26日攻击方法转为ssdp、ntp反射放大,少量http代理攻击;1月27-28日攻击数量激增,手段转为应用层攻击,28日还伴随着大量的暴力破解攻击。
三、 受到质疑情况
1.技术抄袭质疑:美国方面有指责DeepSeek“偷”了他们的技术,但无确凿证据。埃隆·马斯克在X平台上诋毁DeepSeek偷用了大量的英伟达的芯片。
2.数据安全质疑:多国对DeepSeek的数据使用问题提出质疑并展开调查,如意大利、爱尔兰的数据监管机构要求DeepSeek提供数据使用说明和报告。
五、更新的DeepSeek相关概念股:
—)与浙江东方、并行科技、每日互动 华金资本等相关概念股的关系如下:
DeepSeek与浙江东方
- 投资关联推测:有网传消息称浙江东方通过旗下杭州东方嘉富基金参与了DeepSeek天使轮投资,但目前没有确凿证据证实这一说法,第一财经记者查询企查查,未在DeepSeek公司股东中发现浙江东方或其相关子公司。
DeepSeek与并行科技$并行科技(SZ839493)$ - 算力及技术合作:并行科技是国内领先的超算云服务和算力运营服务提供商,凭借先进的大规模分布式超算运行数据采集与分析技术,为DeepSeek模型训练等任务提供坚实数据基础。并行科技还通过多地域跨网络跨的算力资源智能调度技术,实现算力高效利用,加速DeepSeek运算。
DeepSeek与每日互动$每日互动(SZ300766)$
- 股权关系:每日互动是幻方量化的二股东,而DeepSeek的母公司是幻方量化,所以每日互动可视为DeepSeek的间接二股东。
- 人员关联:每日互动的联合创始人徐进也是幻方量化的技术负责人,为双方在技术交流、业务合作等方面奠定了基础。
- 业务合作:每日互动作为专业的数据智能服务商,SDK累计安装量超1100亿,日活跃独立设备数超4亿,能为DeepSeek提供海量的用户行为语料数据,用于训练和优化DeepSeek的模型。
- 算力支持:每日互动牵头的浙江大数据计算中心可为DeepSeek提供强大的算力支持,有助于DeepSeek更高效地进行模型训练和迭代。
- 市场推广:每日互动凭借在数据智能服务领域的丰富经验和广泛客户资源,能为DeepSeek的市场推广和客户拓展提供有力支持。
华金资本与DeepSeek的关系主要体现在投资层面:华金资本作为珠海国资旗下的投资平台,通过华金领越基金参与了DeepSeek的Pre - A轮融资。这使得华金资本在DeepSeek的发展中具有一定的资本关联,通过投资布局了AI大模型赛道。不过,据21世纪经济报道1月27日消息,华金资本相关工作人员表示,公司与DeepSeek没有业务往来。#DeepSeek出圈,A股相关投资机会在哪?#



识图:每日互动菲菱科思


识图:每日互动浙江东方
全部10
二)刚刚更新的DeepSeek(深度求索)概念股:
1.股权关联类
- 浙江东方:通过旗下杭州东方嘉富基金参与DeepSeek天使轮投资。
- 华金资本:珠海国资旗下投资平台,通过华金领越基金参与DeepSeek Pre - A轮融资。
- 每日互动:DeepSeek母公司幻方量化的二股东。
- 卓创资讯:为幻方量化提供金融语料库,从侧面与DeepSeek产生关联。
算力支持类
- 浪潮信息:为DeepSeek北京亦庄智算中心提供AI服务器,配套英伟达H800芯片及自研AIStation管理平台。
- 中科曙光:承建DeepSeek杭州训练中心的液冷系统,保障模型训练环境。
- 航锦科技:旗下超擎数智为DeepSeek提供光模块和交换机,助力其模型的研发与应用。
- 润泽科技:提供数据中心及机柜资源,为DeepSeek的运行和数据存储等提供基础支撑。
数据与场景合作类
- 拓尔思:与DeepSeek联合开发金融舆情大模型,已在中信证券等机构部署智能研报生成系统。
- 科大讯飞:教育场景接入DeepSeek - Math模型,推出AI数学辅导应用“星火助学”。
- 金山办公:在办公软件集成方面与DeepSeek合作,大幅提升办公效率。
业务协同类
- 汉得信息:与DeepSeek存在深度生态合作关系。
- 飞利信:架构与DeepSeek相似,有较大协同潜力。
- 南威软件:与DeepSeek在技术方面相契合,共同探索新应用。
- 并行科技:为DeepSeek提供多种技术手段,提升其计算能力。
- 竞业达:与DeepSeek大模型处于对接过程中。
附:与深度探索DeepSeek在并行算法技术上有深度合作的公司为并行科技,以下是该公司高科技高成长情况及其未来三年的发展趋势分析:
一、高科技高成长情况
1.技术实力:并行科技是国内领先的超算云服务和算力运营服务提供商,拥有大规模的关键算力资源,约65万个计算核心。公司在核心技术方面具有多项专利和软件著作权,能够为DeepSeek提供并行计算技术,优化其分布式训练架构,提升整体算力利用率。
2.成长能力:公司营业收入增长迅速,2021-2023年全年营收分别为2.2亿元、3.1亿元和5.0亿元,CAGR为50%。2024年上半年,公司实现营业收入2.7亿元,同比增长33.51%。其行业云业务和AI云业务近三年的复合增长率分别为138%和253%。
二、未来三年发展趋势
1.技术创新方面:将持续优化并行计算技术,针对DeepSeek等客户在大模型训练和推理方面的需求,开发更高效的分布式训练算法和优化策略,进一步提升计算效率和资源利用率。
2. 业务拓展方面:随着DeepSeek等AI企业的发展,对算力的需求将不断增加,并行科技有望借助与DeepSeek的合作,拓展更多AI相关业务,扩大在AI云服务市场的份额。同时,“算海计划”的推进将为公司带来新的算力资源和业务增长点。
3.市场竞争方面:超级计算行业竞争激烈,未来三年并行科技需不断提升自身竞争力,在与阿里云、华为云等互联网云服务商以及国家超级计算中心的竞争中,凭借与DeepSeek等企业的深度合作,强化差异化优势,以获取更多市场份额。