-
Sora到底是啥?将为AI赛道带来什么投资机会?
黑郁金香 / 02月20日 13:57 发布
以下摘自网络
Sora到底是啥?将为AI赛道带来什么投资机会?
一、Sora到底是什么?
2月16日,OpenAI发布文生视频模型Sora。它能够根据用户输入的提示词、文本指令或静态图像,生成长达一分钟的视频,其中既能实现多角度镜头的自然切换,还包含复杂的场景和生动的角色表情,且故事的逻辑性和连贯性极佳。
OpenAI一共展示了48个文本生成的视频。如:
文本提示:一位时尚的女人走在东京的街道上,街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红。她自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果。许多行人四处走动。
OpenAI视频截图
工银瑞信:AI视频生成的难点在于,一方面视频是连续的多帧图像,并且要有逻辑性,并非简单的图片组合;另一方面是带来模型复杂度提升、计算难度和成本的提升。此外,文生视频需要大量的“文本-视频”配对数据,而目前缺乏多样化的数据集,且数据标注的工作量较大。因而此前视频大多为5-15秒,而Sora将视频时长提升至1分钟,支持生成多个镜头,同时基本维持了角色和视觉风格的一致性,并能在一定程度上“理解”现实世界。
国泰君安:Sora具有三大突出亮点:一是60秒长视频,可以保持视频主体与背景的高度流畅性与稳定性;二是在一个视频内实现多角度镜头,分镜切换符合逻辑且十分流畅;三是理解真实世界的能力,对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。
二、Sora发明者之一是天才少年谢赛宁?
2月19日,针对有自媒体称Sora发明者之一是毕业于上海交大的天才少年谢赛宁,谢赛宁本人通过朋友圈对此进行否认称,一点关系都没有,是该自媒体标题党AI写稿,胡乱挂钩,误导事实。
OpenAI官网披露的Sora技术团队信息显示,Sora团队由Peebles等3人,核心成员包括12人,其中有多位华人。不过谢赛宁不在名单中。
Sora的技术思路与其他产品有何不同?
工银瑞信:技术角度来看,Sora采用了“扩散+Transformer”的视频生成大模型技术路线,可谓有了里程碑式的技术进步。相比以往使用的同为扩散模型的U-Net,Transformer架构的参数可拓展性强,即参数量增加,性能加速提升,同时支持任意分辨率、长宽比、时长的视频训练数据,不会因为压缩导致训练数据质量下降。此外,Sora训练了能在时间和空间上压缩视频的自编码器,这也是其能够大幅提升生成视频时长的原因。
360集团创始人周鸿祎:Sora的技术思路完全不一样。之前做视频做图用的都是Diffusion,是多个真实图片的组合。这次OpenAI利用其大语言模型优势,把LLM和Diffusion结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。
三、Sora有何商业价值?
安爵资产董事长刘岩:Sora模型的出现预示着行业变革的来临。在内容创作与媒体领域,它将彻底改变视频制作的传统方式,助力创作者以更高效、更低成本的方式创作出高质量视频,从而推动整个行业的工作效率提升。对于广告、电影预告片和短视频等行业,Sora模型更是可能带来颠覆性的创新。同时其在模拟世界方面的能力为虚拟现实、游戏开发等领域开辟了巨大的潜力空间。
工银瑞信:商业角度来看,从“idea或IP→内容生产→内容分发”的产业链,长期预计视频生产的成本将大幅降低。目前AI生成视频的水平还有待提升,可能更适合做对视频质量要求低的互联网广告素材,如游戏买量素材等。由于Sora基本处于闭源状态,技术细节并未公布,相比于GPT有较多开源模型而言,国内视频生成模型方面尚有差距,利好有idea但落地较慢的动画电影公司、IP公司,以及能够降本增效的游戏行业。
周鸿祎:Sora有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,再叠加很多其他的技术,就可以创造各个领域的超级工具,比如生物医学、蛋白质和基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。这次Sora对物理世界的模拟,至少将会对机器人具身智能和自动驾驶带来巨大的影响。
四、A股Sora概念股怎么看?
云从科技:目前,从容大模型已实现利用diffusion、GAN等生成式技术围绕人物图像、人物视频数据进行建模,通过文本和音频实现对图像和视频内容进行生成、控制、编辑。应用上,云从科技与天津港、华为等共同开发港口大模型PortGPT,核心是AI智能体天天,通过AI生成交互画面,协同数据分析,提高港口运转效率及安全性。此外,还在文生图像、视频等跨模态领域积极布局,包括发布数字人能力平台,生成AI视频;与中国电信合作AI营销海报生成等。
博汇科技:公司一直在积极关注Sora相关业务的布局及发展。目前,公司业务主要在传媒安全领域,有两个方向:一方面是针对音视频内容运维提供保障,另一方面是针对音视频内容的监管。目前Sora相关产品处于初级阶段,未来的应用还有待进一步研究。Sora后续如果应用场景比较宽泛,产生的视频数据量将有所增长,对产业将有一定促进。
因赛集团:预计于2024年3月底前,开发实现文生视频功能,之后推出公测版正式启动商业化。公司目前已收到几家汽车、快消行业知名品牌方发出的AIGC营销项目投标邀请,后续会在确保生成效果和效率的前提下,加快 InsightGPT的商业化进程。
汉王科技:Sora目前属于比较前沿的动态,汉王一直在人工智能领域耕耘。公司有自己的核心技术,比如文本识别、图像识别、视频分析等多模态识别技术,并已在多领域进行应用。在识别解析技术方向,公司有自己的大模型(汉王天地),主要在垂直领域进行应用。
五、Sora将为AI赛道带来什么投资机会?
止于至善投资总经理何理:Sora的发布有望再度掀起AI上涨热潮。尽管Sora的视频时间仅有一分钟,但按照OpenAI的迭代速度,生产出几十分钟的AI视频也不远了。未来数年内,将对整个影视制作和短视频行业带来颠覆性冲击。目前AI热潮已进入第二阶段,重点在于产品层面的AI创新以及数据层面的业绩检验。未来行情的爆发属于应用端与基建端并举,应用端重点关注与AI融合较好的TOB端应用,基建端主要关注GPU、光模块、液冷、数据要素等。
中信建投证券:AI仍然是当前科技投资的主线,海外AI大模型和应用保持较快迭代速度,随着Sora、Gemini 1.5 Pro 等大模型的发布,多模态能力显著增强,应用场景进一步拓宽,这将带动算力基础设施的投资,光模块、ICT基础设施等板块。
申万宏源:对于短视频UGC平台,借助AI升级剪辑工具拉动创作者经济的进一步发展,但也需关注是否会有竞争的变化。对于深度内容受益,IP价值提升,对浅显低门槛内容竞争加剧。对创意工具,应对竞争的要素是B端客户粘性和版权库积累。AI造假或影响新闻生产和传播,识别AI视频将是内容审核关键环节。可关注光通信产业链、算力设备产业链、多模态算法布局、有丰富IP储备的深度内容创作、商业化AI应用场景的美图等方向。
招商基金:AI赛道大概率仍是未来一段时间的主线之一,后续仍可重点关注AI产业链内算力与应用的配置机会。
博时基金:受海外AI应用取得突破性进展的催化,AI板块走势强劲。当前AI板块的产业逻辑较为顺畅,后续的增长持续性或有望提升,业绩也有可能超预期,相对看好其未来表现。