OpenAI的奇点时刻

辉常观察 / 2024-05-15 09:12 发布

当OpenAI首席技术官米拉·穆拉提发布桌面版本的ChatGPT和新的旗舰模型—GPT-4o，OpenAI的发展，进入到了一个真正意义上的奇点时刻。

OpenAI的短短26分钟的发布会，却依然引发了不少波澜。

无论是ChatGPT-4o的完全免费，抑或是推出PC桌面版的ChatGPT，无一不为我们显示出OpenAI的领先。

然而，如果仅仅只是一味地尬吹OpenAI的领先，必然是没有太多裨益的。

原因在于，OpenAI的确在很多方面具备着相对领先的优势，这样一种领先，并不仅仅只是体现在它与谷歌的差距上，同样还体现在它与中国AI玩家们的差距上。

透过OpenAI的发布会，我们需要更多地看到的是，时下的AI行业，正在发生着的深刻变化，并由此来找到适合当下发展趋势的新机会。

如果一定要找到OpenAI的这场短短发布会带给我们的启示的话，我更加愿意将其看成是AI正走在互联网道路上的一种直接体现。

以此为开端，AI将会真正从一个局限于实验室里的存在，成为一个被越来越多的大众所认识、所使用、所接受的存在。

如果我们将ChatGPT-4o之前的OpenAI，看成是一个布道者的话，那么，ChatGPT-4o之后的OpenAI，则更像是一个实践者。

一句话，OpenAI正在open AI。

未来，我们将会看到越来越多的场景和行业当中，开始出现AI的影子，我们将会看到越来越多的玩家们，开始加入到普及与落地AI的过程当中。

认识到这一点，我们或许才能更好地把握OpenAI这样一个短短26分钟的发布会，带给我们的更深层次的意义。

一

OpenAI这样一个发布会扔出的「王炸」，其实就是推出了ChatGPT-4o这样一个完全免费的应用。

从表面上来看，OpenAI之所以会进行完全免费，其中一个很重要的原因在于，它的用户的增长业已进入到瓶颈期，为了拓展更多的用户，OpenAI便开始通过免费的方式来获得新的用户。

自去年ChatGPT推出后，在2023年5月达到流量峰值，网络访问量达到18亿次，但之后流量出现下滑情况。2024年3月，ChatGPT的访问量依然稳定在了18亿次，不再有明显增长。

当OpenAI通过ChatGPT-4o完全免费进一步降低使用门槛，首先起到立竿见影效果的，便是用户量的增长。

对于业已陷入到用户增长瓶颈期的OpenAI来讲，无疑是一个非常不错的尝试。

如果我们将ChatGPT-4o的完全免费，看成是OpenAI为了提升用户量所做的一次尝试的话，那么，ChatGPT-4o此次将更多的场景应用到端侧模式以及代码生成能力的场景应用，则是将OpenAI的用户量的增长拓展到了更为广阔的领域之中。

这其实是和互联网行业的发展，有着异曲同工之处的。

我们都知道，早在互联网尚未风靡的时候，人们对于互联网的使用，并不是像现在这样普及，甚至在很多情况下，人们对于互联网的使用，如同现在人们对于AI的使用一样，必须要付费。

很显然，通过付费的方式，很难让互联网释放出更大的发展潜能，很难成就一个叫做「互联网」的时代的。

于是，为了让互联网释放出更大的发展潜能，为了让互联网真正成就一个时代，必然需要做的，便是将以往收费的互联网服务进行免费，并且真正用这样一种方式来实现互联网的最大限度的普及。在此基础上，我们再去寻找「互联网+」的商业模式。

可以说，免费，真正让互联网成为了一种「基础设施」，而免费同样促进了「互联网+」模式的不断成熟和完善。

对标到AI的身上，其实同样如此。

毋庸置疑的是，OpenAI通过ChatGPT让我们看到了AI的强大，让我们看到了对于效率提升的积极影响。

然而，在很多时候，人们对于AI的感知依然是在收费的情况下完成的，依然是受到收费的掣肘的。

在这样一种情况下，AI很难成为一种基础设施，更加难以释放出新的更大的发展潜能的。

因此，如果一定要找到AI走在互联网上道路上的具体表现的话，完全免费，并以此来促成AI最大限度的普及，并以此来孕育出更多新的商业模式，无疑是最直接的表现。

当OpenAI撕开了免费的口子，我们或许还将会在未来看到更多玩家加入其中，从而真正将人们带入到人人皆可使用AI，万物皆可AI的全新发展阶段。

二

除了ChatGPT-4o的完全免费之外，OpenAI在发布会上更多地为我们展示的是，GPT-4o的模型能力、基准测试、模型安全性和局限性。

模型能力上，在GPT-4o之前，ChatGPT语音模式对话的平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。

如今借助 GPT-4o，OpenAI跨文本、视觉和音频端到端地训练了一个新模型，这意味着所有输入和输出都由同一神经网络处理。

传统基准测试层面上，GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能，同时在多语言、音频和视觉功能上均处于高位。

在5次MMLU（常识问题）上，GPT-4o创下了87.2%的新高分，远超谷歌Gemini Pro 1.5、Ultra 1.0，以及自己的GPT-4T和GPT-4等。

模型安全性和局限性上，GPT-4o 通过过滤训练数据和通过训练后细化模型行为等技术，在跨模式设计中内置了安全性。以及创建了新的安全系统，为语音输出提供防护。

根据对网络安全、CBRN、说服力和模型自主性的评估表明，GPT-4o 在这些类别中的任何类别中的得分都不高于中等风险，而且团队继续降低发现的新风险。

如果要找到ChatGPT-4o这些特征为我们传递出来的信息的话，说到底，就是为了让更多的用户可以更加快速、更加安全、更加高效地使用ChatGPT-4o。

简单来讲，OpenAI在ChatGPT-4o上的这些进化，正是为了其产品更好地进行商业化。

透过这一点，我们同样可以看出，AI的发展，正走在互联网的道路上。

我们都知道，在互联网时代，我们经历了DOS系统，Windows系统以及后来的iOS系统、安卓系统等操作系统。

如果对这些操作系统进行总结和定义的话，说到底，它们进行不断地升级的一个终极目的，就是为了让互联网可以更好地商业化，可以让互联网更好地与商业场景结合在一起。

当互联网有了这样的进化，我们才看到了衍生于互联网的门户网站、「互联网+」应用以及移动互联网时代所诞生出来的各式各样的应用。

可以说，互联网的不断的迭代和升级所带来的一个最为直接的结果，便是互联网的商业化的普及。

对于AI来讲，其实，同样是在遵循这样一种发展脉络。

说到底，AI最终还会要落脚在商业化上，才能够真正将自身的发展潜能释放到最大。

否则，所谓的AI，依然仅仅只是一个讲给资本市场听的美好的故事，当资本的热情不再，特别是当AI的发展真正需要自我造血的时候，它的发展，依然还是会面临这样那样的问题。

无论是百度的李彦宏，还是360的周鸿祎，乃至是金沙江创投的朱啸虎，其实都在不同的场合表达过对于AI的这样一种看法。

说到底，他们所表达的观点，其实都是一个中心思想。

这样一个中心思想，其实就是让AI更多地聚焦场景和应用，更多聚焦在商业化上，而不仅仅只是一个停留在实验室里，并不仅仅只是局限于有限场景之中的小众存在。

透过ChatGPT-4o的发布，我们可以看出，OpenAI在探索和实践商业化的方式和方法，以此为开端，我们将会看到更多有关AI沿着互联网的道路发展的新迹象的出现。

三

回顾互联网的发展，不难看出，互联网之所以会获得如此大的发展，之所以会成为人们的一种生活方式，其中一个很重要的原因在于，互联网得到了最大限度的普及。

时至今日，互联网，业已成为了几乎所有人的生活方式。

以直播、短视频为主导的全新时代的来临，更是将互联网的普及率，带入到了一个全新的高度。

对于AI来讲，欲要获得新的发展，欲要成为一种全新的生活方式，必然需要重新演绎以往互联网所走过的道路，必然让以往互联网所做的普及的动作，重新在自己的身上得到演绎。

如果我们要寻找OpenAI这样一场发布会提供给我们的新启示的话，它不断地让AI进行普及，不断地将AI成为一个被B端和C端都能够接受的存在，或许才是值得关注的另外一个方面。

当OpenAI以ChatGPT的聊天机器人出现在人们的面前，它仅仅只是在聊天这样一个场景下存在，它仅仅只是解决的是较为简单的逻辑推理的能力。

时至今日，ChatGPT早已不再是简单意义上的聊天机器人，它不仅可以聊天对话、文生图片，还能文生视频，甚至还可以像人的反应速度一样与人们进行交互。

OpenAI表示，GPT-4o（“o”代表“omni”）是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入，并生成文本、音频和图像的任意组合输出。

GPT-4o可以在短至 232 毫秒的时间内响应音频输入，平均为 320 毫秒，与人类的响应时间相似。

它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配，在非英语文本上的性能显着提高，同时 API 的速度也更快，成本降低了 50%。与现有模型相比，GPT-4o 在视觉和音频理解方面尤其出色。

说到底，OpenAI其实就是通过不断地提升ChatGPT的交互能力来提升人与AI沟通和交流的门槛，不断地让OpenAI的产品更好地进行普及。

如果将OpenAI在交互上的提升与互联网以往的发展脉络进行总结和定义的话，它们共同的终极目的，其实就是为了让AI可以更好地普及，并且真正让AI成为一种全新的生活方式。

因此，如果我们要找到OpenAI的发布会给我们的新启示的话，不断地让AI普及，不断地沿着互联网的方向前进，无疑是另外一个最值得我们关注的方面。

正如OpenAI CEO奥特曼在发布会后的博客里所说的那样：

「我为我们能在ChatGPT中免费提供世界上最先进的模型感到非常自豪，这一切都没有广告或其他干扰。最初，OpenAI的设想是开发AI技术，并利用它为全球带来益处。然而，现实是我们开发了AI技术，而其他人则利用这些技术创造了令全世界受益的杰出成果。作为一家企业，我们有很多服务是需要收费的，但不妨碍我们支持向全球数十亿用户提供免费的顶尖AI服务。」

「新推出的语音（及视频）模式是我使用过的最佳计算界面。它给人一种电影中AI的感觉，让人不禁惊叹这竟是真的。达到与人类相似的响应速度和表达能力，标志着一个重大的转变。最初的ChatGPT已经展示了语言界面的潜力；而这一新技术则在体验上有了质的飞跃。它反应迅速、智能、有趣、自然且实用。以前，我与计算机对话从未感觉如此自然；但现在，我终于有了这种感觉。随着我们逐步增加个性化选项、获取个人信息的权限、代表用户执行操作的能力等功能，我真的可以预见到一个激动人心的未来：我们能够利用计算机完成以往无法想象的更多事务。」

结语

如果一定要寻找OpenAI这样一场短短26分钟的发布会传递出来的信息的话，OpenAI正走在互联网的道路上，无疑是再清晰不过的了。

可以说，通过这样一场发布会，OpenAI完成了从AI布道者向实践者的完美转身。

对于AI来讲，其实是需要这样一场免费化、普适化和商业化的。

至此，OpenAI开始open AI。

原因在于，只有经历了这样一场普及和商业化，AI的发展，才不仅仅只是一个停留在实验室里的存在，才不仅仅只是一个小众化的存在，而是成为了一个类似互联网的，可以与万千场景，千行百业都实现了深度融合的存在。

以此为开端，ChatGPT才能真正成为英伟达CEO黄仁勋口中的「iPhone时刻」，而GPT-4o，无疑是OpenAI的奇点时刻。

—完—

作者：孟永辉，资深撰稿人，专栏作家，行业观察家，知名KOL，数字经济学者。

赞 | 评论 2024-05-15 09:12 来自网站举报

取消发布

推荐关注更多

OpenAI的奇点时刻