-----头部结束------------------ -----头部结束------------------

OpenAI认错!DeepSeek掀起新浪潮:四模型同日开源

2025-02-21 06:23:00

  

OpenAI认错!DeepSeek掀起新浪潮:四模型同日开源

  2 月初★★★,OpenAI CEO Sam Altman 罕见承认 OpenAI 的闭源策略站在了「错误的一边」★★★,同时小心翼翼地放出了有限度「免费+开源」的消息★★★。

  过去,大模型行业默认接受了封闭模式——从 GPT-3 之后,AI 技术的进步被归结为「资源游戏」,更大的算力、更贵的数据★★★、更封闭的 API★★,塑造了 AI 的商业逻辑★★★。

  OpenAI 转变的核心逻辑在于,训练大模型需要极高的算力成本,闭源可以确保盈利,避免开源导致的「免费竞争」。而通过 API 形式提供 AI 服务★★,而不开放底层权重,防止竞品复制其技术。

  更重要的是,它证明了 AI 进步不必依赖「算力堆叠」★,DeepSeek 另辟蹊径,通过推理优化,而不是纯粹地算力扩展,重新定义 AI 进步的路径。

  还是 2 月 18 日,DeepSeek 在 X 平台上发布了一篇技术论文,主要内容是提出一种名为 NSA(Natively Sparse Attention,原生稀疏注意力)的新型注意力机制★。核心是通过对硬件的友好与端到端训练★,取得推理、训练速度和任务表现的综合平衡★★:

  这不是 DeepSeek 第一次发布技术论文,第一次为业界提供一种难题的解决思路。但更重要的其实是不同于 o1 模型★★★,DeepSeek 此前用 R1 彻底揭开了 OpenAI 无论如何都想藏起来的——推理类模型「算法的秘密」★,给更多人、更多厂商复制和超越 o1 的可能。

  也不仅仅是 OpenAI★★★,整个 AI 生态都在拥抱开源,甚至一向推崇闭源的百度也宣布下一代文心大模型 4★.5 系列将在 6 月底开源。而仅在 2 月 18 日一天,就有多个模型宣告开源:

  这种开源路径带来的变化★★★,不只是技术上的,也是生态上的★★。在封闭体系下★★,企业只能被动接受 OpenAI、Anthropic 这样的巨头定价,而 DeepSeek R1 让企业有了更低的成本★、更灵活的选择★★★,所有过去被封闭 AI 掌控的能力,如今都可以在开源环境中自由演进。

  Chromium 也是如此,尽管它最初只是一个开源浏览器引擎★,但最终几乎吞噬了整个浏览器市场,就连微软的 Edge 都不得不基于 Chromium 内核重建。

  2008 年,Google 决定对 Android 采取开源+商业化的策略,这一决定彻底改变了移动操作系统格局。当时的 iOS 是封闭的★★★,而 Android 通过开源吸引了三星、华为以及小米等全球硬件厂商的支持★★,迅速超越 iOS★★,成为全球市场占有率最高的移动系统。

  - 阶跃星辰和吉利汽车联合宣布,将开源双方合作的视频生成模型阶跃 Step-Video-T2V 和语音交互大模型阶跃 Step-Audio★★。

  这场 AI 竞赛,已经远远超出了最初的语言模型之争,开源正以燎原之势★★★,席卷整个 AI 生态★★,也在一定程度上意味着大模型迭代的范式转变★。

  就在 Sam Altman 询问开源模型方向的推文下,有人依旧不满于 OpenAI 的「开源策略」,并提出至少应该开源 GPT-4——尽管由于成本和延迟早已不是主力,但依然是非推理类模型的一流性能水平。

  就在短短几个月前,关于 AI 的讨论还集中在 GPT(OpenAI)★、Claude(Anthropic)和 Gemini(Google)这样的闭源模型上,而现在,DeepSeek 几乎以一举之力扭转了市场的注意力★,将其迅速转向开源阵营。

  在DeepSeek这只★★“鲶鱼”的影响下,开源正在撬动整个 AI 生态,而一场 AI 产业的「开源革命」也已然开始。

  相比更早之前发布的 OpenAI o1、Kimi k1,DeepSeek R1 不仅是作为开源模型,而是一种全新的思维方式——它让 AI 的「思考过程」成为透明的★,让所有开发者都能看到推理是如何发生的★。

  面对这一挑战,OpenAI 再也无法对开源阵营置之不理★。过去,企业几乎只能依赖 OpenAI 或 Google 等大模型厂商提供的封闭 API,而现在★★★,越来越多公司开始直接从云计算平台或者部署 DeepSeek 等开源大模型★,大幅降低 AI 计算成本。

  R1 已经证明,不同于闭源的 AI 研究,开源的方式可以通过全球协作、技术共享★,让整个生态的进步速度加快★。未来的 AI 可能也不会是少数巨头的垄断,而是由大量参与者共同推进的技术体系。

  更重要的是,通过掌控用户交互数据★,持续迭代 GPT 模型和 ChatGPT,并维持市场领先地位。但 OpenAI,终究还是忽略了开源的魔力以及最核心的技术创新。

  - 逐际动力宣布,开源基于视频生成大模型的具身操作算法(VideoGenMotion★★,简称 LimX VGM)★★。

  - 在刚刚发布 Grok 3 系列模型,马斯克旗下 xAI 宣布★,上一代大模型 Grok 2 将照例在几个月后开源。

  最早,OpenAI 以「开源」起家★★★,GPT-2 甚至还曾完全开放权重。但随后 OpenAI 就彻底转向闭源,并在基于 GPT- 3.5 打造 ChatGPT 后迅速以 API 和订阅制建立起商业模式。

  今天 AI 领域在经历同样的变革。闭源 AI 依然能赚到钱★,但随着 DeepSeek 带来的冲击,市场已经开始倾向于开源大模型的路线★★★。一个核心在于,开源不仅降低了 AI 技术门槛,也给所有开发者和企业带来了更多自由度——API 接入、云端调用★★、本地部署,甚至是基于不同需求和数据进行重新训练。

  ChatGPT 问世后★★,OpenAI 在闭源模型的基础上通过「API+订阅制」构建起强大的商业护城河,但 DeepSeek V3 和 R1 证明了开源大模型同样可以媲美 GPT-4o 级别的能力,并且成本更低、可本地部署★★。

  这种逻辑一度被认为是不可逆的,毕竟 AI 训练的成本极高,封闭系统能确保收益最大化★★★,同时维持技术优势★★★。但 DeepSeek R1 彻底改变了这种假设。

  除了之前就采用不同开源策略的 Llama(Meta)、通义千问 Qwen(阿里巴巴)以及 Grok(xAI)★,开源阵营也迎来了不同方向的大模型,腾讯和字节就在早些时候开源了各自的视频生成模型,也包括昆仑万维刚刚开源的 SkyReels-V1 视频模型★。

  - 昆仑万维宣布★★,开源中国首个面向 AI 短剧创作的视频生成模型 SkyReels-V1,以及基于视频基座模型的表情动作可控算法 SkyReels-A1。

  如果回顾计算机技术史,实际上我们不难发现,开源未必会在早期占据最有利的位置,但往往就像滚雪球一般★:越滚越大★★★,最终势不可挡★★。

  本文为澎湃号作者或机构在澎湃新闻上传并发布★★★,仅代表该作者或机构观点★,不代表澎湃新闻的观点或立场★★,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

  这不仅提高了 AI 的普及度★★,也让整个行业面临的壁垒大幅削减,这也是为什么我们会看到,所有厂商似乎都在接入 DeepSeek。当然,出于营销目的的接入以及简单粗暴的接入方式★★,也是这种变化中不可避免的一个过程。

  从这个角度来看,DeepSeek 和 R1 之所以重要,并不仅仅是它的性能,而是它所开启的 AI 未来★。开源不是封闭 AI 的备选方案,而是一条全新的康庄大道。

  毫无疑问★,结合之前 OpenAI 在 DeepSeek 冲击下放出的一系列消息★,Sam Altman 不仅官宣了「开源项目」,也是在暗示 OpenAI 开源计划的两个方向。而在过去六年,OpenAI 一直坚守封闭策略(甚至因此被网友称为CloseAI),自 GPT-2 之后再未开源任何大模型。

  「对于我们的下一个开源项目,是做一个相当小巧但仍然需要在 GPU 上运行的 o3-mini 级别模型更有用★★,还是做我们能做的最好的手机尺寸模型?」

  不同于其他视频模型追求的通用性,SkyReels-V1 视频可能是首个面向 AI 短剧生成的开源模型★,性能上号称是最强的图生视频开源模型★★。

  与此同时,阶跃星辰和吉利汽车开源了面向座舱场景的阶跃 Step-Video-T2V 视频生成模型,以及阶跃 Step-Audio 语音交互大模型。另一边是逐际动力在视频生成大模型打造了一套从文本到视频,再到机器人运动和操作的算法 LimX VGM,并将之开源给所有机器人开发者。