在人工智能领域,一场激烈的 “战争” 正悄然打响。OpenAI 疑似准备发布 GPT-4.5,以狙击马斯克的 Grok3,双方你来我往,使得科技圈风云激荡。
OpenAI 突袭:GPT-4.5 箭在弦上
今日凌晨 1 点,OpenAI 首席执行官兼联合创始人 Altman 突然发声,称 “对于高要求的测试者来说,试用 GPT-4.5 带来的感受 AGI 的体验,远比我预期的要深刻得多!” 这一言论犹如一颗重磅炸弹,瞬间在科技界引发轩然大波。这无疑表明 GPT-4.5 已进入测试阶段,距离正式发布近在咫尺。
近日,Altman 还透露了公司备受瞩目的 GPT-5 模型的发展蓝图。作为 2023 年轰动全球科技和政策圈的 GPT-4 AI 语言模型的后续版本,GPT-5 的进展备受关注。Altman 在 X 平台回应提问时暗示,GPT-5 将在数月内发布,预计可能在 2025 年后期推出。
Altman 在 X 平台上进一步详述,公司计划在 “数周内” 发布 GPT-4.5(内部代号 Orion),它将是 OpenAI 最后一个非模拟推理模型。模拟推理模型(如 o3)采用特殊技术迭代处理用户问题,但相比传统大语言模型(如 GPT-4o)速度较慢,且并非适用于所有任务。之后,GPT-5 将整合 OpenAI 当前所有 AI 模型特性,包括传统 AI 模型、SR 模型,以及用于网页搜索和研究的专业模型。Altman 写道:“我们将在 ChatGPT 和 API 中发布 GPT-5,作为整合了包括 o3 在内多项技术的系统,我们将不再单独发布 o3 模型。”
此外,Altman 还透露了 GPT-5 的使用权限规划,ChatGPT 免费用户将获得 “标准智能设置下的无限 GPT-5 对话访问权限”,ChatGPT Plus 用户可以更高智能级别运行 GPT-5,Pro 用户则能以最高智能级别运行。他还提到,这些集成的 AI 模型将能够使用 OpenAI 的多项 ChatGPT 扩展功能,包括高级语音模式、Canvas、搜索和深度研究。此前,Altman 曾对未来 GPT-5 标签的随意性发表评论,暗示公司去年发布的几个 AI 模型本可命名为 GPT-5 。
马斯克回击:Grok3 震撼登场
颇为有趣的是,就在 OpenAI 释放 GPT-4.5 消息的同一天,马斯克也推出了他口中 “地表最强大的模型” Grok3。北京时间 2 月 18 日中午,马斯克 xAI 的第三代大语言模型 Grok3 正式发布。马斯克宣称,Grok3 在测试中 “表现优于任何已经发布的产品” 。
据介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3 在多项 benchmark 测试中均超越了 DeepSeek-v3、GPT-4o、Gemini-2pro。据悉,目前 Grok3 已在 xAI 内部运行了 2 周。
马斯克早在 2023 年便创办了人工智能企业 xAI。然而,Grok 的开发渊源可追溯至 2015 年,当时,Altman 等 11 人共同创立 OpenAI。但后来,马斯克与 OpenAI 团队理念分歧渐显,最终分道扬镳。随后,OpenAI 于 2022 年底推出 AI 聊天机器人程序 ChatGPT,在全球范围内引发热潮。Grok 一词源于美国作家 Robert Heinlein 于 1961 年的小说《异乡异客》,是其创造的火星语言中的词语,意为透过共情或直观地理解,后被《牛津英语词典》收录,并逐渐融入电脑编程文化。
业内专业人士对 Grok 模型进行了深入剖析。从模型性能对比来看,在新的高中竞赛基准测试中,大模型展现出更强的泛化能力,表现优于小模型;但在去年的测试中情况却相反,这也反映出模型真实的泛化情况。在 17 个月间,Grok 从几乎无法解决高中问题,发展到如今具备较强能力。从能力迁移角度,Grok 不仅在数学和代码比较问题上训练推理能力,还能将其应用于解决游戏等多种不同任务,它学会了检测并纠正自身错误,从数学和编码中获得泛化能力以解决其他问题。在硬件方面,团队搭建 GPU 集群,并通过拔插电缆等方式测试训练设置稳定性,提升可靠性,甚至预测未来两三年内机器将在一些领域获奖,如菲尔兹奖、诺贝尔奖等。在实际应用展示方面,Grok 针对地球与火星间航天器转移的物理问题给出 Python 代码解答,虽未确定正确性,但模拟效果接近实际情况,还能生成类似俄罗斯方块游戏的 Python 代码 。
产业涟漪:算力与电力需求飙升
随着 OpenAI 与马斯克在 AI 领域的竞争加剧,市场也受到了显著影响。今日盘面上,三变科技再度涨停。此前,该公司部分变压器通过外贸代理公司对外出口,被市场归为 xAI 概念股。从当前态势来看,AI 竞争的白热化使得算力和电力成为关键因素。
财信证券指出,尽管 DeepSeek-R1 大幅降低了训练算力开支和模型推理成本,但算力对于模型性能的支撑依旧不可或缺,AI 应用场景的爆发将推动整体算力需求进一步攀升。信达证券也认为,微信接入 DeepSeek-R1,灰度测试 AI 搜索功能,采用公众号推文 + 网页搜索策略,有望推进 AI 应用端升级,提高各行业效率,推动复杂 AI 场景落地,如人形机器人、自动驾驶等。当前 DeepSeek 用户高速增长,算力需求激增,建议关注算力相关产业链。
值得注意的是,市场在一定程度上忽略了电力的重要性。昨日,国电电力放量大涨,放量金额超 300%,中国核电等个股也明显走强,不过从整体来看,电力板块目前尚未明显启动。据一月份的一份数据报告,管理着从华盛顿特区到伊利诺伊州等 13 个州电力系统的 PJM Interconnection LLC 最新预计,到 2035 年,夏季电力高峰需求将从去年创下的历史高点增加近 58 吉瓦(大约增长 38%),达到约 210 吉瓦。据统计,这一预期电力增量将是新英格兰电网历史最高需求量的足足两倍多,而主要原因便是人工智能的蓬勃发展。此外,随着 AI 产业的扩张,电力设备的需求也将随之增加 。这场 OpenAI 与马斯克之间的 AI 大战,不仅在科技领域引发震动,还在资本市场和相关产业中激起层层涟漪,未来走向令人拭目以待。分享