OpenAI 即将发布强大开源模型,Altman 重磅预告:GPT-5 迈向全模态时代!
OpenAI 执行长 Sam Altman 近日在与 Y Combinator 总裁 Garry Tan(陈嘉兴) 的深度对谈中,曝光了一系列 OpenAI 最新动向,涵盖:
-
一款即将开放的 强大开源模型
-
GPT-5 的发展方向与多模态能力
-
AI 成本革命带来的创新潜力
-
未来智能体(AI Agents)演化蓝图
-
对创业者的深度建议与方向指引
这场对谈不仅揭示了 OpenAI 的技术布局,也传递出 AI 即将加速进入新纪元的明确信号。
GPT-5 邁向真正的「多模態」AI
Altman 透露,GPT-5 将在 2024 年夏季正式亮相。这款新模型不仅继承 GPT-4 的强大能力,还将进一步拓展输入与输出形式,迈入「全模态 AI」阶段。
GPT-5 预计支持多种交互方式,包括:
-
语音输入输出
-
图像理解与生成
-
程式码分析与编写
-
视频生成与处理
虽然 GPT-5 仍未达成 OpenAI 对“通用人工智能(AGI)”的终极构想,但 Altman 明确表示:它将成为实现「真正多模态 AI」的关键一步。
即将开放的开源模型:性能超出预期,可本地运行
除了 GPT-5,Altman 还首次预告了 一款即将开源的强大 AI 模型。该模型具备以下特性:
-
性能将超出业界当前预期
-
支持在本地设备上运行
-
完全开放源代码,推动 AI 普及
这代表 OpenAI 正在突破此前「闭源为主」的路线,拥抱开放生态,释放更多 AI 基础能力给开发者、研究者与企业。
Altman 表示,这将有助于 加速 AI 应用的本地化落地与定制开发,并推动边缘计算与隐私保护的发展。
AI 成本剧降,潜力远未被释放
Altman 指出,目前许多用户还低估了现有模型(如 GPT-3)的真正能力,AI 实际上已经远远超过了大多数产品所呈现的上限。他称之为“能力溢出”(Capability Overhang)。
尤其令人瞩目的是,AI 使用成本正迅速下降。以 GPT-3 为例,仅在一周内,其计算成本已下降 5 倍。Altman 认为,这种趋势将释放出大量之前因成本限制而无法实现的应用场景,带来新一轮创新浪潮。
ChatGPT 的「记忆功能」正改变人机交互
在对谈中,Altman 也特别提及 ChatGPT 正在开发的 记忆功能。这将使 AI 从一次性对话工具演进为:
-
可跨设备同步的「持续型助理」
-
能整合用户资料与历史偏好的智能伴侣
-
类似“个人操作系统”的存在,理解并支持用户生活中的各种任务
这将极大增强用户黏性与实用性,改变现有的人机交互方式。
2025:智能体(AI Agents)元年即将到来
OpenAI 总裁 Greg Brockman 曾将 AI 智能体(Agent)定位为「L3 级别 AGI」——能够像一位初级员工一样,在电脑前执行多步骤任务、长时间独立操作。
Altman 预测,2025 年将成为 AI 智能体的元年,企业中大量重复性办公任务将由这类智能体自动完成。他还提出 AGI 的五个发展等级:
等级 | 能力描述 |
---|---|
L1 | 基础对话者(聊天) |
L2 | 推理者(复杂理解) |
L3 | 行动者(执行任务) |
L4 | 创新者(自我创造) |
L5 | 组织者(协调多模型与系统) |
目前,OpenAI 正加速从 L2 向 L3 的跃迁。
Altman 对创业者的建议:别复制 OpenAI,聚焦痛点与差异化
面对当前 AI 创业热潮,Altman 提醒创业者:
“现在是科技史上最好的创业时机之一,但不要急于复制 OpenAI。”
他认为,AI 的影响将远超当年的电晶体革命,足以重塑整个人类社会的运作方式。创业者应聚焦那些尚未被解决的问题,在特定领域中打造具备 护城河与差异化优势 的产品。