OpenAI在周四的直播中正式发布GPT-5,这家公司称其标志着人工智能能力经过数月期待与多次延期后迎来质的飞跃。该模型将于今日全天向所有ChatGPT用户开放。
此次发布代表着OpenAI将其各类AI技术整合为统一系统的尝试。该公司将推理能力定位为通用人工智能战略的核心,此次突破消除了速度与分析深度之间的传统取舍。用户不再需要快速响应与深度推理二选一——GPT-5可同时实现两者。
以下是您需要了解的核心信息速查表。
1. 何时能体验?
GPT-5今日起登陆ChatGPT及其API接口。微软也已立即将GPT-5整合至产品线,通过Copilot和GitHub Copilot提供访问。
若您已为Edge浏览器更新Copilot功能,现在即可使用。
2. 所有用户版本相同吗?
基本一致:免费用户初始使用标准版GPT-5,用量耗尽后将切换至轻量版”GPT-5 mini”。专业订阅用户(200美元/月)可无限制使用完整模型,Plus订阅用户(20美元/月)则使用标准版GPT-5。
专业用户可启用最高智能等级,享有高级智能体优先体验、无限使用、深度研究增强功能、优先访问权,以及支持更高视频/屏幕共享限制的增强语音模式等特权。
3. 多模态意味着什么?独立图像生成器会消失吗?
多模态指GPT-5能在同一会话中处理生成文本、图像、语音乃至视频等多元内容。演示中该模型展现出处理法语复杂任务的能力,可生成含正确发音的完整网站。
用户不再需要辗转于Vision、Sora、GPT等独立模型——GPT-5可独立完成所有任务。
4. 上下文窗口多大?为何重要?
GPT-5具备256,000标记的输入上下文窗口,API支持最高272,000输入标记与128,000输出标记,总上下文长度达400,000标记。
这意味着单次可处理约20万单词(相当于一部长篇小说)。超大上下文使GPT-5能维持超长对话连贯性,完整分析代码库或长篇文档而不遗漏关键细节。
不过以当前标准衡量仍不算最大,例如Gemini 2.5支持100万标记处理。
5. 有哪些新功能?
严格来说没有全新功能,但多项能力升级显著,实际体验堪比新功能。
6. 核心优势何在?
GPT-5全方位更强大:演示中仅用两分钟便根据指令从零编写400行伯努利效应模拟代码。其他亮点包括:
- 语音交互更自然,新增实时视频功能比肩Gemini Live等竞品
- 支持分析上传图像并融入应答
- 智能体任务处理能力增强,可处理实际应用场景并解释推理过程
- 下周将支持Gmail与Google日历集成,大幅提升助手功能
7. 定价有变化吗?
ChatGPT订阅价格保持不变:Plus版20美元/月,Pro版200美元/月。
API费用方面:标准版GPT-5每百万输入标记1.25美元,输出标记10美元;GPT-5 mini输入0.25美元/百万,输出2美元;GPT-5 nano输入0.05美元/百万,输出0.4美元。
这使得其定价不仅具有市场竞争力,相较OpenAI自家GPT-4.1等模型更显实惠(如o1 pro模型每百万标记高达600美元)。
8. 这是通用人工智能吗?
尚未达到。但OpenAI将推理能力定位为”通用人工智能计划的核心”。
该模型虽取得重大进展,仍专注于特定任务而非跨领域人类智能。例如擅长语言任务,但缺乏独立完成广泛活动的通用智能,尚不具备自我学习与适应能力。
9. 支持视频生成吗?
暂不支持。视频生成未纳入首发功能,OpenAI仍将Sora作为独立产品。
CEO萨姆·奥尔特曼曾表示未来版本”终将”支持视频。当前版本可理解实时视频,例如指导用户修理自行车。
10. 相比前代可靠性如何?
OpenAI称GPT-5″欺骗性显著降低”,解决了大语言模型部署中最顽固的挑战之一。
首席科学家雅各布·帕乔茨基表示,在事实准确性测试中,GPT-5比o3减少约80%事实错误,对企业应用更可靠。
11. 记忆与个性化功能?
GPT-5据称具备跨会话持久记忆,即使关闭应用数天后重启,仍能记住事实、偏好与指令。GPT-4的记忆力在会话暂停数天后明显受限。
用户可设置长期目标(如健康减重10磅/备考物理测试),GPT-5将主动调整应答策略以配合目标。
12. 数据隐私性如何?
奥尔特曼此前承认,若法律要求OpenAI可能需向政府提交用户个人数据。
13. 还需要切换不同模型吗?
基本不需要——除非使用Sora生成视频。随着GPT-5发布,OpenAI有信心淘汰所有前代模型。
该设计旨在覆盖既往需专用模型的所有场景,但用户仍可根据速度与成本需求选择GPT-5/GPT-5 mini/GPT-5 nano。
通用智能通讯
© 版权声明
文章版权归作者所有,未经允许请勿转载。