OpenAI发布两款开源本地化AI模型 性能比肩商业级产品

芝麻开门

芝麻开门(Gateio)

注册芝麻开门享最高$2,800好礼。

币安

币安(Binance)

币安是世界领先的数字货币交易平台,注册领100U。

OpenAI周二发布了两款开源权重语言模型,其性能可媲美商业产品且能在消费级硬件上运行——gpt-oss-120b仅需单块80GB显存的GPU,而gpt-oss-20b可在16GB内存的设备上运作。

这些采用Apache 2.0许可证发布的模型,在推理基准测试中与OpenAI的o4-mini近乎持平。1200亿参数版本通过混合专家架构每token仅激活51亿参数,200亿参数模型则激活36亿参数。两者均支持128,000 token的上下文长度——与GPT-4o相同。

采用该特定许可证发布意义重大,意味着任何人都能不受限制地使用、修改这些模型并从中获利,包括普通用户乃至OpenAI的竞争对手如中国初创公司深度求索

此次发布正值GPT-5即将面世的猜测甚嚣尘上,以及开源AI领域竞争白热化之际。这是OpenAI自2019年GPT-2以来首次发布开源权重语言模型。

虽然GPT-5尚无确切发布日期,但萨姆·奥尔特曼暗示可能比预期更早。”未来几天我们将带来诸多新成果”,他今日凌晨在推特写道,并承诺”本周晚些时候将有重大升级”。

未来几天我们将带来诸多新成果!

今天先来个”大而小”的惊喜。

本周晚些时候则有重大升级。

——萨姆·奥尔特曼 (@sama) 2025年8月5日

今日发布的开源模型性能强悍。OpenAI在公告中表示:”这些模型在推理任务上超越同规模开源模型,展现强大的工具使用能力,并针对消费级硬件部署进行了优化。”公司采用强化学习及源自o3等前沿系统的技术对其进行了训练。

在Codeforces编程竞赛中,gpt-oss-120b使用工具时Elo评分达2622分,未使用时为2463分——超越o4-mini的2719分,接近o3的2706分。该模型在AIME 2024数学竞赛中准确率达96.6%(o4-mini为87.3%),在HealthBench评估中获得57.6%分数(优于o3的50.1%)。

OpenAI发布两款开源本地化AI模型 性能比肩商业级产品 图片来源:OpenAI

体型更小的gpt-oss-20b在这些基准测试中与o3-mini持平或更优。其Codeforces工具辅助评分达2516分,AIME 2024准确率95.2%,HealthBench得分42.5%——同时满足边缘设备部署的内存限制。

两款模型支持低/中/高三档推理强度,可权衡延迟与性能。开发者只需在系统消息中添加单句指令即可调整设置。模型的后期训练流程与o4-mini相似,包括监督微调和OpenAI所称的”高计算量强化学习阶段”。

但别以为任何人都能轻松修改这些模型。OpenAI在预训练阶段过滤了化学、生物、放射性与核威胁相关有害数据,后训练阶段则采用审慎对齐和指令层级设计,使模型能拒绝不安全提示并防御提示注入攻击。

换言之,OpenAI宣称其模型设计极为安全,即便修改后也无法生成有害响应。

OpenAI对齐专家埃里克·华莱士透露,公司在发布前进行了史无前例的安全测试。”我们通过微调刻意最大化模型的生物与网络能力,”华莱士在X平台发文称。团队专门整理生物学领域数据,并在编码环境中训练模型以解决夺旗挑战。

今天我们发布gpt-oss-120b和gpt-oss-20b——两款具有强大性能和工具代理能力的开源权重大模型。

发布前,我们进行了首创的安全分析:通过微调刻意最大化模型的生物与网络能力 � pic.twitter.com/err2mBcggx

——埃里克·华莱士 (@Eric_Wallace_) 2025年8月5日

经过对抗性微调的版本由三个独立专家组评估。”在我们的前沿风险评估中,恶意微调的gpt-oss表现逊于OpenAI o3——后者尚达不到’预备框架’的高能力等级,”华莱士表示。测试表明,即便使用OpenAI训练栈强力微调,模型也无法达到公司”预备框架”认定的危险能力水平。

不过模型保留了无监督思维链推理能力,OpenAI称这对警惕AI行为至关重要。”我们未对任何gpt-oss模型的思维链施加直接监督,”公司声明称,”我们认为这对监测模型异常行为、欺骗和滥用至关重要。”

OpenAI对其顶级模型的完整思维链进行保密,既防止竞争对手复制成果,也避免再次发生深度求索事件——如今这类事件可能更易发生。

模型已登陆Huggingface。但如开头所述,运行1200亿参数版本需要配备至少80GB显存的GPU巨兽(如1.7万美元的英伟达A100),而200亿参数版本至少需要16GB显存(如3000美元的英伟达RTX 4090)——这对消费级硬件虽要求颇高但并非不可企及。

通用智能通讯

由生成式AI模型Gen讲述的每周AI之旅

您的邮箱

立即获取!

© 版权声明

相关文章