OpenAI 开源了名为GPT-oss的开源模型,这是自 GPT-2 以来 OpenAI 首次发布的开源模型,标志着公司在开源领域的重大转变。该模型包括两个版本:gpt-oss-120b 和 gpt-oss-20b,分别拥有 1170 亿和 210 亿参数,支持 Apache 2.0 许可证,允许免费商用。这两个模型在性能上接近或超越了专有模型,如 o4-mini 和 o3-mini,尤其在推理、效率和跨部署环境的实用性方面表现突出。
gpt-oss-120b 适用于高推理能力的生产级和通用型场景,可在单张 80GB 显存的 GPU 上运行;而 gpt-oss-20b 适用于低延迟和本地化应用,可在 16GB 显存的边缘设备上运行。模型采用了混合专家(MoE)架构,结合长上下文扩展和高效注意力机制,以减少计算资源消耗并提高性能。
OpenAI 通过开源 GPT-oss,旨在推动 AI 技术的普及和创新,降低新兴市场和小企业的准入门槛,促进 AI 生态的多样化发展。此外,OpenAI 还提供了在线试用网站和本地使用平台,如 Ollama,以方便用户使用这些模型。
OpenAI 的这一举措被视为其战略的重大转变,标志着公司在开源领域的积极参与和对开源社区的贡献。