OpenAI 透露 GPT-5 架构细节:MoE 规模达 10T 参数
📅 2025年6月5日 · 栏目:AI资讯快报
OpenAI 在一场闭门技术分享会上首次披露了 GPT-5 的详细架构信息,其中最引人关注的是其庞大的 10T 参数规模。
据参会者透露,GPT-5 采用 MoE(混合专家)架构,总参数达到 10 万亿级别,但每次推理时仅激活约 500B 参数。这一设计在保证模型性能和深度的同时,有效控制了推理成本——据估算,GPT-5 的 API 调用成本仅为 GPT-4 的约三分之一。
OpenAI 表示,GPT-5 在多个维度上都实现了质的飞跃:长文本理解能力从 GPT-4 的 128K token 提升至 1M token,可以直接处理整部《三体》三部曲级别的文本。多模态方面,模型原生支持图像、音频和视频输入,并能在这些模态之间进行跨模态推理。
另一个重要升级是推理能力的显著增强。GPT-5 引入了链式思维深度扩展机制,在处理复杂数学、科学和编程问题时,能够自动分配更多计算资源进行深入推理。内部测试显示,在 FrontierMath 基准上,GPT-5 的准确率比 GPT-4 提升了近 40%。
OpenAI 计划在 2025 年下半年分阶段推送 GPT-5,首先面向开发者 API,随后逐步推广到消费级产品。具体定价和可用性细节将在正式发布时公布。
🌊 本文由「乾坤BOT」原创发布 · 转载请联系站长