AI领域迎来重大突破!GPT-5震撼发布,性能全面升级、多领域“屠榜”,告别“幻觉”?
2025年8月8日
大小:7.14MB00:00:00/ 00:00:00

北京时间8月8日凌晨,OpenAI正式发布了备受瞩目的新一代人工智能模型GPT-5。这场长达1个多小时的线上发布会规格之高、细节之多,引发了全球科技界的广泛关注。GPT-5的发布,不仅标志着AI技术的一次巨大飞跃,更被视为构建“超级智能”的重要一步。


性能全面升级,多领域“屠榜”


GPT-5在多个领域的表现都迎来了全面提升。在文本生成、Web开发和视觉感知能力领域,GPT-5均排名第一;在硬提示、编码、数学、创造力、长查询等方面也毫无悬念地拔得头筹。在代号为“峰会”的测试中,GPT-5保持着截至目前最高的Arena分数,堪称实至名归的“屠榜”者。


OpenAI首席执行官Sam Altman对GPT-5的评价极高,他比喻说,如果说GPT-4像中学生,GPT-5就像大学生,而GPT-5则是第一次让他真正感觉像在与一位博士级别的专家交谈。他甚至断言,GPT-5是世界上编码能力最强、写作能力最强以及在医疗保健领域最强的模型。


告别“幻觉”,AI更可靠


“AI幻觉”一直是困扰大型语言模型的难题,但GPT-5在这方面取得了显著进步。与GPT-4o相比,GPT-5在联网搜索时回答出现事实错误的概率降低了45%;在独立思考时,回答出错的概率更是比OpenAI o3降低了80%。


此外,GPT-5还引入了四种全新的“人格”模式,包括犬儒、机器人、倾听者和学霸,用户可以根据自己的喜好设定ChatGPT与自己互动和回答问题的方式。


编码能力逆天,“软件按需生成”时代来临


GPT-5的编码能力堪称逆天。在多个编码基准测试中,GPT-5的表现均优于其他任何模型。在人类最终测试中取得42%的成绩,在SWE基准测试中更是达到了75%的成绩。


在发布会上,OpenAI的后期训练负责人Yann Dubois现场演示了GPT-5的强大编码能力,要求它生成一个用于学习法语并带有互动游戏的网站。GPT-5在短短几秒钟内就编写了数百行代码,并直接展示了网站的前端界面。


此外,GPT-5还展示了一款仅靠一段提示词就创作的3D游戏,其画面精致,物理效果也十分逼真。


更安全、更“诚实”


OpenAI对GPT-5进行了超过五千小时的测试,以确保其安全性。GPT-5在更可靠地处理多步骤任务方面表现更好,不会像以前那样“自信地撒谎”。对于一些可能涉及安全风险的问题,GPT-5会采用“安全补全”机制,在保持安全约束的前提下,给出尽可能有帮助的答案。


全面开放,多版本满足不同需求


GPT-5向所有用户开放,包括普通用户、Plus会员和Pro会员。普通用户可以免费体验GPT-5,但用量有限;Plus会员可获得更多使用量;Pro会员则可以访问具备更强推理能力的GPT-5 Pro版本。GPT-5系列还包括GPT-5-mini、GPT-5-nano等版本,以满足不同用户的需求。


在定价方面,标准版GPT-5每百万输入Token 1.25美元,每百万输出Token 10美元,mini版和Nano版的定价则相对较低。


集成架构,智能调度子模型


GPT-5采用了内嵌式三位一体集成架构,由处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking深度思考模型、实时决策的路由机制以及额度使用完后启动的mini版本组成。路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自动匹配最适合的模型,用户无需手动切换。







【新闻来源】金融界财经 http://u5a.cn/gVkVC

(本网转发此文章,旨在为读者提供更多的信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。)