OpenAI 推出 GPT-4.5，表现怎么样？

sowang · 发表于 2025-3-2 22:37:47

OpenAI 推出 GPT-4.5，表现怎么样？

OpenAI 推出的 GPT-4.5 表现具有多面性，具体如下：

优势方面

情感理解出色：GPT - 4.5 在情感理解和表达上更加细腻，能更好地捕捉用户情绪变化，作出更具同理心的回应。如用户表示没考好，它会先进行安慰，而不是像前代直接给出方案，在客服、心理咨询等场景潜力较大。

知识广度和深度提升：在知识储备上有显著进步，能更准确地理解复杂问题，无论是学术问题、技术难题，还是生活琐事，都能更专业、全面地回应。

减少 “幻觉” 问题：通过优化训练数据和算法，有效减少了生成不准确或虚构内容的情况，输出更加可靠，适用于医疗咨询、法律建议等对准确性要求高的场景。

写作能力突出：在创意写作方面表现出色，文章在结构、语言、文风、内容深度和情感表达上都更加成熟和精炼。如根据给定提示创作的短篇恐怖故事，能营造出恐怖氛围。

编程能力有进步：在编程任务上有明显进步，在初级开发得分上比 GPT-4o 高 16%，能完成一些较复杂的编程任务，如编写一个展示球在旋转六边形内受重力和摩擦力影响弹跳的 Python 程序，输出结果令人印象深刻。

具有广泛事实知识：能凭记忆背出深奥的梵文经文，展现出经过超大规模预训练后广泛的事实知识储备。

有待提升方面

部分性能不如预期：在 OpenAI 官方基准测试中，在科学、数学、编码能力上比不上自家去年发的 o3 - mini，在 AIME 和 GPQA 等困难的学术基准测试上表现欠佳。

运行速度较慢：有用户反映其运行速度不尽如人意，在实际使用中可能需要更多等待时间。

价格昂贵：每百万 Tokens 价格是 75 美元，是 GPT-4o 的 30 倍，相比其他竞品价格过高，让许多用户难以接受。

复杂情感理解不足：在回应一些简单社交互动时表现较好，但仍无法准确理解人类的复杂情感和人情世故，在处理这类情况时显得生硬。

		自动登录	找回密码
密码			禁止注册

OpenAI 推出 GPT-4.5，表现怎么样？

浏览过的版块