中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 619|回复: 0
打印 上一主题 下一主题

OpenAI 推出 GPT-4.5,表现怎么样?

[复制链接]
跳转到指定楼层
1#
发表于 2025-3-2 22:37:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
OpenAI 推出 GPT-4.5,表现怎么样?

OpenAI 推出的 GPT-4.5 表现具有多面性,具体如下:

优势方面

情感理解出色:GPT - 4.5 在情感理解和表达上更加细腻,能更好地捕捉用户情绪变化,作出更具同理心的回应。如用户表示没考好,它会先进行安慰,而不是像前代直接给出方案,在客服、心理咨询等场景潜力较大。

知识广度和深度提升:在知识储备上有显著进步,能更准确地理解复杂问题,无论是学术问题、技术难题,还是生活琐事,都能更专业、全面地回应。

减少 “幻觉” 问题:通过优化训练数据和算法,有效减少了生成不准确或虚构内容的情况,输出更加可靠,适用于医疗咨询、法律建议等对准确性要求高的场景。

写作能力突出:在创意写作方面表现出色,文章在结构、语言、文风、内容深度和情感表达上都更加成熟和精炼。如根据给定提示创作的短篇恐怖故事,能营造出恐怖氛围。

编程能力有进步:在编程任务上有明显进步,在初级开发得分上比 GPT-4o 高 16%,能完成一些较复杂的编程任务,如编写一个展示球在旋转六边形内受重力和摩擦力影响弹跳的 Python 程序,输出结果令人印象深刻。

具有广泛事实知识:能凭记忆背出深奥的梵文经文,展现出经过超大规模预训练后广泛的事实知识储备。

有待提升方面

部分性能不如预期:在 OpenAI 官方基准测试中,在科学、数学、编码能力上比不上自家去年发的 o3 - mini,在 AIME 和 GPQA 等困难的学术基准测试上表现欠佳。

运行速度较慢:有用户反映其运行速度不尽如人意,在实际使用中可能需要更多等待时间。

价格昂贵:每百万 Tokens 价格是 75 美元,是 GPT-4o 的 30 倍,相比其他竞品价格过高,让许多用户难以接受。

复杂情感理解不足:在回应一些简单社交互动时表现较好,但仍无法准确理解人类的复杂情感和人情世故,在处理这类情况时显得生硬。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2025-5-9 14:14 , Processed in 0.214103 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表