游戏世界
业界动态 手游资讯 网游资讯 单机资讯 电竞资讯 动漫资讯 游戏设备 手机电脑 热点资讯

GPT-4.5智商94却登顶LLM竞技场,网友实测:情商爆表理解力超强?

2025-03-04来源:ITBEAR编辑:瑞雪

近期,AI界掀起了一场轩然大波,一款名为GPT-4.5的大模型在知名排行榜LM Arena上异军突起,一度问鼎榜首,引发了广泛关注和热议。

据悉,GPT-4.5在多项测试中表现出色,特别是在数学、编程、创意写作等领域,其卓越的表现让人们惊叹不已。然而,这款曾经全班垫底的模型如今却大放异彩,不禁让人质疑:大模型竞技场是否出现了什么变故?

面对这样的质疑,网友们纷纷进行实测,结果却惊讶地发现,GPT-4.5的确拥有超凡的情商,能够深刻理解人类的深层意图,无需过多推理便能给出令人满意的回答。这一发现让人们对GPT-4.5的评价发生了翻天覆地的变化。

不仅如此,GPT-4.5在多轮对话、困难提示、指令遵循、长查询等方面也均表现出色,总分高达1411,稳居榜首。然而,好景不长,不久后,另一款大模型Grok-3便以1412的总分微弱优势超越GPT-4.5,夺得榜首之位。

尽管如此,GPT-4.5的惊艳表现仍然给人们留下了深刻的印象。它不仅情商高,让人如沐春风,而且在智商测试中也表现出不俗的实力。虽然其线下测试智商为97,线上门萨测试智商为94,并未超越OpenAI的o1 Pro、o3 mini和o1-preview等前辈,但已经与人类平均智商水平相当。

在实际应用中,GPT-4.5也展现出了其独特的优势。有网友晒出了与GPT-4.5的对话记录,其中GPT-4.5对于用户意图的理解令人惊喜。例如,在面对一个关于国际象棋的粗俗玩笑时,GPT-4.5能够迅速接住梗并给出适宜的回答,而Claude Sonnet和Grok 3等模型则未能理解。

然而,GPT-4.5并非文武双全。在WebDev Arena实时AI编程竞赛中,GPT-4.5并未参赛,而OpenAI的模型表现也并非最佳。GPT-4.5的高昂使用成本也成为了其推广的一大障碍。与GPT-4o相比,GPT-4.5的API价格大幅上涨,令许多用户望而却步。

尽管如此,GPT-4.5的发布仍然具有重要意义。它是OpenAI从GPT-4o向GPT-5过渡的关键桥梁,旨在留住付费用户,防止其在GPT-5发布前转向竞争对手。同时,GPT-4.5的发布也反映了市场竞争的加剧,OpenAI面临着来自其他优秀模型的巨大压力。

未来,随着技术的不断进步和市场的不断变化,AI界或将迎来更多惊喜和挑战。而GPT-4.5作为其中的佼佼者,也将继续发挥其独特优势,为人们带来更多便利和惊喜。

荣耀GT2来袭:9000mAh大电池配骁龙8E,两千档新机能否逆袭红米?
作为新系列的首款机型,荣耀GT在曝光之初备受期待,被认为是最有希望挑战红米K80地位的产品。 据悉荣耀GT2将搭载骁龙8E处理器,看齐红米K90,而骁龙8E的性能经过一年时间的考验大家已经很清楚了,依然非常强…

2025-11-15

vivo S50系列火热预热 骁龙8Gen5芯片配潜望长焦及超声波指纹来袭
近日OPPO Reno15系列、荣耀500系列、vivoS50系列等几款待发新机均有不少爆料,其中OPPO已经率先定档(11.17发布),荣耀500也已经公布了外观(发布日期暂未公布),今日vivo S50…

2025-11-14