游戏世界
业界动态 手游资讯 网游资讯 单机资讯 电竞资讯 动漫资讯 游戏设备 手机电脑 热点资讯

OpenAI o3震撼发布:AGI时代的大门,是否已经敞开?

2024-12-21来源:ITBEAR编辑:瑞雪

在科技界的万众瞩目下,OpenAI于近日震撼发布了其最新成果——o3模型,这一发布不仅标志着人工智能领域的又一次飞跃,也再次巩固了OpenAI在全球AI竞赛中的领先地位。

发布活动选在了一个充满节日氛围的凌晨时分,OpenAI通过一场持续12天的直播活动,逐步揭开o3的神秘面纱。在这场直播的压轴环节,OpenAI的“奥特曼”团队带着o3闪亮登场,向全球观众展示了这款模型的强大能力。

o3的能力无疑是对现有所有模型的降维打击。在各种评测集中,o3的表现都令人咋舌。在软件工程考试(SWE-Bench Verified)中,o3取得了71.7%的优异成绩,超越了其前身o1。而在全球著名的编码竞赛平台Codeforces上,o3的得分高达2727分,相当于榜单上的第175名,这一成绩已经超过了99.99%的人类选手。

不仅如此,o3在数学和科学领域也展现出了惊人的实力。在AIEM 2024数学竞赛中,o3接近满分,这是AI首次达到如此高的水平。在博士级科学考试GPQA Diamond中,o3同样取得了显著的进步。在FrontierMath这一由60多位顶尖数学家开发的数学基准测试中,o3的成功率达到了25.2%,远超此前GPT-4和Gemini 1.5 Pro等模型的表现。

最引人注目的,莫过于o3在ARC-AGI基准测试中的表现。ARC-AGI旨在通过一系列抽象和推理任务来测试AI系统的能力,过去几代模型的评分一直很低,但o3却取得了87.5%的惊人成绩,这一成绩甚至超过了人类的阈值分数85%。

o3的发布不仅让科技界为之震惊,也让广大网友兴奋不已。在各大社交媒体平台上,关于o3的讨论热度持续攀升,网友们纷纷表示对OpenAI的创新能力表示赞叹。

然而,尽管o3强大无比,但目前仍属于“期货”状态,OpenAI仅对红队开放。不过,OpenAI已经基于o3训练了三个小尺寸的模型,其中o3-mimi预计将在1月底对外开放,但很可能是pro会员专属。

回顾这12天的直播活动,虽然有些日子略显平淡,但o3的发布无疑为整场活动画上了圆满的句号。这场马拉松式的直播不仅让观众见证了o3的诞生和成长,也再次证明了OpenAI在人工智能领域的领先地位。

真我neo 8新机曝光:8000mAh大电池+3D超声波指纹,2000元档性价比新选择
真我手机从2018年成立到现在,也是走过了7个年头,如今真我手机全球销量达到三亿,在全球范围内跻身手机圈的第一梯队,虽说份额还是差小米等品牌很多,可知名度已经起来了。在今年真我尝试冲击高端,发布的真我GT …

2025-11-14

大疆DJI Osmo Action 6首发体验:画质续航双飞跃,户外拍摄新神器
这里我展开讲解一下,由于Action6是方形CMOS这意味着它在正常16:9和4:3情况下像素是无法覆盖整个CMOS,但在二级菜单中我们能找到自由裁切模式,开启该模式后,Action 6的拍摄页面就会变成一…

2025-11-14

全RGB排列屏幕成新趋势,vivo新机或搭载,小米17 Pro Max已率先应用
据CNMO了解,近期发布的小米17 ProMax就搭载了全RGB排列屏幕。凭借超级像素技术,其子像素总数高达938万,与传统2K屏约920万的子像素数量基本持平。 小米总裁卢伟冰曾表示,在友商同级产品纷纷…

2025-11-14

iQOO新机屏幕升级再发力,多系列普及2K,小屏新品或将来袭
近日,博主@数码闲聊站的一份爆料中提到,“iQOO说了无2K不旗舰,接下来Neo系列和数字系列都「全面标配2K」,iQOO15那块三星屏也颇受好评,蓝厂明年应该也会和三星显示深度合作”。 也就是说,iQO…

2025-11-14