游戏世界
业界动态 手游资讯 网游资讯 单机资讯 电竞资讯 动漫资讯 游戏设备 手机电脑 热点资讯

超越Deepseek!文心大模型X1代码、数学、推理等能力大幅提升

2025-03-26来源:ITBEAR编辑:瑞雪

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,Humaneval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。

苹果小米新机首月销售亮眼:iPhone 17与小米17齐头并进创佳绩
IT之家 11 月 15 日消息,市场调查机构 CounterPoint Research 昨日(11 月 14 日)发布博文,基于最新中国智能手机周度销量追踪报告,苹果与小米凭借各自的旗舰新品,在上市首月的…

2025-11-15

《荒野大镖客:救赎》将登陆新主机平台 或带来技术特性升级
近日,关于经典开放世界游戏《荒野大镖客:救赎》即将登陆新一代游戏主机的消息引发了玩家热议。根据外媒报道,这款由R星开发的旧西部题材作品已通过ESRB分级,确认将推出PS5、Xbox Series X|S以及Switch 2平台的原生版本。尽管R星尚未正式宣布这一消息,但分级结果的出现几乎已坐实了移植计划的真实性。

2025-11-14

vivo Y500 Pro即将开售:低中端定位,影像突出,11月14日全新登场
屏幕保持打孔直屏,大小控制在6.67英寸,作为旗舰级护眼屏,分辨率提升到1.5K(2800*1260像素),像素密度为460 PPI,刷新率为120Hz,触控采样率在不同场景蛙有所变化,最低为130Hz,最…

2025-11-14