游戏世界
业界动态 手游资讯 网游资讯 单机资讯 电竞资讯 动漫资讯 游戏设备 手机电脑 热点资讯

阿里云发布通义千问2.5,性能全面赶超GPT-4 Turbo

2024-05-09来源:互联网编辑:瑞雪

本报讯(记者 张伟)5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问最新开源的1100亿参数模型在

多个基准测评收获最佳成绩,超越meta的Llama-3-70B,成为开源领域最强大模型。

相比通义千问2.1版本,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此出色的成绩。

通义还发布了最新款开源模型,1100亿参数的Qwen1.5-110B,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。

通义的多模态模型和专有能力模型也具备业界顶尖影响力。通义千问视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越Gemini Ultra和GPT-4V,目前已在多家企业落地应用;通义千问代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。

通义大模型问世一年多来,还发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从通义APP、官网和小程序免费使用通义家族全栈服务。

《PUBG》又送百万奖金?为什么厂商都开始“撒钱”给二创
对于《PUBG》玩家来说,大的真来了。除了刚刚上线的新版本,近日,《PUBG》官方又开启了名为 “暖冬‘鸡’遇”的大规模生态活动,在寒冬里为游戏内容创作者带来一场盛宴。活动自11月初起分两轮连续开展,各平台的活

2025-11-10

讲武堂:时隔七八十年,保时捷竟然又上战场了?
在军迷圈里有一句流传甚广的说法:“永远不要问一家德国车企在二战期间做了什么”。毕竟,在各国的战争机器启动后,那些平日里为千家万户提供出行工具的车企,摇身一变成为坦克飞机的生产线并不是什么奇怪的事儿,而

2025-11-07

竞技升级!《太空杀》超级联赛重磅登场,SS8新赛季同步开启
11月7日《太空杀》迎来全新更新内容,此次游戏内推出全新赛事超级联赛、多项身份调整、四重福利活动及系统优化,为船员们带来更公平、更刺激的冒险体验。这里不仅有高手间的巅峰智斗,也有全民化的福利盛宴,即刻启

2025-11-07

《球球大作战》S11赛季11月1日开启,全新玩法夺宝大逃杀组队摸金
《球球大作战》S11赛季11月1日开启,全新玩法夺宝大逃杀组队摸金江湖风云再起,剑意涤荡战场!《球球大作战》S11全新赛季「剑心犹在」将于11月1日正式拉开帷幕!全新水墨风赛季通行证带着剑意来袭,超神之路进化光环助

2025-10-31

《侠义道II》新武侠,新心法
江湖浩渺,武道无涯。《侠义道II》全新心法系统将各派武学精髓淬炼升华,演绎至深境界,使其独成一套特别的修炼体系,为玩家提供更为多元化的游戏体验。少室山巅,佛光普照,其心法如古刹磐石,内息流转间自生磅礴伟

2025-10-28

一加Turbo系列新机将至:8000mAh大电池+骁龙8 Gen5,性能续航双突破
综合性能表现上,安兔兔评测跑分有望突破340万分,定位为高通产品线中的次旗舰平台,性能略低于骁龙8 Elite Gen5移动平台。 市场信息显示,一加有望成为该平台的首发品牌,新机或将归属于一加Turbo系列…

2025-10-22