游戏世界
业界动态 手游资讯 网游资讯 单机资讯 电竞资讯 动漫资讯 游戏设备 手机电脑 热点资讯

​三星自研AI性能基准测试工具TRUEBench上线,填补多语言多任务评估空白​

2025-09-26来源:快讯编辑:瑞雪

三星电子宣布推出一款自主研发的AI性能基准测试工具——TRUEBench,全称为“可信真实场景使用评估基准”(Trustworthy Real-world Usage evaluation Benchmark)。该工具由三星研究院开发,旨在填补现有AI基准测试工具在多语言支持和复杂任务评估方面的空白,为企业级AI应用提供更贴近实际场景的评估标准。

三星研究院在开发过程中发现,传统AI基准测试工具普遍存在两大缺陷:一是语言覆盖范围有限,主要聚焦英语环境;二是测试场景过于单一,多局限于单轮问答结构。而TRUEBench通过构建包含12种语言的测试体系,覆盖了从8个字符的简短指令到2万字符的长文档处理等多样化任务,形成了包含2485组测试集的评估框架。这些测试集被划分为10个大类、46个子类,涵盖内容生成、数据分析、文本摘要、跨语言翻译等10项核心企业任务。

该工具的评估机制采用AI与人类专家协同设计的自动评分系统,通过多维度参数构建可靠性验证模型。三星特别强调,TRUEBench的测试设计基于企业内部AI生产力提升的实践经验,能够更精准地反映AI模型在实际业务场景中的问题解决能力。目前,工具的数据样本及排行榜已在开源平台Hugging Face上线,用户可免费测试最多5个AI模型,并获取性能效率对比报告。

三星电子DX部门首席技术官兼三星研究院院长Paul (Kyungwhoon) Cheun表示:“三星研究院在真实业务场景中积累了深厚的AI应用经验,这使我们具备开发专业评估工具的独特优势。TRUEBench的推出不仅能为行业提供生产力领域的评估标准,也将进一步强化三星在技术创新领域的领导地位。”

AI智能眼镜风起云涌:10大品牌13款产品评测,透视行业现状与未来趋势
此次汇总包括HUAWEI华为、INMO影目、JBL、LAWK李未可、Lenovo联想、LEANTS乐蚁、RayNeo雷鸟创新、Ray-Ban雷朋、Soundcore声阔、Xiaomi小米共10个品牌13款AI…

2025-09-25

小米17系列9月25日震撼登场!影像电竞双突破,多版本满足多样需求
小米官方对新机进行了多方面预热,比如机身外观、影像、电池+快充、屏幕等方面,核心内容均预热。Pro系列采用长方形圆角设计,内设两大挖孔,均为摄像头,重点的是拥有一块小屏幕,官方称为妙享背屏。 电池方面,小米1…

2025-09-25

iQOO15新机来袭:2K三星珠峰屏搭配自研Q3芯片,性能影像续航全面升级
随着新一轮旗舰盛宴序幕的拉开,如今「iQOO 15」 已经进入了预热阶段,产品主题是“跨代领先”,目前官方已经公布了这款新机的部分核心配置,采用2K三星珠峰屏+自研Q3芯片,将为用户带来综合性能体验的再次突…

2025-09-24

小米17系列9月25日登场:三款新机外观配置明晰,对标苹果冲击高端
总的来说,小米17系列将延续小米冲击高端的野心,外观设计上追求极简与辨识度兼顾;电池与快充再次升级,带来超大容量与百瓦级体验;产品定位清晰分层,对标iPhone 17系列,可以满足不同用户需求;发布会背后,…

2025-09-23

联发科天玑9500深度评测:300亿晶体管加持,GPU性能再登巅峰
天玑9500提前省流:发哥的CPU单核和GPU性能,依然维持30%以上的提升;AI和光追性能,还在倍增级提升。 天玑9500工程机的AI性能强得很夸张,在跑本地AI翻译和AI摘要的时候,竟然可以1秒100多…

2025-09-23