阿里通义千问3登顶全球权威开源模型测评榜

巴适财经• 2025-05-06 16:12:23•简讯•阅读 2

记者5月6日获悉，**权威大模型测评榜LiveBench公布了**一期排名，阿里巴巴开源的新一代通义千问模型Qwen3（简称“千问3”）斩获全球开源模型**，并在指令遵循（Instruction Following）这一关键能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等**闭源模型，位列全球**。

据了解，LiveBench榜单由图灵奖得主、Meta**AI科学家杨立昆（Yann LeCun）联合纽约大学等机构推出，从数学、推理、编程、语言理解等多个复杂维度**评估大模型。因其采用动态更新的题库，被誉为“全球**无法作弊的模型基准测试”。（上证报）

标签：快讯/

Palantir盘前大跌，Q1业绩好于预期，但分析师认为每股收益增速将放缓

上一篇2025-05-06

建邦高科冲刺港股：年营收39.5亿，沙特阿美与晶科能源是股东

下一篇 2025-05-06

高新兴：算力投资标的传佳绩标的公司成立仅2月实现近3亿收入
2024年2月28日晚间，高新兴发布投资进展公告，公告中透露了其投资的图灵新智算（广州）科技有限公司（以下简称“广州图灵”）取得了显著的业绩。广州图灵自去年11月初成立以
2025-05-06 16:12:23
1287
简讯
简讯
2025-05-06 16:12:23
292
MEET48 上线 WEB3感谢祭并限时推出 GIPR2活动 Top16 偶像盲盒NFT，9月23日截止
8月20日消息，据官方消息，MEET48 已上线WEB3感谢祭，推出GIPR2活动TOP16的特别偶像盲盒NFT。这些盲盒内含未曾发布的稀有偶像照片，用户可通过完成MEET48 网页或APP内任
2025-05-06 16:12:23
165
Circle IPO冲刺50亿美元估值，稳定币有概念股了？
2025 年 3 月 31 日，加密货币行业迎来一则重磅新闻。据《财富》杂志报道，美元稳定币 USDC 的发行方 Circle 正在紧锣密鼓地推进其 IPO 计划，现已聘请摩根大通和花旗
2025-05-06 16:12:23
156
第七届进博会｜首发经济，不只是一场消费盛宴
题：新华社经济随笔：首发经济，不只是一场消费盛宴　前六届进博会，近2500项代表性首发新产品、新技术、新服务亮相，不少展商在中国开出新门店、新工厂、新研发中心。
2025-05-06 16:12:23
155
越南知名互联网论坛XAMVN即将通过Tokenfi Launchpad平台发行其专属代币
TokenFi 宣布与越南最大的互联网论坛 XAMVN 达成战略合作，XAMVN 将通过 TokenFi Launchpad 独家推出原生代币。据悉，XAMVN 成立于 2017 年，是越南最大和最知名的网站
2025-05-06 16:12:23
133
上半年饮料业务破百亿统一仍在“吃老本”
统一企业中国提到，“统一鲜橙多”“海之言”“统一果漾”“统一冰糖雪梨”“元气觉醒”为主要品牌。值得注意的是，在农夫山泉的带动下，近年来NFC果汁异军突起，统一、
2025-05-06 16:12:23
125
观点：比特币价格或于2025年1月特朗普就任总统时升至10万美元
加密货币托管公司 Copper.co 的研究主管 Fadi Aboualfa 认为，到 2025 年 1 月 20 日特朗普就任总统时，比特币的价格可能会达到 10 万美元，他补充说，这些上涨“是在美
2025-05-06 16:12:23
109

阿里通义千问3登顶全球权威开源模型测评榜

相关推荐