李飞飞团队发布最新报告，中美顶尖模型差距仅0.7%

未来图灵 2025-04-08 16:03:17

据4月8日新智元消息称，由李飞飞联合领导的斯坦福大学以人为本人工智能研究所（Stanford HAI）发布了2025年AI指数报告。据报告显示，在AI模型开发数量上，2024年美国机构开发了40个值得关注的AI模型，远超中国的15个和欧洲的3个。但在模型性能方面，中国正迅速追赶。在MMLU和Human Eval等主要基准测试中，中美模型性能差异从2023年的两位数缩小至2024年的近乎相等。从大模型竞技场表现来看，中国模型对美国领先地位的追赶趋势明显，同时，顶尖模型间竞争愈发激烈，排名第一和第十的模型得分差距从11.9%降至5.4%，前两名差距仅0.7%。此外，中国在AI论文发表和专利推出方面继续领先。据了解在对AI的态度上，中国以83%的乐观占比位居全球主要国家和地区之首，认为AI产品和服务利大于弊，其后是印度尼西亚（80%）和泰国（77%）。美国（39%）、加拿大（40%）等国乐观情绪远低于中国。不过自2022年以来，美、加、法等原本对AI持怀疑态度的国家，乐观情绪显著增长，如美国增长4%、加拿大增长8%、法国增长10%。报告还显示，AI模型在基准测试中的表现不断提升。2023年引入的MMMU、GPQA和SWE-bench等基准测试，在2024年见证了AI性能的大幅飞跃，得分分别提高18.8、48.9和67.3个百分点，部分场景下智能体甚至超越人类。同时，AI变得更高效、实惠和易获取。过去两年，受小模型性能提升驱动，达到GPT-3.5水平系统的推理成本在2022年11月至2024年10月间下降280倍。不过，AI在复杂推理任务中仍面临挑战，如在Plan Bench等测试中表现欠佳。此外，开源模型与闭源模型差距缩小，一年内部分基准测试性能差异从8%缩至1.7%，硬件成本每年下降30%，能效每年提高40%，降低了获取高级AI的门槛。 #李飞飞##斯坦福##大模型##ai##deepseek##人工智能##科技##多模态人工智能##开源##高校##AI##全球化发展##人工智能替代人工#

0 阅读：0

智能共创，共建未来

作者最新文章

1

DeepSeek倒逼阿里员工春假无休？

2

估值16亿的AI公司竟是空壳？创始人虚报300%营收，微软、亚马逊成冤大头？

3

博主质疑宇树科技Go1机器狗“后门”危机，官方调查坐实安全漏洞！

4

200亿协议摇摇欲坠！苹果AI搜索突袭，谷歌慌了，国内厂商笑了？

5

苹果AI“难产”终有望？iOS 18.6携手百度、阿里破局国行

6

惊变！马斯克胜诉，OpenAI放弃“变现梦”？

7

腾讯三年500 亿vs字节收缩战线，谁赢？

8

太意外了！DeepSeek被福布斯AI 50强拒之门外？

9

王小川坦言百川智能失误：前期扩张无度，今押宝AI医疗能否逆袭？

10

李飞飞团队发布最新报告，中美顶尖模型差距仅0.7%

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

不对劲，华为Mate70系列怎么了，好像用的人不多啊。相对而言，Pura70系列

2

同是骁龙8Gen3，荣耀400Pro还是荣耀Magic6荣耀Magic6和

3

华为官网公布了HarmonyOS5.1系统升级计划。适配范围覆盖旗下全系列重磅

4

华为mate40PRO内存升级，看来又可以再战几年了

5

iPhone11，电池容量3110mAhiPhone12，电池容量2815

6

一觉醒来用红米手机的学生天塌了！山东科技大学，禁止使用红米手机参加考试，网友

7

华为Pura80Ultra将是今年最大的底前段时间华为发布的Pura8

8

黄仁勋评价中国芯片！！最近，某大佬谈了中国芯片的情况；我们看到，确实通过不懈

9

山东一大学禁用红米手机考试？红米足以应付各种在线考试？！首先我

10

在二手平台看上一台13proMax512G3700多，大家帮忙看看还值不

科技最新文章

1

短短2天，罗马仕态度来了个180度大转弯，6月14日说自己坚持严格品控标准，没想

2

同是骁龙8Gen3，荣耀400Pro还是荣耀Magic6荣耀Magic6和

3

黄仁勋评价中国芯片！！最近，某大佬谈了中国芯片的情况；我们看到，确实通过不懈

4

在二手平台看上一台13proMax512G3700多，大家帮忙看看还值不

5

华为Pura80Ultra将是今年最大的底前段时间华为发布的Pura8

6

麒麟9030芯片会有哪些提升？虽然Pura80系列没有看到麒麟9030，用的

7

山东一大学禁用红米手机考试？红米足以应付各种在线考试？！首先我

8

一觉醒来用红米手机的学生天塌了！山东科技大学，禁止使用红米手机参加考试，网友

9

华为官网公布了HarmonyOS5.1系统升级计划。适配范围覆盖旗下全系列重磅

10

iPhone11，电池容量3110mAhiPhone12，电池容量2815