李飞飞团队发布最新报告,中美顶尖模型差距仅0.7%

未来图灵 2025-04-08 16:03:17
据4月8日新智元消息称,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了2025年AI指数报告。 据报告显示,在AI模型开发数量上,2024年美国机构开发了40个值得关注的AI模型,远超中国的15个和欧洲的3个。但在模型性能方面,中国正迅速追赶。在MMLU和Human Eval等主要基准测试中,中美模型性能差异从2023年的两位数缩小至2024年的近乎相等。 从大模型竞技场表现来看,中国模型对美国领先地位的追赶趋势明显,同时,顶尖模型间竞争愈发激烈,排名第一和第十的模型得分差距从11.9%降至5.4%,前两名差距仅0.7%。此外,中国在AI论文发表和专利推出方面继续领先。 据了解在对AI的态度上,中国以83%的乐观占比位居全球主要国家和地区之首,认为AI产品和服务利大于弊,其后是印度尼西亚(80%)和泰国(77%)。美国(39%)、加拿大(40%)等国乐观情绪远低于中国。不过自2022年以来,美、加、法等原本对AI持怀疑态度的国家,乐观情绪显著增长,如美国增长4%、加拿大增长8%、法国增长10%。 报告还显示,AI模型在基准测试中的表现不断提升。2023年引入的MMMU、GPQA和SWE-bench等基准测试,在2024年见证了AI性能的大幅飞跃,得分分别提高18.8、48.9和67.3个百分点,部分场景下智能体甚至超越人类。同时,AI变得更高效、实惠和易获取。过去两年,受小模型性能提升驱动,达到GPT-3.5水平系统的推理成本在2022年11月至2024年10月间下降280倍。不过,AI在复杂推理任务中仍面临挑战,如在Plan Bench等测试中表现欠佳。此外,开源模型与闭源模型差距缩小,一年内部分基准测试性能差异从8%缩至1.7%,硬件成本每年下降30%,能效每年提高40%,降低了获取高级AI的门槛。 #李飞飞##斯坦福##大模型##ai##deepseek##人工智能##科技##多模态人工智能##开源##高校##AI##全球化发展##人工智能替代人工#
0 阅读:0
未来图灵

未来图灵

智能共创,共建未来