11位顶尖数学家发起AI挑战赛获陶哲轩转发，arXiv上的一篇新论文正在引起巨

量子位看科技 2026-02-08 12:58:58

11位顶尖数学家发起AI挑战赛

获陶哲轩转发，arXiv上的一篇新论文正在引起巨大关注！

挤进前排后发现，原来这是一项由11位全球顶尖数学家发起的AI实验——

让AI在规定期限内，解决他们各自在真实研究过程中产生的10道“研究级”难题，以此探索“AI+数学”的能力边界。

而且走的还是高斯时代的路子——人类先证明出来，但先不公布答案和过程，等到了合适时间再公开，避免AI偷偷看答案。

以前这是一项为保护数学家证明自己优先解决某道问题的做法，而在AI时代却有了新玩法。

在陶哲轩看来，这项实验非常有意思：

当前“一次性”AI提示似乎难以解决这些问题，但它们已被人类领域专家攻克。可以预见，配备AI工具的其他领域专家也能解决其中相当一部分。这些问题的技术门槛相当高，非领域专家难以验证AI生成的任何输出结果。

因此在我看来，要让非专家解决其中任何一个问题都极具挑战性——当然，意外惊喜也并非不可能。在截止期限前，这项实验能否产生任何显著成果，将十分值得关注。

好好好，既然老陶如此安利了，咱这就开扒完整实验过程（doge）。网页链接

0 阅读：1

量子位看科技

感谢大家的关注

作者最新文章

1

：《年度AI产品十大赛道TOP 3｜量子位智库AI 100》年度AI产品十大

2

：《2025最强AI产品一文看尽丨量子位智库年度AI 100》 2025最强A

3

：《AI看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软x清华》 AI

4

：《教科书《性能之巅》作者入职OpenAI！迷弟总裁亲自欢迎》教科书《性能之

5

登顶GitHub热榜的记忆系统用Claude Code写代码的人，终于不用每次

6

中国第一批没有论文的工科博士毕业了国内博士毕业，居然不用死磕论文了！最近，Na

7

11位顶尖数学家发起AI挑战赛获陶哲轩转发，arXiv上的一篇新论文正在引起巨

8

：《小米给KV Cache减负80%！MiMo团队推出混合稀疏注意力架构》小

9

：《可灵3.0加入AI拜年战场！人在工位搓好莱坞大片，分镜逻辑封神》可灵3.

10

：《Nature认定的论文综述神器来了》 Nature认定的论文综述神器来了

热门分类

科技TOP

1

宇树机器人三上春晚，宇树机器人今后就是春晚界的“赵本山”，今年宇树机器人又会带给

2

华为第二代阔折叠机型曝光华为PuraX2终于要来了，华为这个产品其实挺有意

3

ProAir正式发布了：6.1mm厚，155g重，6.3寸屏幕小尺寸天

4

iPhone18标准版前瞻iPhone18标准版核心信息（概念图）一、发布时间

5

TikTok因应用程序的成瘾功能被指控违反欧盟规定TikTok、周五、被指控违反

6

这续航能力绝对是实力霸榜呀！新评科技最新测试续航榜单出来了。荣耀三款万级超大电池

7

国补后：1869起售！！REDMITubroMax价格来了：12+256

8

鸿蒙微信消费者版本邀请内测8.0.15.161.设置-朋友权限新增“添加我的

9

宇树机器人的主要供应链曝光了，果然，制造业是一个大的生态，一荣俱荣。#宇树#

10

我去小米澎湃OS3深夜上热搜。

科技最新文章

1

【苹果新品发布会或3月初举办】iPhone17e或维持上代相同起售价2月8日，

2

荣耀Magic8系列的用户先别着急睡觉，这两天你们的手机会被塞进一个1.11G的

3

苹果的入门级真香机iPhone17e要来了！2月19日直接发新闻稿官宣，3月初

4

#全球首个大型机器人晚会#《机器人奇妙夜》节目单来了，大家可不要小看这个全球首场

5

华为Mate80系列销量目前已经来到了280.32万台，预计下周即可突破300

6

各有两家大厂正在评估7英寸巨屏新机，咱就是说这波直接戳中巨屏党的心了！电池容

7

OPPOFindX9Ultra正式入网工信部了，3月就要发布，这影像堆

8

马斯克确认SpaceX正在推迟火星计划，转而优先推进月球任务。SpaceX目前的

9

听我一句劝！千万别脑子一热就选错，荣耀的中高端旗舰还得看这四款，每一款都特点鲜明

10

华为第二代阔折叠机型曝光华为PuraX2终于要来了，华为这个产品其实挺有意