11位顶尖数学家发起AI挑战赛
获陶哲轩转发,arXiv上的一篇新论文正在引起巨大关注!
挤进前排后发现,原来这是一项由11位全球顶尖数学家发起的AI实验——
让AI在规定期限内,解决他们各自在真实研究过程中产生的10道“研究级”难题,以此探索“AI+数学”的能力边界。
而且走的还是高斯时代的路子——人类先证明出来,但先不公布答案和过程,等到了合适时间再公开,避免AI偷偷看答案。
以前这是一项为保护数学家证明自己优先解决某道问题的做法,而在AI时代却有了新玩法。
在陶哲轩看来,这项实验非常有意思:
当前“一次性”AI提示似乎难以解决这些问题,但它们已被人类领域专家攻克。可以预见,配备AI工具的其他领域专家也能解决其中相当一部分。这些问题的技术门槛相当高,非领域专家难以验证AI生成的任何输出结果。
因此在我看来,要让非专家解决其中任何一个问题都极具挑战性——当然,意外惊喜也并非不可能。在截止期限前,这项实验能否产生任何显著成果,将十分值得关注。
好好好,既然老陶如此安利了,咱这就开扒完整实验过程(doge)。网页链接
