#模型读到一万tokens就失智##上下文太长大模型会降智# 上下文扩展至1万t

量子位 2025-07-17 14:31:08

#模型读到一万tokens就失智##上下文太长大模型会降智# 上下文扩展至1万tokens，LLM集体“失智”！且“智商”不是均匀下降，而是在一些节点突然断崖式下跌。比如Claude Sonnet 4，就是在1000tokens后准确率一路下滑，从90%降到60%。或者是下降后放缓再下降，比如GPT-4.1和Gemini 2.5 Flash。最终，当上下文长度来到1万tokens，大家都只剩50%准确率。这也就意味着，大模型在读同一本书第10页和第100页时的“智商”可能不一样。并且不同大模型在“读这本书”时突然降智的页数也不同。 GPT-4.1可能读到第10页就“失智”了，Claude兴许能坚持到第100页。这是Chroma团队的最新研究结论，他们用升级版“大海捞针”（NIAH）测试了包括GPT-4.1、Claude 4、Gemini 2.5和Qwen3等在内的18个开源和闭源的主流大模型。结果显示，随着输入长度的增加，模型的性能越来越差。实验还首次系统性地揭示了输入长度对模型性能并非均匀影响，不同模型性能可能在某一tokens长度上准确率发生骤降。这项工作得到了网友的肯定： This effect is well known but not well documented so far, so great job here. 这种效应虽然广为人知,但至今尚未得到充分记录,因此你的工作非常出色以往人们或许会遇到当输入长度增加时大模型会出现性能不佳的情况，但并没有人深入探究过这个问题。目前代码已开源，感兴趣的小伙伴可点击：github.com/chroma-core/context-rot

0 阅读：0

关注前沿科技资讯，追踪人工智能动态

作者最新文章

1

#所有AI都将殊途同归##AI都在学习同一种通用语义# 所有的AI模型可能都殊途

2

#iPhone17Pro配色##iPhone17Pro橙色# iPhone 17

3

#iPhone折叠屏参数曝光##iPhone折叠屏好贵# iPhone折叠屏，最

4

#生成式AI席卷游戏圈##每五款游戏就有一款用AI# 据统计，2025年Stea

5

#开源机械手##1600元做个机械手# 介绍一款开源机械手——AmazingHa

6

【#建站小技巧#】#如何正确设置爬虫协议# 很多人建站，robots.txt爬虫

7

#GeminiAPI能用Veo3了##GeminiAPI的Veo3每秒烧掉5块钱

8

#Anthropic偷偷收紧使用限制##ClaudeCode套餐限额大缩水# 没

9

#Gemini论文藏彩蛋##Gemini论文竟有3295名作者# 3295人的作

10

#如何成为机器学习工程师##机器学习自学资源# 自学机器学习成才，还能受邀回到母

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

小米YU7价格25.35万，27.99万，32.99万三个版本，最推荐入门版本，

2

2025下半年新机打架谁是你的菜？

3

一万买的华为pura80pro+还没捂热夫妻吵架给砸了一个老主顾半夜联系我

4

朝鲜的Mate50[doge][doge][doge]

5

荣耀线下店基本全面铺货，趁着周末去摸了摸荣耀X70，跟我想的有点不一样上手真

6

有部分汽车博主在本周末被集体禁言，就有车圈司马南之称的那位经期博主在弹冠相庆。话

7

二季度小米手机全球市场份额第三小米第三就算了，第一的竟然不是苹果，而是三星，这

8

提前给大家看下荣耀MagicV5的真机~和iPhone对比，也只是稍微厚一点点

9

目前来看，iPhone17系列只要你不选标准版，大概率是怎么选都不会后悔，当然

10

9月份集体硬刚iPhone？你更期待哪款？9月份就是新一轮旗舰机，集体硬刚i

科技最新文章

1

还是自研芯片有底气，采用了玄戒O1的小米15SPro手机给芯片性能面板

2

重大消息，荣耀Magic7系列迎来了又一次重磅系统更新这次的182版本主要加入

3

朋友最后还是没忍住，入手了最新的荣耀MagicV5大折叠，截图给我看了眼订单，

4

Ai伴侣来了。马斯克旗下的xAI最新推出的Grok智能伴侣Ani，在好感度达到3

5

二季度小米手机全球市场份额第三小米第三就算了，第一的竟然不是苹果，而是三星，这

6

中美芯片大战，日本人突然发现了一个重大的秘密！美国靠着尖端芯片死磕中国，而中国呢

7

晚了！美国批准英伟达H20芯片出口！根据媒体7月15号报道，黄仁勋在接受采访时高

8

荣耀再一次掀桌子，大家都别玩了荣耀X70只要1399顶配版是12G+512G

9

9月份集体硬刚iPhone？你更期待哪款？9月份就是新一轮旗舰机，集体硬刚i

10

分享三个同事的手机锁屏～找了隔壁同事的手机看锁屏分别是OPPOfi