DeepAgent与DeepSearch双双霸榜!指向openJiuwen新兴开

AI科技事 2026-02-14 10:40:45

DeepAgent与DeepSearch双双霸榜!指向openJiuwen新兴开源项目 炸裂!AI圈又出狠角色了! 2026开年刚过,AI智能体赛道就炸出王炸级新闻:基于openJiuwen的DeepAgent和DeepSearch,一口气拿下GAIA通用智能基准和BrowseComp-Plus深度研究基准两大权威榜单的榜首,直接把英伟达Nemotron这类老牌选手甩在了身后。 先说说这俩榜单的含金量。 GAIA是Meta和Hugging Face联手打造的“智能体高考卷”,覆盖长程规划、工具调用、复杂推理等12项核心能力,Level3难度已经和人类日常工作任务看齐,GPT-4加了插件也就拿15%的分数,而DeepAgent直接冲到91.69%,几乎追平人类参与者的平均成绩。 随便拎个实战场景,用户给一句“照着YouTube做菜视频买食材”,DeepAgent就能自动解析视频里的食材清单,去电商网站逐项搜同款比价加购,整个流程一气呵成,完全不用人类插手。 另一边的BrowseComp-Plus榜单,专门考验智能体的深度搜索硬实力,要从海量信息里扒出有效内容、排除干扰还得形成精准结论。 DeepSearch以80%的准确率登顶,意味着它能搞定多跳检索、跨源信息整合这类棘手任务,再也不用人类反复翻网页找资料。 能做到这个成绩,openJiuwen这个开源底座功不可没。 它天生就是为多智能体协同和自我进化设计的,给智能体装了会成长的“数字大脑”,不仅能在长任务里保持思路不跑偏,还能在执行出错时自动复盘修正,越用越聪明。 现在它已经落地华为云鸿蒙智能体平台,金融、制造这类刚需行业也开始用它搭建生产级智能体,把复杂任务拆解成自动化流程。 现在AI智能体赛道已经分出了明显的分水岭,一边是只会聊天的“花瓶选手”,另一边是能规划任务、调度工具、稳定干活的“实干派”。 openJiuwen把后者的开发门槛拉到了普通人触手可及的地步,以后不管是新手开发者还是资深团队,都能在这个底座上快速搭出自己的专属智能体。 你们觉得这个开源项目会不会掀起智能体开发的新热潮?或者你最想用它搭个啥智能体来解放自己?快来评论区唠唠!

0 阅读:0
AI科技事

AI科技事

感谢大家的关注