deepseek 挑战deepseek
就在刚刚 (北京时间 3月26日 凌晨 1 点),一系列关于 新模型 Gemini 2.5 Pro 的消息发布:
谷歌Gemini 2.5 Pro模型在推理和代码能力上取得了显著提升,迅速登顶各大榜单,尤其是在复杂任务和多种基准测试中表现出色,创造了历史最高分数飞跃。该模型具备统一的推理能力和原生多模态能力,支持超长上下文,能够处理文本、音频、图像等多种信息源。
Arena 排行榜: 根据 Imarena.ai 数据,Gemini 2.5 Pro 登顶榜首,创下+40分最大分数跃升记录,并在所有类别领先。
WebDev Arena: 同时在 Web 开发榜单排名第二,表现与 Claude 3.5 Sonnet 相当。
编码能力: 官方介绍其(实验版)为目前最先进编码模型,擅长 Web 应用、Agentic 编程及代码编辑。