谷歌发布首个AI推理模型，挑战OpenAIo1？

2024 年 12 月 19 日，谷歌发布了首个挑战 OpenAI o1 的 AI 推理模型 Gemini 2.0 Flash ThinkingAI无边IT之家。以下是相关介绍：模型特点

快速的思考速度：解决一套考研数学题，Gemini 只用了 27.5 秒，而 OpenAI 的 o1 模型却花了 1 分 32 秒章显文博。透明的推理过程：与 OpenAI 的 o1 和 o1 mini 不同，Gemini 2.0 允许用户通过下拉菜单访问其逐步推理，从而更清晰、更透明地了解模型如何得出结论，解决了人们对人工智能作为 “黑匣子” 运行的长期担忧小坦克麻麻。强大的多模态能力：原生支持图像上传和分析，能够处理结合不同类型数据的场景，而 o1 最初是纯文本模型，虽然后来扩展到包括图像和文件上传分析，但 Gemini 2.0 在多模态方面的能力更具优势AI无边。性能表现

在综合类别指标中排名第一，包括数学、代码、指令跟随、长 QA、创意写作等各个方面，其推理水平堪比物理、化学和生物学博士生AI无边。存在的局限性

输入输出限制：仅支持 32000 个标记输入和约 8000 个标记的输出响应，相比之下，可能在处理较长文本或复杂任务时存在一定限制AI无边。工具集成不足：目前还不支持与谷歌搜索落地，也不支持与其他谷歌应用和外部第三方工具集成，这在一定程度上影响了其应用的广泛性和便捷性AI无边。实验性阶段限制：作为一个实验性版本，该模型的训练过程、架构、许可和成本的完整细节尚未公布，其在实际应用中的稳定性和可靠性还需要进一步观察和验证AI无边。