2024 年 12 月 19 日,谷歌发布了首个挑战 OpenAI o1 的 AI 推理模型 Gemini 2.0 Flash ThinkingAI无边IT之家。以下是相关介绍: 模型特点
快速的思考速度:解决一套考研数学题,Gemini 只用了 27.5 秒,而 OpenAI 的 o1 模型却花了 1 分 32 秒章显文博。 透明的推理过程:与 OpenAI 的 o1 和 o1 mini 不同,Gemini 2.0 允许用户通过下拉菜单访问其逐步推理,从而更清晰、更透明地了解模型如何得出结论,解决了人们对人工智能作为 “黑匣子” 运行的长期担忧小坦克麻麻。 强大的多模态能力:原生支持图像上传和分析,能够处理结合不同类型数据的场景,而 o1 最初是纯文本模型,虽然后来扩展到包括图像和文件上传分析,但 Gemini 2.0 在多模态方面的能力更具优势AI无边。 性能表现
在综合类别指标中排名第一,包括数学、代码、指令跟随、长 QA、创意写作等各个方面,其推理水平堪比物理、化学和生物学博士生AI无边。 存在的局限性
输入输出限制:仅支持 32000 个标记输入和约 8000 个标记的输出响应,相比之下,可能在处理较长文本或复杂任务时存在一定限制AI无边。 工具集成不足:目前还不支持与谷歌搜索落地,也不支持与其他谷歌应用和外部第三方工具集成,这在一定程度上影响了其应用的广泛性和便捷性AI无边。 实验性阶段限制:作为一个实验性版本,该模型的训练过程、架构、许可和成本的完整细节尚未公布,其在实际应用中的稳定性和可靠性还需要进一步观察和验证AI无边。