

谷歌周三正式发布了Gemini 2.0,这是该公司旗舰AI模型的最新升级。具体来说,谷歌正在推出继Gemini 1.5 Flash之后的“Gemini 2.0 Flash实验版”。b谷歌的Flash模型是其“轻量级”模型,专为不需要最强大的人工智能模型的任务而设计,更注重效率。不过,谷歌表示,Gemini 2.0 Flash不仅改进了Gemini 1.5 Flash等Flash型号,而且还改进了Gemini 1.5 Pro等更强大的型号。
谷歌表示,2.0 Flash在许多方面都优于1.5 Flash和1.5 Pro,包括通用的MMLU-Pro基准测试、三个不同的编码基准测试、一个事实测试、两个数学基准测试、推理基准测试、两个图像基准测试和视频基准测试。其中一些胜利接近1.5 Pro的性能,但其他表现出显着改善,例如Natural2Code基准提高了7.5分,或者HiddenMath基准提高了9分。1.5 Pro在音频基准测试(40.1% vs. 39.2%)和长上下文基准测试(82.6% vs. 69.2%)方面仍然优于2.0 Flash。
除了这些改进之外,谷歌表示2.0 Flash支持新的多模态输出,例如人工智能生成的图像与文本和文本到语音的音频相结合。此外,它还可以拉入谷歌搜索,运行代码,以及其他第三方功能。
不管你是否知道,你可能会看到很多双子座2.0的闪光。该公司宣布将使用Gemini 2.0进行搜索,特别是人工智能概述。b谷歌最初推出的人工智能搜索摘要无疑是一团糟。然而,该公司对这一功能表示乐观:谷歌表示,Gemini 2.0将使AI Overviews能够处理更复杂的主题和多步骤查询,以及高级数学、多模式问题(即从文本、图像、文档等查询)和编码等新功能。
2.0 Flash也将进入Gemini应用程序。事实上,它已经可以在桌面和移动网络体验中使用。在测试之前,您只需要从下拉菜单中选择模型。
谷歌正在宣传2.0 Flash作为其“代理时代”的一部分。这意味着谷歌希望它的产品能够代表你做更多的事情,无论是分析一个问题还是你周围的环境,还是真正为你完成一项任务。该公司表示,他们正在对b谷歌的研究部门Project Astra进行更新,该部门负责开发“通用人工智能助手”;项目水手,一个Chrome扩展,利用人工智能来帮助你,而浏览网页;朱尔斯,该公司的人工智能代理,帮助开发人员编写代码。
谷歌还强调了一项名为“深度研究”的新功能,这是一款人工智能研究助手,旨在分析主题并为你生成报告。你用你想调查的话题或问题提示机器人,它会制定一个研究计划供你批准或修改。一旦获得批准,它就会在互联网上寻找资源,并汇总成一份完整的报告,你可以导出到谷歌Docs。与AI Overviews一样,它包含指向其来源的链接,因此您可以自己查看它们。