谷歌放出最强大模型狙击OpenAI,重心转向AI智能体|界面新闻 · 科技

谷歌放出最强大模型狙击OpenAI,重心转向AI智能体|界面新闻 · 科技

禹语嫣 2024-12-12 数据和表 2 次浏览 0个评论

界面新闻记者 | 肖芳

界面新闻编辑 | 宋佳楠

继发布最强量子芯片之后,谷歌又在AI上作出重要举动。

北京时间1212凌晨 ,谷歌赶在OpenAI宣布ChatGPT正式登陆iPhone之前 ,发布了全新模型Gemini 2.0 。

谷歌CEO桑达尔·皮查伊,这是谷歌迄今为止最强大模型 。凭借原生图像和原生音频的输出多模态方面的提升,Gemini 2.0能够构建的AI智能体 ,谷歌离构建通用助手的愿景更进一步。

需要指出的是,Gemini 2.0主要开放给开发者以及受信任的测试人员。目前,Gemini 2.0 Flash体验版模型已经面向所有Gemini用户开放 。

Gemini 2.0 Flash是建立在1.5 Flash基础之上的模型 ,此前1.5 Flash是谷歌最受开发者欢迎的版本。与1.5 Flash相比,Gemini 2.0 Flash在同样快速的响应时间下性能进一步增强。谷歌方面称,2.0 Flash在关键基准测试中甚至超越了1.5 Pro ,其速度是1.5 Pro的两倍 。

谷歌放出最强大模型狙击OpenAI,重心转向AI智能体|界面新闻 · 科技

同时2.0 Flash还具有新功能 ,除了能够支持图片、视频和音频等多模态输入,还可以支持多模态输出,比如可直接生成图像与文本混合的内容 ,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用Google Search 、代码执行以及第三方用户定义的函数等工具。

全球Gemini用户现在可以在电脑端和移动端体验基于2.0 Flash优化后的聊天对话 ,并且该版本将很快在Gemini移动应用中推出 。基于这个新模型,用户还可以体验到Gemini助手。明年初,谷歌还会将Gemini 2.0扩展到更多产品中。

Gemini 2.0最大的变化在于重心转向AI智能体 ,想要做所有AI智能体基座模型 。基于此,Gemini 2.0开发出了一系列原型,这些原型能够帮助用户完成相应任务。

其中 ,Project Astra的升级版,用于探索未来通用AI助手能力的研究原型。自从在Google I/O大会上推出Project Astra以来 ,谷歌一直向那些在Android手机上使用它的受信任的测试人员收集反馈 。此次推出升级版可以实现多种语言和混合语言之间对话 ,也可使用 Google Search 、Google Lens和Google Map新工具,能够记住长达10分钟的会话内容,可以近于人类对话的延迟来理解语言 。

全新的Project Mariner从浏览器入手探索人与智能体交互的未来发展。Project Mariner 使用了Gemini 2.0构建的早期研究原型 ,能够理解和推理浏览器页面中的信息,包括像素和文本、代码、图像和表单等网页元素,然后通过实验性的Chrome扩展程序帮助用户完成相应任务。此次升级 ,Project Mariner改进原来速度较慢问题 。

简而言之 ,用户可以用这项功能让浏览器自己去帮你完成特定任务,例如批量查找某些网站上邮箱地址,从而在一定程度上实现浏览器的“自动运行 ”。

Jules则面向开发者编码智能体 ,它可以直接集成到GitHub工作流程中来协助开发者完成开发任务。

在谷歌的演示视频中,演示人员输入了一长串含有详细编程问题的提示语,之后Jules会对这些要求进行分析 ,给出一个三步的编程解决方案,待点击同意后,模型就会开启自动编程 ,生成代码 。这无疑有助于开发者进一步提升工作效率。

去年年底,谷歌发布了Gemini 1.0模型,主要能力整合和理解信息。而Gemini 2.0能让信息变得更加有用 。桑达尔·皮查伊表示 ,Gemini 2.0的进展得益于谷歌长达10年全栈式AI创新研究的投入,基于谷歌定制的硬件第六代TPU Trillium构建而成。

就在谷歌以最强大模型吸睛之时,OpenAI为期12天的产品发布活动仍在进行。同一天 ,OpenAI展示ChatGPT与苹果Apple Intelligence的整合 ,内容略显平淡 。谷歌Gemini 2.0的突然发布,显然抢了不少OpenAI风头。

Gemini 2.0加持,谷歌一口气推出三款智能体产品 ,意味着微软绑定OpenAI 、亚马逊与Anthropic竞争迈出重要一步。

智能体已经成为大模型领域竞争的核心方向 。所谓智能体,是指能够感知环境、进行决策并采取行动以实现特定目标的系统,被视作大语言模型(LLM)落地应用的关键载体 。

近两个月前 ,微软曾连发10个AI智能体,面向销售、运营等场景,随后又宣布Copilot Studio平台已支持用户构建自主智能体 ,同时发布5款预构建的智能体。而刚刚结束2024 re:Invent,亚马逊一口气发布6大模型,其中Amazon Nova Premier同样是多模态大模型 ,专为复杂推理任务而生。

无论在消费还是企业场景中,AI智能体较多想象空间,商业化前景也较为明确 。多位业内人士预计 ,2025将是AI智能体商用爆发之年。届时 ,谷歌 、OpenAI等科技巨头围绕智能体的竞争势必将愈发激烈。

你可能想看:

转载请注明来自植物生态学报,本文标题:《谷歌放出最强大模型狙击OpenAI,重心转向AI智能体|界面新闻 · 科技》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,2人围观)参与讨论

还没有评论,来说两句吧...

Top
网站统计代码