“AI竞赛落后一步的谷歌,开始全线反击。


编辑:Poetry |




北京时间5月11日凌晨,2023谷歌 I/O 大会正式举办,本次发布会,在生成式人工智能热潮的席卷之下,人工智能的影子遍布整场谷歌 I/O 大会。


发布会现场,谷歌发布了第二代大语言模型AI语言模型PaLM 2,基于新训练模型升级而来的生成式AI Bard,以及集成了生成式AI能力的“试验版”谷歌搜索以及智能云等产品。


“AI正在度过忙碌的一年”,谷歌和谷歌母公司Alphabet首席执行官桑达尔皮查伊说道。


当然,人工智能技术以及软件产品的突破外,本届发布会也带来了谷歌首款折叠机Pixel Fold、家庭平板Pixel tablet以及入门级的Google Pixel 7a。


01

PaLM 二代模型


首先,谷歌给出了自己对标 GPT-4 的大模型 PaLM 2。根据介绍,他们用了大量数学和科学数据集对 PaLM 2 进行训练,相比 2022 年的 PaLM 模型,PaLM 2 在多语言处理、推理和编码能力上有了很大的提升

根据官方测试,PaLM2 的部分结果(例如数学)比 GPT-4 还要好。谷歌对 PaLM 2 做了算法优化,使得它在体积上比 PaLM 要小,但整体性能更好,计算效率更高。


PaLM 2 支持 100 多种不同的语言和 20 多种编程语言,包括 JavaScript、Python、Prolog、 Verilog、Fortran 等,支持多模态的 PaLM 2 还能看懂和生成音视频内容。


谷歌在大会上展示了一个名为 Med-PaLM 的专为医疗领域微调的模型,可以根据 X 光片分析病人伤势,谷歌称其在这方面已经达到人类医生的水平。


PaLM 2 模型还可以「拆分」成不同大小的 4 种版本:Gecko(壁虎)、Otter(水獭)、Bison(野牛)和Unicorn(独角兽),在各种设备上部署。例如在智能手机上就可以运行规模比较小的 Gecko 模型,让移动端也能拥有大语言模型。

PaLM 2 目前已经开放预览,谷歌自家的聊天机器人 Bard 已经用上了 PaLM 2 模型,增强自己的作答能力。谷歌内部已经有超过 70 个产品团队在使用 PaLM 2 构建产品,本场大会上绝大部分更新都是基于 PaLM 2 模型设计而来,可以说 PaLM 2 就是谷歌全面 AI 化的核心引擎。


除了 PaLM 2,谷歌CEO 桑德尔皮查伊还稍微了剧透了一点下一代大模型 Gemini(双子座)的消息,他称 Gemini 旨在实现多模态、高效和为未来创新而构建。

Gemini 是 Google Brain 和 DeepMind 两个顶尖 AI 团队合并后共同开发的全新模型,从命名上可以看出,Gemini 将会集二者之所长,有望挤入最强大的大语言模型之列。


02

Duet AI:办公全家桶新升级


此前,微软Copilot把GPT-4整进了全系办公产品,掀起了震惊全世界的办公软件革命。


在此次I/O主题演讲期间,谷歌宣布了它为Docs、Sheets、Slides、Meet和Gmail带来的AI工具套件的新名称:Duet AI,给谷歌办公全家桶Workspace来了一个全新升级。

谷歌希望,生成式AI能让Gmail、Docs、Sheets和Slides更有用,不过目前,大部分功能还在开发中。


Duet AI会涵盖谷歌的各种办公软件,包括在文档和Gmail中的写作辅助、幻灯片的图片生成、Meet的自动会议摘要等等。


在文档中,只要点「Help me write」,Duet AI就能自动帮你生成招聘启事。

在Google Slids中,Duet AI能直接从幻灯片中的文本生成图像。

简单描述一下,合意的图片立马生成。

想做一个遛狗业务的收费表?描述一下,它就给你自动生成。

而写作辅助也会应用在移动端的Gmail上,这是对Smart Compose的升级。


现在,虽然这些工作区功能可以撰写电子邮件或从幻灯片中的文本生成图像之类的操作,但目前仅适用于注册其候补名单的用户


好消息是,现在任何人都可以申请加入候补名单了,不过目前尚不清楚用户何时可以访问。谷歌的说法是,将在未来几周内将服务扩展到「更多的用户和国家」


03

Bard全新升级


说到Bard,谷歌宣布其人工智能聊天机器人现在可供所有人使用,无论是否在候补名单上。该公司还增加了许多新功能,例如支持日语和韩语,以及将生成的文本导出到Google Docs和Gmail的更简单方法。


还有新的暗模式和可视化搜索功能,谷歌计划在未来添加更多功能。这包括使用Adobe的AI图像生成器Firefly的AI图像生成,以及与OpenTable和Instacart等第三方服务的集成。


皮查伊表示,现在的谷歌 Bard 已经完全运行在了新一代模型 PaLM 2 上


「PaLM 2 模型在逻辑和推理方面比以往的模型更加强大,这要归功于对逻辑和推理的广泛训练,」皮查伊表示。「它还接受了跨越 100 多种语言的多语言文本训练。」


Bard 将在回复和给出更复杂提示后给出更加直观的内容。除了文本之外,可以获得更有意义的回复,以及丰富的视觉内容。

和 GPT-4 一样,可以在要求中附加图像和文本。比如像这样,为这张照片想一个有趣的标题:

Bard 一直仅限于英国和美国使用。谷歌这次直接宣布 Bard 覆盖全球 180 个国家和地区,并取消了候选名单,现在立即人人可用。在语言方面,谷歌这次增加了日语和韩语,预计会在今年 7 月让 Bard 支持全球「使用量排名前 40」的语言


04

谷歌AI搜索已来


谷歌搜索正在以称为AI快照的形式进行重大更新。选择加入名为搜索生成体验 (SGE) 的新功能后,将开始在某些查询的搜索结果顶部看到 AI 支持的答案,这可以为搜索提供更多上下文。然后,可以使用后续问题缩小快照中的信息范围。


它能够提供问题回答的摘要,比如问「为什么酵母面包仍然如此受欢迎?」,谷歌搜索就给出几段详细描述酵母的味道、其益生元能力的优势等等。


另外,在生成内容旁,给出了3个链接,以证明摘要中的内容。这样以减少AI在生成内容上出现「幻觉」问题。

可以看到,这是谷歌搜索结果页面的new look。把AI生成内容放在最开始。


但比起重新设计的微软必应,搜索结果顶部的AI框对谷歌来说更像是,一个小小的更新。


这些AI快照由Google大型语言模型(LLM)的更新版本PaLM 2提供支持。新模型已经为25项谷歌服务提供支持,并在推理、编码和翻译方面进行了改进。


值得注意的是,并非所有搜索都会有AI生成的答案。只有当谷歌的算法认为它比标准答案更有用时,AI内容才会出现,而像健康、财务等敏感主题完全不会有AI生成。


05

人工智能全面加入


AI不仅仅是加入了谷歌搜索。谷歌宣布,它还将为Android带来新的人工智能功能。其中一个功能称为Magic Compose,将存在于Android的消息应用程序中,它是一种基于 AI 生成模型的工具,让你在回短信的时候根据聊天内容获得大量提示。

它会学习用户的说话方式,也可以让回复内容看起来有不同的语气,或者用莎士比亚的风格来写。


它还添加了一项功能,可使用AI创建自己的壁纸。很快就可以从一组预制选项中进行选择,然后设备将使用Google的文本到图像扩散模型生成图像。

此外,谷歌将在下个月推出一项Pixel独家功能,可使用新的“电影壁纸”自定义设备,从而增加现有照片的深度。


还有一项酷炫的更新——Magic Editor


这是谷歌最新公布的照片处理功能,使用生成性AI,可以让用户在没有专业工具的情况下对照片进行各种编辑。例如增强天空,移动人或物体以及摆脱背景中的人物。


比如下面这张,Magic Editor一键把瀑布前的人像挪到了侧面,还把背景中别的游客p掉了。不仅如此,本来多云的天气也给p蓝了。

这项功能对照片本身的理解是革命性的。但目前还没有办法使用,谷歌表示:这项功能将在今年下半年为部分Pixel用户提供抢先体验。


06

Pixel阵容的三个新成员


谷歌的Pixel硬件在主题演讲中占据了中心位置,因为该公司推出了三款新产品:Pixel Fold,Pixel Tablet和预算友好的Pixel 7A

售价1799美元的Pixel Fold标志着谷歌首次进入可折叠领域,其特点是5.8英寸OLED外屏展开,露出更大的7.6英寸显示屏,也是120Hz刷新率的OLED面板。


还有新的11英寸Pixel平板电脑,售价为499美元。该设备既可以用作典型的平板电脑,也可以用作智能显示屏,这要归功于随附的磁性充电座,可兼作扬声器。


最后,谷歌更新了其中端A系列阵容,增加了Pixel 7A。就像Pixel Fold和Pixel Tablet一样,该设备采用Google的Tensor G2芯片,以及6.1英寸1080p显示屏,最高可达90Hz。这款手机的基本版本售价499美元,但一些运营商将提供更昂贵的549美元选项,支持毫米波(mmWave)。


还有新的Wear OS 4将于今年晚些时候上市。


尽管Wear OS 3尚未完全推出,但Google已经为Wear OS 4做好了准备。谷歌宣布,更新后的操作系统将具有更长的电池寿命,用户备份和恢复手表的一种方式,以及新的辅助功能。


此外,Wear OS 4正在获得更好的智能家居集成,可让用户调整照明,控制媒体并查看相机通知的动画预览,所有这些都可以通过手表完成。


Wear OS 4目前仅在开发人员预览版和模拟器中提供,今年晚些时候将全面推出。


本文提供的信息仅用于一般指导和信息目的,本文的内容在任何情况下均不应被视为投资、业务、法律或税务建议。

追加内容

本文作者可以追加内容哦 !