一文读懂谷歌I/O 新硬件、Android Q及多项功能升级
分类:通讯产品

金沙城娱乐中心手机版 1文 | 《财经》特派记者 刘泓君?发自美国山景城? 编辑 | 宋玮

金沙城娱乐中心手机版 2

今年5月的谷歌开发者大会,谷歌用三天的时间发布了100个创新产品。距离谷歌从“移动为先”转型向“AI为先”的口号提出已经三年,可以说这场活动表现出人工智能的发展进入深水区,创新乏善可陈;也可以说它充满了人文关怀,细节才是打动人心的力量。

本文由腾讯数码独家发布

2019年是多事之年,就在谷歌开发者大会的前一周,由于其母公司Alphabet收入增长不及预期,财报之后大跌8%。对用户隐私的保护正在动摇用数据赚钱的广告模式,此外,谷歌收到欧盟17亿美元的天价罚单。此时,对硅谷科技巨头的反垄断与分拆讨伐不断,Facebook联合创始人发文建议分拆Facebook。今年,最后一批硅谷独角兽纷纷提交上市申请,互联网高速增长的红利期结束。

在微软Build开发者大会开幕的一天之后,谷歌的I/O开发者大会也如约而至。在这次I/O大会上,谷歌带来包括人工智能、增强现实、Google Lens、Android Q等服务、功能和系统以及Nest Hub Max和Pixel 3a/3a XL两款最新的硬件。

在整个大环境中,这场开发者大会的情绪与传递的信息都甚为微妙:过去五年,谷歌人工智能方面的重大技术突破,掀起沉寂许久的人工智能再次迎来高潮期,且诞生了一批独角兽;放眼未来,越来越多的模型需要大规模的数据来训练,当华盛顿开始声讨硅谷公司们的隐私问题时,这让科技公司的每一次发声都小心翼翼。

搜索整合AR以及升级版Google Lens

增长放缓、隐私忧虑,比起中国互联网公司以强运营作为护城河,技术驱动的谷歌将如何走出自己的增长瓶颈?这次开发者大会可见一二。

金沙城娱乐中心手机版 3

搜索无处不在

在大会的第一部分,谷歌展示了经过进一步完善将摄像头与AR整合的Google Lens,现在Google Lens已经可以与谷歌搜索整合,能够通过AR的方式直接展示搜索结果。比如搜索“解剖”、“运动鞋”和“大白鲨”等,就能通过AR和3D的方式显示搜索结果的360度展示,而且在特定的条件下,还可以通过AR的方式将结果展示在手机屏幕上。

在谷歌母公司Alphabet的收入结构中,有84%以上营收来自于广告收入。然而,亚马逊正在广告市场蚕食谷歌的市场。

金沙城娱乐中心手机版 4

美国媒体CNBC曾经报道,在购物领域,广告主正在把预算从谷歌转移到亚马逊,原因是在亚马逊上投放的广告的投入产出比更高,越来越多人在购物时第一时间想到使用亚马逊来搜索。

不仅是搜索,升级版的Google Lens还可以与Google Assistant和Google Photos等搭配使用,用户可以根据相册中特定的图片,来进行检索,分类进行显示。Lens还可以根据菜单,直接显示餐馆中的菜品图片,看到用户评论,还可以直接显示消费费用,再对准小票还可以进行计算小费等。再对准菜谱,还可以直接显示菜品的做法。

根据市场调研公司eMarketer的预测,未来谷歌在广告市场的市场份额将从38.2%下降到37.2%,这1个百分点将被亚马逊取代,亚马逊在整个广告市场的份额将从2018年的6.8%上升到8.8%。预计2020年将达到10%。对未来谷歌在广告市场的担忧,以及一季度增长放缓,正是谷歌财报后下跌的主要原因。

金沙城娱乐中心手机版 5

长期来看,谷歌正在通过人工智能将搜索嵌入到更多场景中。《财经》记者在现场试用谷歌新发布的手机Pixel 3a时,拍摄一张照片,可以自动切换Google Lens(一款图片识别App),立刻会出现人物服装、家具等购买链接。这意味着,用户拍照都可以成为购物广告。记者现场试用结果显示,目前谷歌出现的相关图片购买链接,还无法精准到原物。

除此之外,Google Go是谷歌为入门级Android设备专门开发的搜索应用,而经过本次升级,它将获得一项AR翻译功能。在这项功能当中,谷歌使用了文字转语音、机器视觉、翻译、以及自家的搜索技术。

未来,依托谷歌的搜索技术,在加入图片与语音的交互之后,搜索不再只是输入文字。谷歌在开发者大会期间宣布了100项产品和算法上的新功能。这里,选取一些打动人的产品创新:

对于有阅读障碍或者看不清文字的用户,可以直接将文字拍摄下来,Google Go随后就能朗读图中的文字,并能在朗读过程当中高亮当前单词。如果图中的文字是你看不懂的外语,你可以直接点击界面中的翻译按钮,翻译好的文字变回直接覆盖在原有文字上面。在翻译模式下,朗读功能仍然可用。此外,你也能够直接搜索当中的文字内容。

基于图片的搜索

网络版Duplex

美国绝大部分餐厅都没有图片,菜单是一张密密麻麻英文列表。当你去到一家餐厅不知道吃什么的时候,不需要再通过其他App搜索,打开Google Lens的手机摄像头对着菜单,屏幕会出现哪些菜最好吃,这些会有重点记号显示;当你点击一道菜的名字时,谷歌还会调取谷歌地图上的图片,直接出现这道菜的图片。

在谷歌推出逼真的人性化人工智能,能够帮助用户预订餐厅和进行理发预约一年之后,谷歌将这一Duplex服务扩展到基于网络的聊天,如租车和预订电影票。谷歌在舞台上展示了一个例子,谷歌助手可以根据用户账户中的现有预订记录输入旅行信息。当用户要求谷歌助手帮助预订租车,它将开始使用所拥有的信息自动填写表格,如用户的姓名、地址、取车和退车时间。

吃完饭后,只需要图片拍摄菜单,就可以自动计算AA制每个人应付的钱数。

谷歌并未透露将在何时正式推出网络版Duplex,称演示的是“早期预览版”,但却承诺在确认细节之前,将提供Duplex的每一步发展。

此外,谷歌还与法国的一本美食杂志合作。当杂志上出现一道法式烤猪排时,只要用摄像头对着猪排的图片,就可以在摄像头中出现动态的猪排的做法演示。

速度提升10倍的Google Assistant

尽管这些简单的小应用背后都需要强大的算法与技术支持,但这依然离不开谷歌过往收集的数据,比如菜单上的图片就来自于用户主动的拍照上传分享。而动态的猪排做法,则需要专业的团队去制作这样的视频。

金沙城娱乐中心手机版 6

基于图片识别的另一个功能是Google Go,它可以帮助识别路牌。对于语言不通的人来说,或者残障人士,只要将手机摄像头对准路牌,就可以自动将信息念出来,或者将英文信息翻译成中文,不再需要在文字搜索框内翻译,过去几年,谷歌在翻译功能和视觉识别的精准度方面已经快速提升。

在I/O上谷歌带来了Google Assistant有史以来最有趣电影也是最重要的升级。首先首席执行官Sundar Pichai表示,谷歌已经将语音识别程序从之前的100GB压缩到只有0.5GB。而这意味着语音识别的速度非常快,与原来相比提升10倍,可以在任何安卓手机或平板电脑上实现。

在搜索具体名词时,谷歌还加入了3D图像与AR图像。在谷歌中搜索一双新百伦的鞋子,可以看这双鞋子的各个侧面,包括鞋底的展示。目前,谷歌正在与NASA、新百伦、三星、沃尔沃汽车和美国超市Target、美国家具平台Wayfair合作,在搜索结果中呈现更多3D图像。

谷歌现场演示了Google Assistant的提升,并且从演示效果上来看非常出色,智能手机几乎能在瞬间完成对Assistant命令的识别,并且以同样快速的反应执行所有操作,包括打开照片、日历等,下达命令定闹钟,询问天气等等,几乎没有延迟,提升非常明显。

如果搜索白灰鲨鱼,会在手机上出现鲨鱼的3D图像,还可以使用点击移动功能。现场展示者就将大鲨鱼的AR图像移动到了舞台上。转动摄像头,甚至可以通过手机看到大白鲸的牙齿。

同时Google Assistant能够非常轻松的在在应用之间切换、执行各项操作和提供搜索结果等,包括订票、Waze导航、驾驶模式和提醒等。可以说此次是迄今为止我们所见过的最快最智能的Google Assistant演示,而且一切都是现场演示,延迟更低,可以无缝将各项命令整合到一起,而且们不用每次都说“OK Google”这样的激活语音命令。

Google Assistant语音助手

金沙城娱乐中心手机版 7

去年,谷歌首次推出智能语音助手的一款更加智能的程序Duplex,它可以模仿人的语气电话订餐、并且在机器说话的时候加入停顿词,可以连续发出多个请求,不需要每次都用“Hey Google”唤醒。谷歌资深科学家、技术大神Jeff Dean介绍称:“仅这一个系统就涉及了多项技术,包括自然语言处理和对话理解、语音识别、文本到语音转换、用户理解和有效的UI设计。”

其中驾驶模式非常值得关注,当Android手机用户驾驶汽车时,Google Assistant将会成为更有帮助的乘客。谷歌助手正在获得一种带有语音命令的新“驾驶模式”,这种模式可以让用户更轻松地与设备互动,并且无需把手从方向盘上拿开就能获取所需信息。正如人们对谷歌助手的期望,整个体验被设计成免提的,并由语音命令控制。当有电话或短信进来时,谷歌助理会给用户提供相关信息,并询问是否想回复。

今年语音助手连续发出了8个指令,可支持多任务同时进行,甚至可以让语音助手挑选出相册中在黄石国家公园有动物的照片,甚至是有牦牛的照片。

全新的Google Assistant助手将从今年年底开始率先在新一代Pixel系列智能手机上亮相,很有可能是Pixel 4。

谷歌还推出了基于网页的Duplex版本,只要说出为我下一次旅行订车,Duplex可以通过Gmail知道你喜欢的车型、订车时间,自动帮你完成所有需要填写的表单,全程不需要手动输入,这项功能将在今年下半年上线。

人工智能

当你告诉语音助手:“导航去妈妈的家”,其中“妈妈的家”可能是一家餐厅的名字,也可能真的是你母亲的住所。谷歌可以识别这些个性化信息。

人工智能历来是谷歌最关注的技术。在本届I/O上,谷歌也发布了多个基于AI的医疗检测和无障碍特性。

考虑到强大的“填表机器人”可能比用户更清楚地记得自己的信用卡账户、妈妈家的地址、航班和出行的详细订单,在隐私问题频繁出现的硅谷,需要用户自己在语音助手中设置个性化信息。

金沙城娱乐中心手机版 8

不过,这些新技术的展示就好比泡面盒子上的展示图片与真实图片的差距。在去年的现场展示中,Duplex在帮助人类订餐时,甚至可以模仿人的语气词,以至于餐厅老板也无法确认,背后到底是一个人还是机器人。

在医疗领域,谷歌已经与专业医疗人士合作,在针对糖尿病造成视网膜损坏方面和癌症检测方面取得了一定的成果。谷歌和医疗人员合作,利用AI技术来分析CT,检测患者病变状况。这方面的技术甚至超越了放射科的医生,考虑到目前医疗状况,其实在最开始的扫描中很难观察病变的。而谷歌利用AI技术进行CT扫描,能够最大程度的挽救患者生命。

但在真实的应用中,谷歌承认Duplex有25%的电话是人打出去的,而不是真正的语音助手,在机器打出去的电话中,15%会受到人的干预。现场多数人在看完演示以后,会很简单地以为这个机器人无所不能,真相是,它最擅长的功能就是“预订餐厅”,因为谷歌一直在反复训练它,尽管如此,它有时候还做不到那么好。

金沙城娱乐中心手机版 9

今年,语音助手还将加入到谷歌地图中。只要说出“Let’s Drive”,就可以通过车内环境语音打开Youtube上的音乐、决定是否接电话。可以确定的是,通过语音直接调取应用程序越来越主流,语音正在成为下一个入口。

除了普通用户,谷歌也没有忘记残障人士用户,并且在I/O上展示了Project Euphonia、Live Relay和Project Diva三个无障碍项目。

关爱特殊人群

Project Euphonia目前仍处于早期的研发阶段,旨在帮助有语言障碍的人士更容易地交流。通过Project Euphonia,谷歌希望通过人工智能技术来提高计算机理解语言障碍用户所发出受损语音的能力。反过来,计算机可以帮助确保每个用户意图都被理解。

谷歌的价值观是:“让所有人都可以享受技术的便利,而不是一部分人。”今年,谷歌也推出了很多使用科技帮助残障人士的新功能。最终,这些帮助残障人士沟通的新技术进展,也可以给普通人在特定场景下使用。

金沙城娱乐中心手机版,Live Relay则是为了帮助那些经常使用手语聊天交流的人士,让设备将语音和文本之间进行转换。通过这样功能,可以帮助听力障碍或失聪人士完成打电话的心愿。Live Relay能够将语音信息实时转化成文本,并且以语音的形式转换回来。

Steve Saling患渐冻症已经有13年,这种病在发病后肌肉僵硬、抽搐、说话或者吞咽困难,四肢开始逐渐无力,最终丧失自主运动的能力,著名物理学家霍金就患有此病。

而Project Diva帮助人们在不使用语音的情况下发出Google Assistant命令,让那些非语言或行动受限的人可以使用外部开关和按钮等设备触发Google Assistant命令。

谷歌通过识别Steve的面部表情,来训练机器学习的模型。最终他只需要稍稍做出不同的面部表情,就可以操作谷歌智能家居设备Google Home。

Android Q

这个项目名为Project Euphonia,由失聪设计师Elise Roy与哈佛教授Michael Brenner共同研发,但它需要尽可能多的声音样本。

金沙城娱乐中心手机版 10

谷歌语音研究员Dimitri Kanevsky就是一名听力障碍者,失聪后才开始学习英文,因此在谷歌现场播放的大屏幕上,完全无法听清楚他在说什么——这段英语发音模糊,单词输出不清晰,无法与人沟通。于是,他录入了1.5万条自己的语音模型训练,最终,机器可以准确识别他的声音与讲话方式。但这种个例并不具有普适性,谷歌正在寻找更多的样本为残障人士提供交流渠道。

作为本次I/O的重头戏,Android Q亮相之后赢得了现场观众的阵阵掌声,目前全球已经有超过25亿设备运行安卓系统。作为第十代安卓系统,Android Q此次带来了众多非常值得期待的新功能。

谷歌还研发有一项Live Caption系统:你所说的话字幕会实时出现在手机屏幕上,这样失聪的人就可以通过文字“听”到语音电话了。除了给残障人士使用,这项场景应用广泛,比如在嘈杂的酒吧看球赛或者电视(美国电视都不带字幕),或者不太方便收听电话时均可使用,语音可以实时转换成文字。

支持折叠屏设备

如今,这个功能已经在Youtube视频网站上应用,对于没有字幕的美剧,在屏幕下方点击字幕,就可以出现谷歌根据语音出现的字幕。但事实上,字幕的实时识别并不是什么新功能,美国的用户很早就可以选择在Youtube上添加字幕了。一位现场的开发者很明显地感觉到:“谷歌的识别准确率提升很快。”

金沙城娱乐中心手机版 11

本文由金沙城娱乐中心手机版发布于通讯产品,转载请注明出处:一文读懂谷歌I/O 新硬件、Android Q及多项功能升级

上一篇:没有了 下一篇:没有了
猜你喜欢
热门排行
精彩图文