当 Viva 和 Yoshiko(一个会说英语,另一个会说普通话)在 Google I/O 2022 的一个潜行高峰期间试用 Google 的原型智能眼镜时,我脊背发凉。他们脸上的表情,突然间能够与以前不完全理解所讲内容的人进行有意义的交流,这让我非常感动。这是我真正喜欢的技术类型的一个例子:一种可以改变生活的技术。
世界的字幕
如果您在 Google I/O 期间错过了这个特殊的时刻,您会被原谅,因为它恰好在马拉松赛事结束时出现,并且只持续了几分钟。实际的智能眼镜没有命名,只是在演示视频中展示,实际上只是作为一个概念展示。谷歌甚至没有向我们展示界面本身,也没有暗示智能眼镜将作为实际产品发布。
它不必。谷歌出卖了梦想。像普通眼镜一样佩戴,镜头包含一个小屏幕,显示增强现实 (AR) 中另一种语言的实时翻译,因此它覆盖了您通常看到的内容。谷歌产品经理 Max Spear 完美地总结了这个功能,称它就像“世界的字幕”。坐在与您说不同语言的人对面,眼镜会在对话发生时提供基于文本的翻译。
您可能认为它与其他翻译技术相似——例如,谷歌的 Pixel Buds 具有翻译功能——但这里有一些明显的优势。首先,在一副眼镜内看到屏幕上的文字意味着您可以保持眼神交流,您可以在不按按钮或长时间尴尬的沉默的情况下跟随机器翻译所说的话。文本比听到另一种声音的干扰要小,而且因为没有人听到翻译,所以不会感觉不自然。
潜在用途
任何出国旅行或在语言不同的社区待过的人都会立即明白这种技术将如何带来好处。我不寒而栗,不仅因为那些测试眼镜的人脸上洋溢着喜悦,还因为我立刻想到如果我能接触到同样的技术,我自己的生活将会发生怎样的变化。
我记得在日本和一位朋友共进晚餐,虽然我们都对彼此的语言有基本的掌握,但谈话无法进行。我们最终在手机上使用谷歌翻译并打字而不是通过应用程序使用语音,因为环境非常嘈杂。它有效并且很有趣,但并不完美,有时还很尴尬。智能眼镜将彻底改变这种情况。
我想知道谷歌的智能眼镜和翻译系统会如何改变我在那里的时间?但是,当我想知道这两种情况以及我个人遇到的智能眼镜真正有用的许多其他情况时,我很快就遇到了巨大的障碍,不仅是谷歌的原型眼镜,而且是任何可穿戴翻译技术。
任何为两个说不同语言的人提供视觉翻译的可穿戴设备的问题在于,各方都需要拥有并佩戴其中一个。对话是双向的,如果只有你们中的一个人理解所说的话,那么它只会在不需要回应的情况下变得有用。所以,为了让它适用于我的场景,我在日本和希腊认识的每个人都必须戴上内置谷歌翻译技术的智能眼镜。这似乎……不太可能。
他们在没有各方佩戴它们的情况下工作的地方不是为了翻译,而是为了转录。这种视觉转录和增强显然可以改变聋人或听障人士的生活。我的父亲戴着助听器,但我知道他会从“看到”这些词中受益,并且不会错过某些情况下助听器带来的烦人的音频反馈。它让我想起了像 eSight 智能眼镜这样的变革性产品对于盲人和弱视的人来说是如何的。
可能不是谷歌眼镜 2
尽管我想我们看到的是早期版本的 Google Glass 2,但我不认为我们是。相反,我们看到了谷歌在其翻译和转录技术的速度和准确性方面的快速进步的惊人展示。
在 2022 年 Google I/O 期间,还有其他几个 Google 语言技能提高的例子。据宣布, Google 翻译中新增了 24 种语言,为全球 3 亿新用户提供服务。它支持的语言总数达到 133 种,并且由一个名为 Zero-Shot Machine Translation 的新 AI 系统实现,该系统通过结合现有知识和新信息来学习新语言,即使该信息的来源有限。
Google 的 AI 在理解自然语言及其一般使用方式方面越来越好,例如 Nest Hub Max 上的 Look and Talk 功能,也在 I/O 2022 期间宣布。那是在任何拥有 Google Pixel 6 的人试用 Google 之前 Assistant 能够将您的声音转录成消息回复,或观看带有实时翻译的视频。两者都很快,尤其是在消息回复的情况下,准确得令人震惊。
我每天在不同的设备上使用谷歌翻译,通常将日文、韩文和中文翻译成英文。这些都是非常具有挑战性的,并且要在对话中有效地使用它们确实需要了解语言的工作原理,否则会犯下令人尴尬的错误。听到并看到谷歌如何创新和改进其翻译技术意味着我的世界继续更加开放,我认为它也会慢慢地让学习这些语言变得更容易。
通过一副智能眼镜集成谷歌增强的语言和翻译技术是非常强大的。如果我能立即理解会给我和我身边的人带来的好处,我只能开始理解那些听不见的人会感受到的兴奋。你可以保留 Pixel 7 和 Pixel Watch —— 像这样令人难以置信的未来技术的演示是我坐在谷歌 I/O 主题演讲中两个多小时的原因,当我开始理解这一切可能带来的潜在变革时,那些颤抖是我的奖赏。