编者按:最近,Pokémon Go 成功吸引了人们的眼球,这款游戏的火爆让用户体验到了 AR 游戏的魅力,但是 AR 与现实世界的交互远不止于此。 AI 驱动的图像识别技术公司 Cortica 的联合创始人兼CEO Igal Raichelgauz 发表了对未来 AR 的看法。他表示:“真正的 AR 需要计算机视觉和对现实环境的动态映射。”
Pokémon Go 中的角色只依赖 Google Maps 中的固定纬度和经度。如果在游戏中应用真正的 AR 技术,实时深度映射和物体识别功能会让游戏角色与现实世界互动,而不是将他们放在不协调的游乐区之外。
真正的 AR 仍然是一个圣杯,让 AR 技术真正发挥作用的关键是 AI 驱动的图像识别技术,这种技术可以进行“无监督学习”,人们可以使用设备即时观看任何图像和视频,并尽可能的理解内容。
当前 AI 的局限性
在了解“无监督学习”之前,首先让我们来了解一下目前的状况。Google、IBM 和 Facebook 等大公司一直致力于开发、实践 AI 技术,改善图像识别能力,但是他们都有缺陷,当前该领域的大部分工作主要集中在“深度学习”技术上。
深度学习提供了海量的计算能力,但是有两个重要的缺陷:
第一,当深度学习系统触达第1000个计算层之后,计算能力达到顶峰,但是没有继续形成规模的能力。
第二,机器学习需要让人们进行数百个小时的指导,我们将其称之为“监督学习”。计算机科学家会修正错误的答案,最终该系统会从错误中进行学习。针对特定的数据集,这是有效的,例如,回答智力竞赛节目中的问题,或者玩棋盘游戏,但是它无法被应用到不断变化的环境中,例如自然界。
“人性化” AI
我们需要考虑的一个关键词语是:自然。将深度学习应用到 AR 中不太适用,因为这是让人工系统了解自然环境。当然,这些任务对人类来说并不是困难。为了确保计算机可以精确地理解环境,这需要一个过程,就像人类的自然进化一样。最新的脑部研究表明,无监督学习才是答案。
无监督学习与深度学习不同,因为它不需要人类的参与,不需要给它一定的数据集,从问题中得到正确或错误的答案——“这是一只猫,这不是一只猫”,无人监督的学习系统会基于每张图片相同/不相同的特点,分析出上千个特征,包括颜色、形状、复杂组合,等等。
真正的 AI 驱动的 AR 可以做什么?
通过对此更加深入的了解,AI 驱动的 AR 游戏将会把虚构角色的活动和游戏设定整合到自然场景中。但是完善的游戏设定只是冰山一角。
由 AI 驱动的 AR 是强大的技术,可以颠覆无数行业。例如,消费者很快就能很好地利用自己手机和其他设备中的照片。想象一下,内嵌的AI助手可以自动管理图片和视频,在一毫秒的时间内进行精确的搜索,根据图片的主题进行分享推荐。数百万张被遗忘的照片突然获得了新生,可视化搜索的潜力被释放。
通过无监督学习进行图像识别可以让自动驾驶汽车的安全性成指数倍增长。汽车可以完全看清行人,完美辨别道理障碍。
在医疗领域,手术过程中,医生可以获知更及时的信息,并与上百个相关的操作进行对比,基于世界范围内的解决方案指导医生进行操作。
AR 是一种趋势,但是只有当这种技术完美无瑕地整合在社会中时,才能发挥更大的作用。Pokémon Go 远没有达到这种水平,但是这种技术很快就会被使用。通过非监督学习的驱动,可以让一个虚拟的皮卡丘藏在一棵真正的树下,这种突破将会从根本上改变 AI、AR 在世界中的运行方式。