用AI导盲背包替代导盲犬?用OAK相机做的这款方案值得围观

用AI导盲背包替代导盲犬?用OAK相机做的这款方案值得围观

▌背景

在过去的十年中,出现了许多帮助视障人士更好地驾驭外界环境的技术创新。这些范围从使用声纳和触觉反馈的手杖和手环,到提供定向和导航帮助的智能手机应用程序,不一而足。

所有这些解决方案的共同点在于,它们仅能增强盲人在公共空间中移动时的体验,依旧不能替代珍贵的导盲犬。

OpenCV AI Kit的出现,让这一切可能有新的改变。

近期,来自乔治亚大学的研究人员发明了搭载人工智能设备的背包,旨在替代视障者的导盲犬和手杖,助其出行更加便利。

这款背包装有一个可以在笔记本电脑上运行的人工智能系统,并配有能够隐藏在背心和腰包里的OAK-D相机,腰包里装有系统电池。这些摄像头运行英特尔的Movidius VPU,并使用Open VINO工具包进行编程。

这一项目的工程师贾加迪什·K·马亨德兰(Jagadish K. Mahendran)解释说:“如果没有英特尔的这些神经计算棒,佩戴者可能会在背包里装上大约五个图形处理器。每台重约四分之一磅,更不用说所需的风扇和电源了。”

“然而,多亏了这些神经计算棒和英特尔Movidius处理器,这种巨大的GPU容量被压缩到了U盘中,所以你可以把它插在任何地方,可以运行这些复杂的深度学习模型。”

马亨德兰的发明在由英特尔赞助的OpenCV Spatial AI 2020大赛上获得了大奖,这是世界上同类比赛中规模最大的一次。

在谈到是什么促使他开始研究他的这个导盲系统时,马亨德兰说:“去年,当我遇到一位视障朋友时,我被一个讽刺的事实所震惊,尽管我一直在教机器人看东西,但依旧有很多人看不见,需要帮助。”

现在,用户可以选择听一串描述邻近地区的评论,系统会回答问题。无论哪种情况,系统都会提醒用户注意障碍物,如路边、长椅、盆栽植物和其他人。它还可以提前警告他们前方的人行横道,根据深度信息数据,可以提醒用户前方道路即将出现的斜坡和斜坡。

下面我们从3个角度来具体了解这一AI方案。

▌突破硬件极限

初步思考,至少对于智能手机这一代人来说,所有东西都应该放在口袋里,基于背包的解决方案听起来可能有些笨拙,但这已是当下最优的方案。

正如马亨德兰解释的那样,“如果没有英特尔的这些神经计算棒,佩戴者可能会在背包里装上大约五个图形处理器。每台重约四分之一磅,更不用说所需的风扇和电源了。”。

这显然对用户来说是负担不起的,也是不切实际的。

然而,多亏了这些神经计算棒和英特尔Movidius处理器,这种巨大的GPU容量被压缩到了USB优盘大小的硬件中,所以你可以把它插在任何地方,你可以运行这些复杂的深度学习模型。

“这就是为什么我们开发的解决方案如此简单,因为我们可以把所有东西都放在一个小背包里,而且它携带方便,价格便宜,外形非常简单。”

增加的独创性是系统的配置方式,它看起来根本不像一项辅助技术。

然而,马亨德兰并不是简单地利用一个开发项目,而是成功地将几个尖端的软件和硬件创新结合在一起,构建了一个名副其实的组合拳,将人工智能驱动的空间导航和通知技术集成在一个系统中。

这些组件包括一个位于背心内视口后面的OAK-D空间AI相机,它能够运行先进的神经网络,并提供加速的计算机视觉。

这是通过在摄像头上嵌入英特尔智能视频芯片,实现超快的响应时间和消除延迟来实现的。

 该系统还使用英特尔OpenVINO工具包进行片上边缘AI推理和OpenCV,OpenCV是支持实时计算机视觉的编程函数库。

OpenCV的历史根源于英特尔生态系统,在过去的20年里一直是世界上最大的计算机视觉社区。

▌导航环境

在外出和出行时,该系统可以检测人行横道、路边海拔的变化、红绿灯和标志以及其他行人,还有诸如垃圾桶、悬挂的树枝和花篮等一整套街道设施。然后通过蓝牙耳机提醒佩戴者这些潜在危险的存在和方向。

即使传递的信息量是可定制的,系统也会提供与安全相关的不可转让的“关键更新”,例如骑自行车的人接近或路缘高度变化。

令人着迷的是,马亨德兰的系统使用了自动驾驶车辆中的某些技术和模式,是交互式的,用户可以在旅途中向其提问。其中包括识别用户附近物体的“描述”命令,系统可以提供诸如“人、10点钟或红绿灯2点钟”之类的答案。

该系统还允许用户保存他们的当前位置,或通过短信将其发送给另一个人。

在配置系统设置和选项时,马亨德兰遇到了所有寻求改进辅助技术的人工智能工程师都会遇到的问题,即,什么构成了用户的信息过载?

马亨德兰说:“如果持续不断地轰炸信息,就会变得势不可挡。”“这就是为什么我们想要确保我们提供关键的更新,并使其余的信息是可定制的。”

英特尔技术倡导和AI4Good主管赫马·钱拉杰表示:“我们看到贾加迪什和他的团队正在推进的创新类型是真正的人工智能民主化。”

她认为,一段时间以来,人工智能只是专门用于特定的系统和技能,但现在它正被带入日常生活。”

“我们正在把它带到消费者层面,告诉他们‘这些都是你可以即插即用的东西。’这项技术正在使以前从未存在过的机会大众化。“。

▌未来发展方向

在Mira盲人导航系统的保护下,该倡议的下一步是将代码、模型和数据集开源,使创新者能够在系统基础设施上进一步构建。

全新原型的开发目前已进入后期阶段,该团队期待着与盲人用户进行进一步的广泛测试。

未来将需要资金来确保敏捷开发,但一个关键的紧迫问题显然仍然存在。

一个多世纪以来,盲人的犬类伴侣一直为社会提供无价的日常生活援助,这一改进版的系统能否取代盲人的犬类同伴?

至少在技术层面上,马亨德兰的答案是完全毫不含糊的。他说:“导盲犬非常擅长探测事物,但显然不能交流障碍是什么,所以人们需要一些时间才能弄清楚情况。”

“这就是所谓的原始感知,只是触及了我们系统所能做的事情的表面。”

然而,他确实提出了一个警告,称这是人类最好的朋友所独有的,“当然,狗很可能提供一种情感支持系统,你肯定不能拥抱或玩弄人工智能引擎。”

不过,可能不会很快–随着硬件组件小型化、保持甚至增强性能的惊人速度,背包本身可能很快就会被其他物形所取代。

考虑到需要解决的需求,整个系统的下一代外形很可能最终是最合适的。

根据马亨德兰的说法,“总有一天,我们将能够在非常简单的硬件上为用户执行更复杂的处理。它甚至可能放在智能眼镜甚至眼镜里,作为一种可穿戴设备,他们可以在里面做任何事情。”

或许这也正是我们乐见的用AI解决真正且实际的又一鲜活案例,和技术加持下的美好生活的初衷。

参考资料:techxplore新芒X