聪明能干的机器人
文章来源:中科院软件所软件发展研究部 丛东明 柴长坤 | 发布时间:2017-11-10 | 【打印】 【关闭】
亲爱的朋友们,在参观智能机器人科普展中,我们能够看到各种各样的机器人:有会唱歌跳舞的、会弹琴的、会卖饮料的、会打球的机器人。那你们注意到我们身边的智能机器人了吗?像新闻报道中的人机围棋大战中大胜人类的阿尔法狗(AlphaGo),江苏卫视《一站到底》中完爆人类选手的机器人“汪仔”,还有浙江卫视《奔跑吧兄弟》里面出现的快递界物流分拣机器人“小黄人”等等,它们都是智能机器人在生活中实际应用的代表。这些机器人怎么这么聪明呢?它们是怎样制造出来的呢?
图一:机器人图片(图片来源:灵核网)
这些机器人的制造技术就是我们生活中耳熟能详的科技术语“人工智能”(Artificial Intelligence),英文缩写为AI。人工智能是计算机科学的一个分支,是对人的意识、思维的信息过程的模拟,希望像人那样思考、也可能超过人的智能。研究领域包括机器人、语言识别、图像识别和自然语言处理等。它在我们日常生活中的实际应用包括机器视觉、指纹识别、人脸识别、视网膜识别、博弈、智能控制、机器人学等。人工智能可是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能研究的主要目标之一是使机器能够胜任一些需要人类智能才能完成的复杂危险性工作。在科学家的努力研究下,机器人真是越来越聪明能干了。它们可以进入险区,排除险情;可以潜入深海,寻找宝藏;还可以进入人体,查病治病。
那机器人到底是什么?是由什么构成的呢?其实,机器人是自动执行工作的机器装置,它是软件、机械、电子的集合体。软件部分好比机器人的大脑,通过编写程序设定机器人的工作逻辑,进而控制电子和机械部分。机械部分好比机器人的骨骼,它包括:机械臂、机械手、轮子和底盘、机械关节等各种部件。电子部分好比机器人的神经,通过传导电子信号到各个关节(机械部分)来控制机器人的运动。激光雷达、超声波和摄像头就是机器人的眼睛。
机器人的技术原理是什么呢?原来,机器人之所以能运动、能感知世界,本质上是因为它打通了实物信息和电子信号之间的通道。以机器人前后移动为例。首先需要编写程序,控制机器人前进或者后退。将行走的指令转化为机器能够读懂的程序语言,让机器人执行。接着,机器人将程序语言转化为电子信号,控制电动机(轮子)的旋转。不同的指令可以控制不同的电压高低,从而控制旋转速度大小。电机旋转,就可以带动整个机器人移动。同样,以激光雷达检测障碍物为例。激光雷达不停地发射激光,当接收到反射回的光线时,机器人自动将光信息解析为电信号,通过分析电信号的内容,得出障碍物的距离。因此,机器人感受世界,是将实物信息转换为电子信号,在程序中判断和执行。而机器人运动,是将程序逻辑转换为电子信号,进而控制机构的运动。
在《奔跑吧兄弟》中我们看到萌萌哒的快递分拣机器人“小黄人”在地面上有序穿梭,将一件件包裹运送到指定位置,完成分拣。“小黄人”的工作原理是什么呢?原来,“小黄人”采用相机加二维码精确定位,红外、超声波避障,具有急停按钮和碰撞海绵。它们成功领到包裹后,会头顶包裹穿过配有工业相机和电子秤的龙门架,借助工业相机读码功能和电子秤重功能,“大脑”快速识别快递面单信息,完成包裹的扫码和称重,根据包裹目的地规划出最优运行路径完成分拣投递。这些“小黄人”们每小时能处理近两万个包裹,一天分拣20万个包裹不在话下,并且不用吃饭睡觉休息可连续工作8小时呢,为快递公司节省一半人工。这项技术可是中国本土原创哦,是五个毕业于杭州电子科技大学的技术狂研发的。
图二:工作中的分拣机器人“小黄人”(图片来源:湖南教育网)
在江苏卫视《一站到底》中,机器人汪仔与人类顶尖选手比赛答题大获全胜。相比之下,汪仔则更为“聪明”。它是集合了搜狗和清华大学天工智能计算研究院等顶尖技术团队,耗资 4000 万打造的问答机器人。它能听、会看、会对话、会思考、会答题,代表了人工智能领域的前沿技术。汪仔依靠的是基于人工智能技术的搜狗立知问答系统。在理解问题或信息需求后,利用海量网络信息及大规模知识库,直接给出答案,方便快捷,适用于多种交互方式。其背后蕴含语义分析、问题理解、信息抽取、知识图谱、信息检索、深度学习等众多技术。
提起机器人研究,就不能不说说中国科学院软件研究所协同创新中心(Xlab)武延军老师带领的机器人研发团队。这个团队规模不大,平均年龄才27岁,但个个都是计算机行业的技术牛人,目前他们正在致力于智能机器人Xbot的科研工作。Xbot机器人是协同创新中心自主研发的机器人平台。尽管外表简单,但其一身装备价值不菲。Xbot从上倒下依次是:交互Pad、旋转云台、升降台、深度摄像头、激光雷达、移动底盘。在移动底盘里还藏着主控板、超声波传感器、红外传感器和大容量电池等。
图三:Xbot机器人外观
那Xbot能干什么呢?Xbot目前主要用在四个领域。家用方面用于儿童教育和老年陪护;商用方面可以进行商场导购、酒店迎宾、会展引导、安防巡检;教育方面致力于机器人科研平台、青少年机器人教育;医疗方面应用于医疗辅助、高精度手术机械臂。就以教育领域应用来说吧,Xbot开发了图形化模块化编程界面,供青少年学习机器人编程。这个界面可以帮助学生更快捷、更直观、更容易编写自己喜欢的电子游戏程序,如开发“愤怒的小鸟”、“吃金砖”等游戏。学习编程过程中,学生们兴趣盎然、全身投入,编得热火朝天不亦乐乎。Xbot使青少年在编写游戏的同时学到编程知识,寓教于乐,乐趣无穷,还能引导他们正确对待电子游戏,热爱但不痴迷于电子游戏的虚拟世界,受到了学生和家长的热烈好评。开发人员后续还会在此界面上加入更加有趣的机器人实体演示、身临其境体验的机器人仿真场景和实物现场视频。从此,coding就变得更加有趣好玩了!
除了上述应用,Xbot最主打的还是科研教学平台。当前全社会掀起了一股“机器人热”,许多高校和科研机构都开始瞄准这个领域。协同创新中心推出的Xbot就是为科研教学领域提供一款通用的开发平台。它集成了市面上机器人最主流的传感器,采用最通用的双轮差分移动底盘,提供了最全面的软件开发平台,接入了讯飞语音、腾讯优图等众多厂商的应用。总而言之,Xbot的创新之处在于:
1.减少了机器人厂商、高校、研究所在共性技术上的重复研究,降低了机器人的技术准入门槛。对于研发人员来说,可以节约巨大的时间和精力。
2.Xbot提供的通用机器人平台,便于厂商进行个性化定制。厂商在现有硬件平台上可以根据自身需求对其进行改造和定制。
3.机器人操作系统的实时性强。自主研发的机器人操作系统对实时性进行了改进,反应时间更加迅速。
4.用户交互体验好。机器人顶端的交互pad运行android程序,能够人脸识别、语音交互,具有良好的用户交互体验。
5.智能化程度高。机器人系统内置人机交互、同步定位与构图、调试等功能模块。
其实我们身边有很多的机器人,只是我们没有关注探究而已,例如家里的扫地机器人。你写的程序越高级,机器人就会越聪明。随着信息时代科技的迅猛发展,我们的生活中处处离不开智能机器人,机器人可以代替我们做饭、洗衣服、开车、写作业、上班…….也正是因为有了科技发展,我们的生活才会变得更美好。亲爱的朋友们,让我们一起快来多多认识和了解身边聪明能干的机器人吧!