引言
仿人机器人的头部视觉跟踪系统利用视觉信息作为反馈,来规划机器人的头部运动使其能实时的跟踪运动目标。视觉跟踪是仿人机器人的重要功能之一,它的研究对于仿人机器人的自主导航、人机交互以及视觉伺服都具有极其重要的意义。
视觉跟踪的实时性是仿人机器人的重要性能要求之一。针对这一系统要求,近年来有很多学者设计出了多种系统结构。文[1]中作者设计了一种基于CAN总线的分布式的仿人机器人的控制系统,其中的视觉系统通过无线局域网与控制系统进行通讯。日本仿人机器人ASIMO的运动控制系统采用集中式控制方式,视觉系统通过网络与运动控制系统通讯[2]。一台计算机难以满足视觉跟踪的实时性要求,为了实现实时跟踪,本文提出并实现了一种基于MemoLink通讯的双计算机的视觉跟踪系统。该系统通讯可靠、体积小,便于将两台计算机安置于仿人机器人的胸腔内。
目标分割的稳定性是机器人视觉跟踪系统的重要要求之一,近几年来很多学者对这个领域进行了研究,大多数的机器人目标跟踪系统选用了单一的图像信息,有的采用了物体的颜色信息[3],有的采用了物体的轮廓信息[4]。然而在复杂的非结构化的室内背景下,单一的图像信息不能保证系统稳定的分割出目标。多种图像信息的融合是解决目标物体识别稳定性的方法之一[5]。本文中作者提出了一种集成深度、颜色和形状信息的逐步逼近目标区域的快速目标分割方法
1 系统结构
仿人机器人BHR1的系统结构如图1所示,其全身有32个自由度,其中头部有2个自由度,可以在两个方向上自由转动,即左右转动和上下转动。面部放置两只CCD摄像头作为视觉传感器来模拟人的眼睛。采用SVS立体视觉处理系统处理视觉信息,SVS系统提供了每帧图像的深度图像[6]。
图1 仿人型机器人(BHR1)跟踪系统的系统结构
两台计算机置于机器人的胸腔内,其中一台计算机负责视觉信息的处理,另外一台负责机器人的运动控制。前者被称之为信息处理子系统,后者被称为运动控制子系统, 两台计算机通过Memolink进行通讯。信息处理子系统利用Windows强大的多媒体功能来处理立体视觉信息,实现目标的快速分割以及物体的运动估计和预测。运动控制子系统以Linux/RT-Linux实时操作系统作为平台,保证了机器人控制系统的实时性。除了头部运动关节,运动控制系统负责仿人机器人全部关节的控制。Memolink 是系统间进行快速通信的一种有效解决方案,是连接信息处理子系统和运动控制子系统的桥梁。具有通信速度快和通信前无需握手的优点。
整个跟踪过程执行如下的循环:搜索目标——发现目标——匹配——状态估计和预测——运动控制。不同的匹配方法应用产生了不同的跟踪方法。本文中作者提出了一种融合深度、颜色和形状信息的逐步逼近目标区域的快速分割方法。在实时的跟踪系统中,运动估计和预测有效的减少了检测区域,提高了系统的跟踪速度。研究中采用经典的卡尔曼滤波器进行运动目标的状态估计和预测。
2 基于多图像信息的目标分割方法
视觉信息处理子系统完成目标物体的快速分割,同时估计和预测目标物体的运动信息,把目标物体的位置信息实时地传递给运动控制子系统。目标识别的稳定性对整个跟踪系统的稳定性起着至关重要的作用。
在复杂背景的非结构化的室内环境下,用于机器人视觉跟踪的图像信息有:深度、颜色、形状、边缘、运动等。基于多信息的运动目标的分割方法中,所选取的信息应该具有互补性。物体的颜色是物体最显著的特征,适合用于目标的跟踪。但是当背景中包含同样颜色的物体时,基于颜色的跟踪将会失败。深度信息有助于系统得到粗略的前景区域,也就是包含运动物体的目标候选窗口,另外基于深度分割的粗略前景轮廓的获得计算量小,速度快。基于RHT(Random Hough transform)算法的形状检测器可以检测各种不同的几何形状,比如:椭圆形、三角形和多边形,进而把目标候选区域中相同颜色的物体区别开来。