全球物流行业不断演变,货物搬运机器人成为物流仓储中提升效率和降低成本的关键。针对中小型物流仓库的需求,研究开发了一种基于目标检测的六自由度机器臂麦轮机器人。结合目标检测技术与搬运策略,实现了高准确性和实时货物识别,显著提高了操作效率和可靠性,尤其适用于满足中小电商不断增长的物流需求。
物流行业是现代全球经济体系的重要组成部分,同时也是支撑经济发展的重要组成部分,电子商务的快速发展不仅推动了物流行业的发展,对物流行业也是一次全新的挑战,亟需不断探索创新解决方案,以提高效率、降低成本和适应多样性需求。
在这一背景下,机器人技术正逐渐崭露头角,成为提升物流运营效率的关键因素之一。大型物流公司如京东快递等已经通过建立大型物流仓库管理运输系统实现了高效的运营。而对于中小型仓库物流行业来说,实现这样的自动化管理系统需要巨大的投入,且成本回收周期长。现有的物流搬运机器人功能较为单一,只能在特定区域和路线上进行运输或搬运,且无法有效识别物体。
本文旨在建立一个基于目标检测的货物搬运机器人,通过使用目标检测技术,实现对中小型仓库中的物品进行智能识别和自动化管理。通过对目标检测技术和自主导航系统的整合,本文设计和实现了一个六自由度机器臂麦轮机器人系统,提高了中小型仓库中物流操作的效率和可靠性。
本文逐步介绍六自由度机器臂麦轮机器人的设计和实验结果的分析,在对目标检测模型YOLO v5s进行多轮参数调试和训练后,从P-R曲线、m A P曲线和F1分数曲线等多个性能指标对模型进行性能评估[3],部署机器人进行实机实验后,能够完成所分配的任务,说明该机器人能够更好地提高中小型仓库的物流存储效率。
本款货物搬运机器人包括五个主要部分:麦科勒姆轮式平台、六自由度机械臂、摄像头、控制器和机械夹爪。这些组件协同工作,使机器人能够在中小型物流仓储环境中执行智能化的搬运和管理任务。
六自由度机器臂麦轮机器人的硬件结构。
麦克纳姆轮式平台作为机械臂的载体,由控制器控制。它不仅承载机械臂,还能够根据摄像头获取的图像信息灵活地调整自身的运动姿态,以便与机械臂协同工作,实现对货物的联合抓取和搬运。此外,该平台还可用作移动平台,使机器人能够在仓库内自由移动,执行货物搬运任务。
六自由度机械臂由控制器进行精确控制,拥有多重旋转自由度,能够在竖直和前后上下方向上旋转,实现多样的空间姿态变化。这种多自由度机械臂不仅能用于货物抓取和放置,还用于控制摄像头的移动,帮助采集仓库内不同位置的图像信息。
摄像头模块位于机械臂顶部,负责采集图像,用于识别和分类仓库中的货物,包括各种颜色的快递箱和快递袋。通过目标检测技术,摄像头还能进行路径规划,确定货物堆放点及不同种类货物的存放点。
机械夹爪位于机械臂的顶端,与摄像头模块处于同一转轴。机械夹手由控制器控制其开合动作,实现对货物的抓取和放置操作。它是执行搬运任务中的关键组件,确保了机器人能够有效地处理不同类型和尺寸的货物。
整个六自由度机器臂麦轮机器人系统的硬件设计流程图如1所示。通过这些硬件组件的协同工作,该机器人能够实现对货物存放点中各种颜色的快递箱和快递袋识别、夹取和放置,以及通过路径规划自主移动到不同种类快递箱和快递袋存放点,从而提供一种简单有效的物流管理方案。
机械臂是本款机器人的核心硬件结构,为了提高机器人对快递盒的搬运效率,在参考了目前机器人领域内机械臂设计的相关材料与文献,最终决定采用经典的六自由度机械臂的设计。六自由度机械臂已经在许多工业机器人中投入使用,其高灵活性和可编程的优点在实际应用中已经得到验证与肯定。由于经费有限,并且想在固定的货物堆放点实现对快递盒进行较大区域的识别搬运,从而提高机器人的物流效率,因此,本文设计了一个成本更低的小型六自由度机械臂,通过购买低成本的舵机和零部件自行搭建组成,对机械臂进行三维建模,如图2所示。
麦克纳姆轮是一种独特的机器人轮式结构,其设计使得机器人可以在任何方向上自由移动,而车体无需进行大幅度运动。这种结构作为移动平台搭载机械臂和其他装备是本文的最佳选择,它不仅可以提高移动效率,还得益于可以全向移动的优势,使其可以在复杂的空间中实现灵活的移动。本次任务使用的麦克纳姆轮式平台如图3所示。
轮式平台的俯视图如图4所示,将左上与右下定义为A轮,左下与右上定义为B轮。
当四个轮子同时向前旋转时,上下A、B轮能够相互抵消轴向速度,仅保留向前的速度,使得底盘能够向前移动而不产生偏移;反之,当四个轮子同时向后旋转时,同理实现向后稳定移动。
当四个轮子同时向前旋转时,如图5a所示,上下A、B轮能够相互抵消轴向速度,仅保留向前的速度,使得底盘能够向前移动而不产生偏移;反之,当四个轮子同时向后旋转时,同理实现向后稳定移动。
当A轮正转、B轮静止时,如图5b所示,底盘向右前方运动;当A轮反转、B轮静止时,底盘向左后方运动。相应地,当A轮静止、B轮正转时,底盘向左前方运动;当A轮静止、B轮反转时,底盘向右后方运动。
当A轮正转、B轮反转时,如图5c所示,底盘的向前和向后速度相互抵消,仅留下向右的速度,从而实现底盘向右平移;当A轮反转、B轮正转时,底盘向左平移。
当左侧轮子正转、右侧轮子反转时,如图5d所示,能实现向右旋转;反之,底盘会向左旋转。
通过这种方式,轮式平台实现了任意方向的平移、旋转运动及定位。
各轮运动情况见表1。
电动机是轮式平台的重要驱动部分,在该轮式平台使用直流减速电动机,如图6所示,以满足系统对高性能、强可控性的需求。
该款电动机的优点在于整合了编码器和驱动,使得性能不变的情况下能够有更小的体积,减速前电动机转速16 000 r/min,减速后也能达到355 r/min,满足任务所需,采用Allegro汽车级双霍尔编码器。这一编码器的特性为系统提供了高准确度的位置检测,是实现准确控制的关键组成部分。电动机工作电压在6~12 V间,该电动机扭矩能够达到2.5 k g·c m,能够为轮式平台提供很好的加速性能和承载能力。
六自由度机器臂麦轮机器人工作的软件流程图如图7所示。
首先,机器人通过图像采集摄像头获取到货物堆放点中各种货物的图像,并将其传递给控制器。控制器对图像进行分析,判断货物是否为快递盒。若是快递盒,该机器人将移动到快递盒的位置,进行颜色分类程序,然后通过将物体位置信息转换成坐标,控制机械臂的电动机和夹爪拾取快递盒,并将其放置到机器人上的存储区,最后移动到快递盒相应的存放点按照分类进行卸货,卸货后自动返回货物堆放点进行新一轮流程。如果货物不是快递盒,机器人会继续进行货物图像采集,并进入下一轮流程判断,直到货物堆放点没有快递盒为止。通过以上流程,本货物搬运机器人可以根据实时的图像信息,智能地对快递盒进行识别、分类和搬运,从而提供一种高效便捷的物流管理方案。
在目标检测方面,本文使用YOLO v5来实现对快递盒的目标检测任务。YOLO v5是一种基于深度卷积神经网络(CNN)的实时目标检测算法,具有高效、准确和多尺度检测的特点。其算法流程包括输入预处理、特征提取、多尺度检测、预测边界框和类别、NMS抑制以及后处理等步骤。
自行制作不同颜色的仿真快递盒,用颜色信息代替快递单上的物流信息,从而通过摄像头拍摄制作出包含6类不同颜色快递盒的货物数据集用于模型训练。该数据集采集了不同光线、不同角度下的货物图像327张,其中训练集294张,测试集包含33张,采集的图像分辨率为640×640像素,部分数据集图像如图8所示。
以下为目标检测模型训练的基本参数设置。
1)数据预处理。使用经典的目标检测数据集COCO(Common Objects in Context)对训练数据进行预处理,以提高模型的泛化能力以及鲁棒性。
2)模型配置。根据模型复杂度,Y O L O v 5的网络结构可以分为YOLO v5s、YOLO v5m、YOLO v5l、Y O L O v5x,且基本框架大致相同。网络结构越复杂,模型检测准确度越高,速度越慢。综合考虑模型的检测准确度与实时性的关系,本研究采用YOLO v5s目标检测模型进行实验。
3)损失函数。使用G I o U_L O S S(广义交叉联合)作为边框回归的损失函数,同时结合类别预测的交叉熵损失(CLS)、非极大抑制(NMS)等,以实现在检测任务中对目标的精准定位和分类的优化。
4)优化器。使用随机梯度下降(S G D)优化器,设置合适的基本参数(学习率为0.01、动量为0.9),以提高模型的训练速度和收敛速度。
5)训练参数。总训练轮数设为3 0 0,每步训练的图片数设为32,输入图片尺寸设为640×640,工作线程数设为8,初始化学习率设为0.01,置信度阈值设为0.6。
经过训练后,模型在测试集上的均值平均准确度达到了0.974,说明本文采用的YOLO v5模型在自行制作的货物数据集中的性能表现十分优异,为实现货物精准识别和目标检测提供了极为有效的解决方案。
训练好的目标检测模型的P-R(精确率-召回率)曲线、m A P(平均准确度)曲线和F1分数曲线如图9~图11所示。通过这些曲线能够进一步对该模型的性能进行评估,相关性能指标的计算公式为
式中,T P为真正样本数量;F P为假正样本数量;F N为假负样本数量;A P为单个类别的平均精准度;n为样本总数Rk、Pk、f1k为单个类别的R、P、F1分数。
图9为P-R曲线,其中横坐标为召回率R,纵坐标为精确率P,由P-R曲线可知,该模型准确度的值在召回率为0.7之前大约为0.9,之后则显著下降。表明该模型在召回率低于0.7时,有较高的准确性,能够有效地识别出真正的目标,而不是错误地将其他对象识别为目标。
图10为m A P曲线,其中横坐标为I o U阈值,纵坐标为m AP。由m AP曲线可知,该模型m AP的值在不同的Io U阈值下都接近0.8,表明该模型在检测目标的位置方面有较强的鲁棒性,即使目标之间有不同程度的重叠,也能够准确地给出目标的边界框。
图11为F1分数曲线,其中横坐标为置信度阈值,纵坐标为F1分数。由F1分数曲线可知,该模型在阈值为0.9之前接近1,之后则急剧下降。F1分数是准确度和召回率的调和平均数,可以衡量模型在识别目标的准确性和完整性之间的平衡。综合表明该模型在召回率低于0.8时,能够同时保持较高的准确度和召回率,既不会漏检真实的目标,也不会误检其他的对象。
将训练好的模型部署在六自由度机器臂麦轮机器人上后,运行程序进行对货物的识别测试,测试的部分结果如图12所示。进一步验证了该目标检测模型在识别不同尺寸大小的货物时表现出较好的鲁棒性和泛化能力,表现出稳定的性能,能够准确地检测出货物类别进行搬运,说明本文的六自由度机器臂麦轮机器人为提高中小型物流仓储业务的效率提供了新的可能性。
本文介绍了基于目标检测的六自由度机器臂麦轮机器人的系统架构和主要组件,包括硬件和机械系统的设计、货物搬运的策略、操作执行以及目标检测技术的实施等。通过应用目标检测技术,该机器人能够准确识别和搬运货物,并根据预定的策略进行物流仓储操作。然而,该系统仍然面临着诸多挑战,需要进一步的优化和改进。基于目标检测的六自由度机器臂麦轮机器人有望为中小型物流仓储业务提供新的可能性,推动行业的智能化和现代化发展。