掌桥专利:专业的专利平台
掌桥专利
首页

一种基于视觉生成的机械臂自动组装方法

文献发布时间:2024-04-18 20:01:23


一种基于视觉生成的机械臂自动组装方法

技术领域

本发明涉及机械臂自动组装技术领域,具体为一种基于视觉生成的机械臂自动组装方法。

背景技术

机械臂是机械人技术领域中得到最广泛实际应用的自动化机械装置,手臂是机器人执行机构中重要的部件,作用是将被抓取的工件运送到给定的位置。机械臂是指高精度,多输入多输出、高度非线性、强耦合的复杂系统,其通常由以下几部分组成:运动元件,导向装置,手臂等。手臂的结构、工作范围、灵活性、承载能力和定位精度都直接影响机器手臂的工作性能。

机械臂在产业自动化的应用相当广泛,主要使用在人工无法进行或者会耗费较多时间来做的工作,在精度与耐用性上可以减少人为的不可预知的问题。机械臂是机械人技术领域中得到最广泛实际应用的自动化机械装置,在工业制造、医学治疗、娱乐服务、军事、半导体制造以及太空探索等领域都能见到它的身影。

目前最常用的对机械臂进行控制的方法是基于指令的机械臂控制,为了让机械臂完成相应的任务,需要向机械臂发送一系列的指令,机械臂需要根据接收到的指令,精确地定位到三维(或二维)空间上的某一点进行作业。但基于预设的指令的机械臂控制,需要有经验的工作人员花费大量精力进行重新地校准、设计、调整且缺乏灵活性,且对于机械臂的执行缺乏一定的灵活性。强化学习也逐渐地应用于机械臂控制领域,但存在准确率低,并且没有可解释性,很难通过人工进行修正的问题。

因此,如何提高机械臂自动控制的准确性,提高机械臂控制的灵活性,提高机械臂指令修正的灵活性就变得尤其重要。

发明内容

本发明的目的在于提供一种基于视觉生成的机械臂自动组装方法,通过将指令控制和深度学习相结合的方法来解决上述背景技术中提出的机械臂自动控制的准确性低,指令修正、机械臂控制灵活性差的问题。

为了解决上述技术问题,本发明提供如下技术方案:一种基于视觉生成的机械臂自动组装方法,包括:

从工程图源中获取工程图和对应的3D工程图,构建循环生成对抗网络训练集;

将循环生成对抗网络训练集进行训练,得到循环生成对抗网络;

从目标工程图源中获取目标工程图,将目标工程图输入到循环生成对抗网络中,生成3D标准工程图;

在模拟环境中利用强化学习近端策略优化算法进行策略优化,得到策略函数π(·;

基于3D标准工程图、目标图像和策略函数π(·,通过策略模型生成控制指令,机械臂执行控制指令,直至目标图像与3D标准工程图的相似度高于阈值α时,结束执行进程。

所述目标工程图源是指由根据目标任务绘制成的工程图组成的数据库;

所述工程图可以通过手绘、软件等方式进行绘制,工程图不限于格式,颜色可以是多样的;所述工程图源是由许多工程图和对应的3D工程图构成的图源库,所述循环生成对抗网络训练集里包含一张工程图和一张对应的3D工程图。

根据上述技术方案,所述循环生成对抗网络构建的步骤为:

输入循环生成对抗网络训练集,生成器1根据工程图输出模拟的3D工程图,鉴别器1对3D工程图和模拟的3D工程图进行区别鉴别;

生成器2根据3D工程图输出模拟的工程图,鉴别器2对工程图和模拟工程图进行区别鉴别;

生成器1和鉴别器1不断对抗,生成器2和鉴别器2也不断对抗,直至生成与3D工程图无法区分的模拟3D工程图。

利用生成器和鉴别器不断对抗使得生成的3D工程图的精准度不断提高,为强化学习提供了更加精准的3D标准工程图。

根据上述技术方案,所述目标图像为机械臂上单目摄像头捕获的图像。

根据上述技术方案,所述策略模型建立的步骤为:

确定环境状态s

根据策略函数π(·,环境状态s

对奖赏函数J(π)进行求导,利用梯度下降算法来优化策略函数,得到策略模型a

其中,γ∈[0,1]为一个常数折扣因子,t表示时间,T表示总时间。

根据上述技术方案,所述环境状态s

根据上述技术方案,所述动作状态a

根据上述技术方案,所述奖赏函数获得步骤为:

利用预训练的VGG模型对3D标准工程图进行处理,得到3D标准工程图RGB特征向量;

利用预训练的VGG模型对机械臂上单目摄像头捕获的目标图像进行处理,得到目标图像RGB特征向量;

对3D标准工程图RGB特征向量和目标图像RGB特征向量进行相似度计算,得到奖赏函数。

所述预训练的VGG模型主要用于图像分类,取该神经网络模型的倒数第二层的特征输出,可以用该特征对图像进行一个压缩的表示。

根据上述技术方案,所述相似度计算表示为对3D标准工程图RGB特征向量和目标图像RGB特征向量进行均方误差计算;

所述均方误差计算公式为:

其中,A,B分别代表结果图像与生成的3D图像的特征向量,i代表特征向量的每隔一位置,A

与现有技术相比,本发明所达到的有益效果是:

1、本发明设置循环生成对抗网络,通过输入工程图自动生成更精准的3D标准工程图,以3D标准工程图为标准下达指令,也就是3D标准工程图的精准度越高,下达的控制指令越精准,且具有较好的可解释性,同时可以方便地通过人工对中间过程进行修正。

2、本发明利用强化学习和循环生成对抗网络,实现可解释、端到端、可迁移的机械臂控制方法,仅需要输入简单的工程图,利用循环生成对抗网络生成3D标准工程图,强化学习的方法生成机械臂控制指令,进而实现对机械臂进行自动控制,无需对机械臂进行逐步的调试、设计,使得机械臂自动控制更加灵活。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1是本发明一种基于视觉生成的机械臂自动组装步骤流程图示意图;

图2是循环生成对抗网络的训练示意图;

图3是输入到循环生成对抗网络的工程图;

图4是生成的3D标准工程图;

图5是强化学习流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-图5,本发明提供技术方案:一种基于视觉生成的机械臂自动组装方法,包括:

S1、从工程图源中获取工程图和对应的3D工程图,构建循环生成对抗网络训练集;

S2、将循环生成对抗网络训练集进行训练,得到循环生成对抗网络,具体为输入循环生成对抗网络训练集,生成器1根据工程图输出模拟的3D工程图,鉴别器1对3D工程图和模拟的3D工程图进行区别鉴别;生成器2根据3D工程图输出模拟的工程图,鉴别器2对工程图和模拟工程图进行区别鉴别;生成器1和鉴别器1不断对抗,生成器2和鉴别器2也不断对抗,直至生成与3D工程图无法区分的模拟3D工程图,其训练过程如图2所示。

S3、从目标工程图源中获取目标工程图,将目标工程图输入到循环生成对抗网络中,生成3D标准工程图,其中输入到循环生成对抗网络的工程图如图3所示,生成的3D标准工程图如图4所示;

S4、在模拟环境中利用强化学习近端策略优化算法进行策略优化,得到策略函数π9·;

S5、基于3D标准工程图、目标图像和策略函数π(·,通过策略模型生成控制指令,机械臂执行控制指令,直至目标图像与3D标准工程图的相似度高于阈值α时,结束执行进程。

其中,策略模型建立的步骤:首先确定环境状态s

根据策略函数π(·,环境状态s

对奖赏函数J(π)进行求导,利用梯度下降算法来优化策略函数,得到策略模型a

奖赏函数获得步骤为:利用预训练的VGG模型对类型为(224,224,3),宽和高分别为224,RGB3个通道的3D标准工程图为进行处理,得到3D标准工程图RGB特征向量;

利用预训练的VGG模型对机械臂上单目摄像头捕获的(224,224,3),宽和高分别为224,RGB3个通道的目标图像进行处理,得到目标图像RGB特征向量;

对3D标准工程图RGB特征向量和目标图像RGB特征向量进行相似度计算,得到奖赏函数,相似度计算表示为对3D标准工程图RGB特征向量和目标图像RGB特征向量进行均方误差计算,其公式为:

其中,A,B分别代表结果图像与生成的3D图像的特征向量,i代表特征向量的每隔一位置,A

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种图像匹配方法、装置、电子设备及存储介质
  • 关键点匹配方法、装置、电子设备以及存储介质
  • 文本属性字段的匹配方法、装置、电子设备及存储介质
  • 航带匹配方法、装置、电子设备和可读存储介质
  • 药品购买自动匹配方法、装置、电子设备及存储介质
  • 一种预测模型的匹配方法、装置、电子设备及存储介质
  • 行为预测模型训练方法、房源匹配方法、装置及存储介质
技术分类

06120116546912