掌桥专利:专业的专利平台
掌桥专利
首页

手与物体交互过程的重建方法、装置、电子设备及介质

文献发布时间:2023-06-19 19:28:50


手与物体交互过程的重建方法、装置、电子设备及介质

技术领域

本申请涉及三维重建技术领域,特别涉及一种手与物体交互过程的重建方法、装置、电子设备及介质。

背景技术

在人们的日常生活中,经常需要用手与环境中的物体进行交互动作,因此对手与物体的交互过程进行重建是三维重建领域所要解决的一类重要问题。该技术可以生成计算机动画或真实的交互运动数据,还可以帮助理解交互过程中的动作语义,在虚拟现实、人机交互领域有着广泛的应用前景。

相关技术中,手物交互重建技术都是完全基于视觉的方法,这些方法可以分为两大类,第一类方法是基于优化的方法,通过构造一个能量函数并进行优化求解得到与相机观测数据最为相符的手和物体位姿;第二类方法是基于深度学习的方法,通过大量的数据训练一个深度网络,使得该网络能够直接从视频或图片中估计手和物体位姿。

然而,基于优化的方法需要通过深度相机采集深度数据,而这些数据本身是带有噪声的,会给重建过程带来误差;而基于深度学习的方法往往对于物体的泛化性不足,此外,这两大类完全基于视觉的方法都有一个共同的缺点,即手和物体在交互过程中会发生相互遮挡,造成观测数据的缺失,使得重建过程具有模糊性,亟待解决。

发明内容

本申请提供一种手与物体交互过程的重建方法、装置、电子设备及介质,以解决手和物体在交互过程中发生相互遮挡,造成观测数据缺失的问题,从而提升重建过程的清晰度,得到更加准确的重建结果。

本申请第一方面实施例提供一种手与物体交互过程的重建方法,包括以下步骤:

采集手与物体交互过程的视觉数据和压力数据;

对所述视觉数据进行手物交互重建,得到初始手物姿态,其中,所述初始手物姿态包括手的姿态参数和物体的六自由度位姿;以及

根据所述压力数据优化所述手的姿态参数和所述物体的六自由度位姿,得到最终手物姿态,以根据所述最终手物姿态得到所述手与所述物体交互过程的重建结果。

根据本申请的一个实施例,所述根据所述压力数据优化所述手的姿态参数和所述物体的六自由度位姿,包括:

基于预设的第一能量优化函数,根据所述压力数据优化所述手的姿态参数和所述物体的六自由度位姿,其中,所述预设的第一能量优化函数为:

E

其中,θ为所述手的姿态参数,W为所述物体的六自由度位姿,E

根据本申请的一个实施例,E

其中,SDF

根据本申请的一个实施例,E

E

其中,Trans为物体六自由度位姿的平移部分,Rot为物体六自由度位姿的旋转部分。

根据本申请的一个实施例,所述对所述视觉数据进行手物交互重建,包括:

基于预设的手物交互重建系统或预设的能量函数,对所述视觉数据进行手物交互重建,其中,所述预设的能量函数为:

E(θ,W)=E

其中,E

根据本申请的一个实施例,所述压力数据包括多个压力值,在根据所述压力数据优化所述手的姿态参数和所述物体的六自由度位姿之前,还包括:

剔除所述多个压力值中未满足预设压力条件的压力值。

根据本申请实施例提出的手与物体交互过程的重建方法,通过对视觉数据进行手物交互重建,得到初始手物姿态,通过根据压力数据优化初始手物姿态包括的手的姿态参数和物体的六自由度位姿,得到最终手物姿态,以根据最终手物姿态得到手与物体交互过程的重建结果。由此,解决了手和物体在交互过程中发生相互遮挡,造成观测数据缺失的问题,从而提升重建过程的清晰度,得到更加准确的重建结果。

本申请第二方面实施例提供一种手与物体交互过程的重建装置,包括:

采集模块,用于采集手与物体交互过程的视觉数据和压力数据;

重建模块,用于对所述视觉数据进行手物交互重建,得到初始手物姿态,其中,所述初始手物姿态包括手的姿态参数和物体的六自由度位姿;以及

优化模块,用于根据所述压力数据优化所述手的姿态参数和所述物体的六自由度位姿,得到最终手物姿态,以根据所述最终手物姿态得到所述手与所述物体交互过程的重建结果。

根据本申请的一个实施例,所述优化模块,具体用于:

基于预设的第一能量优化函数,根据所述压力数据优化所述手的姿态参数和所述物体的六自由度位姿,其中,所述预设的第一能量优化函数为:

E

其中,θ为所述手的姿态参数,W为所述物体的六自由度位姿,E

根据本申请的一个实施例,E

其中,SDF

根据本申请的一个实施例,E

E

其中,Trans为物体六自由度位姿的平移部分,Rot为物体六自由度位姿的旋转部分。

根据本申请的一个实施例,所述重建模块,具体用于:

基于预设的手物交互重建系统或预设的能量函数,对所述视觉数据进行手物交互重建,其中,所述预设的能量函数为:

E(θ,W)=E

其中,E

根据本申请的一个实施例,所述压力数据包括多个压力值,在根据所述压力数据优化所述手的姿态参数和所述物体的六自由度位姿之前,所述优化模块,还用于:

剔除所述多个压力值中未满足预设压力条件的压力值。

根据本申请实施例提出的手与物体交互过程的重建装置,通过对视觉数据进行手物交互重建,得到初始手物姿态,通过根据压力数据优化初始手物姿态包括的手的姿态参数和物体的六自由度位姿,得到最终手物姿态,以根据最终手物姿态得到手与物体交互过程的重建结果。由此,解决了手和物体在交互过程中发生相互遮挡,造成观测数据缺失的问题,从而提升重建过程的清晰度,得到更加准确的重建结果。

本申请第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的手与物体交互过程的重建方法。

本申请第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的手与物体交互过程的重建方法。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本申请实施例提供的一种手与物体交互过程的重建方法的流程图;

图2为根据本申请的一个实施例的压力传感器的放置位置的示意图;

图3为根据本申请实施例提供的手与物体交互过程的重建装置的方框示意图;

图4为根据本申请实施例的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

下面参考附图描述本申请实施例的手与物体交互过程的重建方法、装置、电子设备及介质。针对上述背景技术中提到的手和物体在交互过程中发生相互遮挡,造成观测数据缺失的问题,本申请提供了一种手与物体交互过程的重建方法,在该方法中,通过对视觉数据进行手物交互重建,得到初始手物姿态,通过根据压力数据优化初始手物姿态包括的手的姿态参数和物体的六自由度位姿,得到最终手物姿态,以根据最终手物姿态得到手与物体交互过程的重建结果。由此,解决了手和物体在交互过程中发生相互遮挡,造成观测数据缺失的问题,从而提升重建过程的清晰度,得到更加准确的重建结果。

具体而言,图1为本申请实施例所提供的一种手与物体交互过程的重建方法的流程图。

如图1所示,该手与物体交互过程的重建方法包括以下步骤:

在步骤S101中,采集手与物体交互过程的视觉数据和压力数据。

具体而言,本申请实施例通过两种不同类型的设备采集手与物体交互过程的数据,第一种设备是相机,用来采集手与物体交互过程的视觉数据;第二种设备是可穿戴在手上的压力传感器,用来采集手与物体交互过程中的压力数据。

在步骤S102中,对视觉数据进行手物交互重建,得到初始手物姿态,其中,初始手物姿态包括手的姿态参数和物体的六自由度位姿。

具体而言,在本申请实施例中,相机采集到的视觉数据可以通过已有的手与物体交互重建系统对物体几何重建,并对手和物体的姿态进行一个粗略的估计,得到初始手物姿态,其中,初始手物姿态包括手的姿态参数θ和物体的六自由度位姿W。

进一步地,在一些实施例中,对视觉数据进行手物交互重建,包括:基于预设的手物交互重建系统或预设的能量函数,对视觉数据进行手物交互重建,其中,预设的能量函数为:

E(θ,W)=E

其中,E

需要说明的是,E

在步骤S103中,根据压力数据优化手的姿态参数和物体的六自由度位姿,得到最终手物姿态,以根据最终手物姿态得到手与物体交互过程的重建结果。

具体而言,如图2所示,本申请实施例共采用了21个可穿戴的压力传感器,分别放置在手的不同关键点上,用于采集不同区域的压力,在交互过程中,当手的某个部位与物体接触并对物体施加压力时,相应部位的传感器可以采集到该部位的压力值,所有关键点的压力值记为

在得到初始手物姿态以及所有部位的压力值后,本申请实施例通过压力数据优化手物姿态,使得有压力的地方手和物体是相互接触的。

进一步地,在一些实施例中,根据压力数据优化手的姿态参数和物体的六自由度位姿,包括:基于预设的第一能量优化函数,根据压力数据优化手的姿态参数和物体的六自由度位姿,其中,预设的第一能量优化函数为:

E

其中,θ为所述手的姿态参数,W为所述物体的六自由度位姿,E

需要说明的是,第一项E

其中,在一些实施例中,E

其中,SDF

其中,在一些实施例中,E

E

其中,Trans为物体六自由度位姿的平移部分,Rot为物体六自由度位姿的旋转部分。

进一步地,在一些实施例中,压力数据包括多个压力值,在根据压力数据优化手的姿态参数和物体的六自由度位姿之前,还包括:剔除多个压力值中未满足预设压力条件的压力值。

可以理解的是,为了避免压力传感器的误差导致对是否接触产生错误的判断,本申请实施例对压力大小设置了一个阈值α,只有当压力值大于等于阈值时才认为手和物体之间发生了接触。

根据本申请实施例提出的手与物体交互过程的重建方法,通过对视觉数据进行手物交互重建,得到初始手物姿态,通过根据压力数据优化初始手物姿态包括的手的姿态参数和物体的六自由度位姿,得到最终手物姿态,以根据最终手物姿态得到手与物体交互过程的重建结果。由此,解决了手和物体在交互过程中发生相互遮挡,造成观测数据缺失的问题,从而提升重建过程的清晰度,得到更加准确的重建结果。

其次参照附图描述根据本申请实施例提出的手与物体交互过程的重建装置。

图3是本申请实施例的手与物体交互过程的重建装置的方框示意图。

如图3所示,该手与物体交互过程的重建装置10包括:采集模块100、重建模块200和优化模块300。

其中,采集模块100,用于采集手与物体交互过程的视觉数据和压力数据;

重建模块200,用于对视觉数据进行手物交互重建,得到初始手物姿态,其中,初始手物姿态包括手的姿态参数和物体的六自由度位姿;以及

优化模块300,用于根据压力数据优化手的姿态参数和物体的六自由度位姿,得到最终手物姿态,以根据最终手物姿态得到手与物体交互过程的重建结果。

进一步地,在一些实施例中,优化模块300,具体用于:

基于预设的第一能量优化函数,根据压力数据优化手的姿态参数和物体的六自由度位姿,其中,预设的第一能量优化函数为:

E

其中,θ为所述手的姿态参数,W为所述物体的六自由度位姿,E

进一步地,在一些实施例中,Etac具体计算式为:

其中,SDF

进一步地,在一些实施例中,E

E

其中,Trans为物体六自由度位姿的平移部分,Rot为物体六自由度位姿的旋转部分。

进一步地,在一些实施例中,重建模块200,具体用于:

基于预设的手物交互重建系统或预设的能量函数,对视觉数据进行手物交互重建,其中,预设的能量函数为:

E(θ,W)=E

其中,E

进一步地,在一些实施例中,压力数据包括多个压力值,在根据压力数据优化手的姿态参数和物体的六自由度位姿之前,优化模块300,还用于:

剔除多个压力值中未满足预设压力条件的压力值。

需要说明的是,前述对手与物体交互过程的重建方法实施例的解释说明也适用于该实施例的手与物体交互过程的重建装置,此处不再赘述。

根据本申请实施例提出的手与物体交互过程的重建装置,通过对视觉数据进行手物交互重建,得到初始手物姿态,通过根据压力数据优化初始手物姿态包括的手的姿态参数和物体的六自由度位姿,得到最终手物姿态,以根据最终手物姿态得到手与物体交互过程的重建结果。由此,解决了手和物体在交互过程中发生相互遮挡,造成观测数据缺失的问题,从而提升重建过程的清晰度,得到更加准确的重建结果。

图4为本申请实施例提供的电子设备的结构示意图。该电子设备可以包括:

存储器401、处理器402及存储在存储器401上并可在处理器402上运行的计算机程序。

处理器402执行程序时实现上述实施例中提供的手与物体交互过程的重建方法。

进一步地,电子设备还包括:

通信接口403,用于存储器401和处理器402之间的通信。

存储器401,用于存放可在处理器402上运行的计算机程序。

存储器401可能包含高速RAM(Random Access Memory,随机存取存储器)存储器,也可能还包括非易失性存储器,例如至少一个磁盘存储器。

如果存储器401、处理器402和通信接口403独立实现,则通信接口403、存储器401和处理器402可以通过总线相互连接并完成相互间的通信。总线可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral Component,外部设备互连)总线或EISA(Extended Industry Standard Architecture,扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果存储器401、处理器402及通信接口403,集成在一块芯片上实现,则存储器401、处理器402及通信接口403可以通过内部接口完成相互间的通信。

处理器402可能是一个CPU(Central Processing Unit,中央处理器),或者是ASIC(Application Specific Integrated Circuit,特定集成电路),或者是被配置成实施本申请实施例的一个或多个集成电路。

本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的手与物体交互过程的重建方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或N个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“N个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更N个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,N个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列,现场可编程门阵列等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 交互方法、交互装置、电子设备及存储介质
  • 交互设计工具文件生成方法、装置、电子设备及存储介质
  • 一种语音交互方法、装置、电子设备及可读存储介质
  • 语音交互方法、装置以及电子设备、计算机可读介质
  • 语句条目交互方法与装置、电子设备、存储介质
  • 基于物理的手与物体交互过程的实时重建方法及装置
  • 手与物体交互过程的实时重建方法及装置
技术分类

06120115928539