掌桥专利:专业的专利平台
掌桥专利
首页

三维眉形的生成方法及装置、电子设备和存储介质

文献发布时间:2024-04-18 20:01:30


三维眉形的生成方法及装置、电子设备和存储介质

技术领域

本公开涉及人工智能技术领域,具体涉及计算机视觉、增强现实、虚拟现实、深度学习等技术领域,可应用于人工智能的内容生成、数字人等场景。

背景技术

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

三维虚拟形象(即,数字人)在社交、直播、游戏等用户场景具有广泛应用价值。利用人工智能技术,能够基于人脸图像生成定制化的三维虚拟形象,有效地满足用户的个性化需求。

在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

发明内容

本公开提供了一种三维眉形的生成方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

根据本公开的一方面,提供了一种三维眉形的生成方法,包括:获取眉形图像,其中,所述眉形图像标注有多条眉毛参考线,所述多条眉毛参考线中的每条眉毛参考线包括眉毛的根部点和外端点;对所述眉形图像进行深度估计,以得到所述多条眉毛参考线各自的根部点的深度值和外端点的深度值;以及基于所述多条眉毛参考线各自的根部点的深度值和外端点的深度值,生成所述眉形图像对应的三维眉形。

根据本公开的一方面,提供了一种三维眉形的生成装置,包括:获取模块,被配置为获取眉形图像,其中,所述眉形图像标注有多条眉毛参考线,所述多条眉毛参考线中的每条眉毛参考线包括眉毛的根部点和外端点;估计模块,被配置为对所述眉形图像进行深度估计,以得到所述多条眉毛参考线各自的根部点的深度值和外端点的深度值;以及生成模块,被配置为基于所述多条眉毛参考线各自的根部点的深度值和外端点的深度值,生成所述眉形图像对应的三维眉形。

根据本公开的一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。

根据本公开的一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述方法。

根据本公开的一方面,提供了一种计算机程序产品,包括计算机程序,其中,计算机程序在被处理器执行时能够实现上述方法。

根据本公开的一个或多个实施例,能够基于二维眉形图像自动生成三维眉形,提高了三维眉形的生成效率。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。

图1示出了根据本公开实施例的可以在其中实施本文描述的各种方法的示例性系统的示意图;

图2示出了根据本公开实施例的三维眉形的生成方法的流程图;

图3示出了根据本公开实施例的眉形图像的示意图;

图4示出了根据本公开实施例的三维眉形的生成过程的示意图;

图5示出了根据本公开实施例的三维眉形的生成装置的结构框图;以及

图6示出了能够用于实现本公开实施例的示例性电子设备的结构框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个元件与另一元件区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。

在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。“多个”指的是两个或两个以上。

本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

三维眉形是三维虚拟形象的重要组成部分,能够影响三维虚拟形象的外貌和风格。为了提高三维虚拟形象的真实度和细腻度,需要为其创建能够细腻地展示单根眉毛的走向和纹理的三维眉形。相关技术中,三维眉形通常由设计师手动创建,耗时长、效率低、成本高。

针对上述问题,本公开实施例提供了一种三维眉形的生成方法。根据本公开的实施例,通过估计二维眉形图像中的眉毛参考线的根部点和外端点的深度值,生成眉形图像对应的三维眉形。由此仅需在二维眉形图像中标注少量的眉毛参考线,即可自动生成该二维眉形图像对应的三维眉形,实现了三维眉形的自动化生成,大大提高了三维眉形的生成效率。

下面将结合附图详细描述本公开的实施例。

图1示出了根据本公开的实施例可以将本文描述的各种方法和装置在其中实施的示例性系统100的示意图。参考图1,该系统100包括一个或多个客户端设备101、102、103、104、105和106、服务器120以及将一个或多个客户端设备耦接到服务器120的一个或多个通信网络110。客户端设备101、102、103、104、105和106可以被配置为执行一个或多个应用程序。

在本公开的实施例中,客户端设备服务器120可以运行使得能够执行三维眉形的生成方法的一个或多个服务或软件应用。

在某些实施例中,服务器120还可以提供其他服务或软件应用,这些服务或软件应用可以包括非虚拟环境和虚拟环境。在某些实施例中,这些服务可以作为基于web的服务或云服务提供,例如在软件即服务(SaaS)模型下提供给客户端设备101、102、103、104、105和/或106的用户。

在图1所示的配置中,服务器120可以包括实现由服务器120执行的功能的一个或多个组件。这些组件可以包括可由一个或多个处理器执行的软件组件、硬件组件或其组合。操作客户端设备101、102、103、104、105和/或106的用户可以依次利用一个或多个客户端应用程序来与服务器120进行交互以利用这些组件提供的服务。应当理解,各种不同的系统配置是可能的,其可以与系统100不同。因此,图1是用于实施本文所描述的各种方法的系统的一个示例,并且不旨在进行限制。

用户可以使用客户端设备101、102、103、104、105和/或106来发送初始指令。客户端设备可以提供使客户端设备的用户能够与客户端设备进行交互的接口。客户端设备还可以经由该接口向用户输出信息。尽管图1仅描绘了六种客户端设备,但是本领域技术人员将能够理解,本公开可以支持任何数量的客户端设备。

客户端设备101、102、103、104、105和/或106可以包括各种类别的计算机设备,例如便携式手持设备、通用计算机(诸如个人计算机和膝上型计算机)、工作站计算机、可穿戴设备、智能屏设备、自助服务终端设备、服务机器人、游戏系统、瘦客户端、各种消息收发设备、传感器或其他感测设备等。这些计算机设备可以运行各种类别和版本的软件应用程序和操作系统,例如MICROSOFT Windows、APPLE iOS、类UNIX操作系统、Linux或类Linux操作系统(例如GOOGLE Chrome OS);或包括各种移动操作系统,例如MICROSOFT WindowsMobile OS、iOS、Windows Phone、Android。便携式手持设备可以包括蜂窝电话、智能电话、平板电脑、个人数字助理(PDA)等。可穿戴设备可以包括头戴式显示器(诸如智能眼镜)和其他设备。游戏系统可以包括各种手持式游戏设备、支持互联网的游戏设备等。客户端设备能够执行各种不同的应用程序,例如各种与Internet相关的应用程序、通信应用程序(例如电子邮件应用程序)、短消息服务(SMS)应用程序,并且可以使用各种通信协议。

网络110可以是本领域技术人员熟知的任何类别的网络,其可以使用多种可用协议中的任何一种(包括但不限于TCP/IP、SNA、IPX等)来支持数据通信。仅作为示例,一个或多个网络110可以是局域网(LAN)、基于以太网的网络、令牌环、广域网(WAN)、因特网、虚拟网络、虚拟专用网络(VPN)、内部网、外部网、区块链网络、公共交换电话网(PSTN)、红外网络、无线网络(例如蓝牙、Wi-Fi)和/或这些和/或其他网络的任意组合。

服务器120可以包括一个或多个通用计算机、专用服务器计算机(例如PC(个人计算机)服务器、UNIX服务器、中端服务器)、刀片式服务器、大型计算机、服务器群集或任何其他适当的布置和/或组合。服务器120可以包括运行虚拟操作系统的一个或多个虚拟机,或者涉及虚拟化的其他计算架构(例如可以被虚拟化以维护服务器的虚拟存储设备的逻辑存储设备的一个或多个灵活池)。在各种实施例中,服务器120可以运行提供下文所描述的功能的一个或多个服务或软件应用。

服务器120中的计算单元可以运行包括上述任何操作系统以及任何商业上可用的服务器操作系统的一个或多个操作系统。服务器120还可以运行各种附加服务器应用程序和/或中间层应用程序中的任何一个,包括HTTP服务器、FTP服务器、CGI服务器、JAVA服务器、数据库服务器等。

在一些实施方式中,服务器120可以包括一个或多个应用程序,以分析和合并从客户端设备101、102、103、104、105和106的用户接收的数据馈送和/或事件更新。服务器120还可以包括一个或多个应用程序,以经由客户端设备101、102、103、104、105和106的一个或多个显示设备来显示数据馈送和/或实时事件。

在一些实施方式中,服务器120可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器120也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。云服务器是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中存在的管理难度大、业务扩展性弱的缺陷。

系统100还可以包括一个或多个数据库130。在某些实施例中,这些数据库可以用于存储数据和其他信息。例如,数据库130中的一个或多个可用于存储诸如音频文件和视频文件的信息。数据库130可以驻留在各种位置。例如,由服务器120使用的数据库可以在服务器120本地,或者可以远离服务器120且可以经由基于网络或专用的连接与服务器120通信。数据库130可以是不同的类别。在某些实施例中,由服务器120使用的数据库例如可以是关系数据库。这些数据库中的一个或多个可以响应于命令而存储、更新和检索到数据库以及来自数据库的数据。

在某些实施例中,数据库130中的一个或多个还可以由应用程序使用来存储应用程序数据。由应用程序使用的数据库可以是不同类别的数据库,例如键值存储库,对象存储库或由文件系统支持的常规存储库。

图1的系统100可以以各种方式配置和操作,以使得能够应用根据本公开所描述的各种方法和装置。

根据一些实施例,客户端设备101-106可以被配置为执行本公开实施例的三维眉形的生成方法,基于标注有少量眉毛参考线的二维眉形图像生成三维眉形。

根据另一些实施例,客户端设备101-106可以将标注有少量眉毛参考线的二维眉形图像发送至服务器120。服务器120被配置为执行本公开实施例的三维眉形的生成方法,生成该二维眉形图像对应的三维眉形。

图2示出了根据本公开实施例的三维眉形的生成方法200的流程图。方法200的执行主体可以是客户端设备(例如图1中所示的客户端设备101-106),也可以是服务器(例如图1中所示的服务器120)。

如图2所示,方法200包括步骤S210-S230。

在步骤S210中,获取眉形图像。眉形图像标注有多条眉毛参考线,多条眉毛参考线中的每条眉毛参考线包括眉毛的根部点和外端点。

在步骤S220中,对眉形图像进行深度估计,以得到多条眉毛参考线各自的根部点的深度值和外端点的深度值。

在步骤S230中,基于多条眉毛参考线各自的根部点的深度值和外端点的深度值,生成眉形图像对应的三维眉形。

根据本公开的实施例,通过估计二维眉形图像中的眉毛参考线的根部点和外端点的深度值,生成眉形图像对应的三维眉形。由此仅需在二维眉形图像中标注少量的眉毛参考线,即可自动生成该二维眉形图像对应的三维眉形,实现了三维眉形的自动化生成,大大提高了三维眉形的生成效率。

在本公开的实施例中,眉形图像为包括正视图下的眉形的二维图像。眉形包括多根眉毛,是由多根眉毛所形成的形状。

根据一些实施例,眉形图像可以包括且仅包括眉形。例如,眉形图像可以包括设计师专门设计的眉形,而不包括其他人脸区域。根据另一些实施例,眉形图像除了包括眉形之外,还可以包括人脸的其他区域,例如眼睛、鼻子、头发等。例如,眉形图像可以是人脸图像(人脸照片或卡通人脸)。

在本公开的实施例中,眉形图像标注有多条眉毛参考线。眉毛参考线用于描述眉形图像中的单根眉毛,是由单根眉毛的根部点到外端点的曲线,其中,根部点为眉毛与人脸表面的接触点。每条眉毛参考线可以存储为根部点的像素坐标、外端点的像素坐标和曲线的走向(方向角)。眉毛参考线可以由人工标注,也可以通过图像处理工具自动识别眉形图像的眉形区域中的曲线,从而实现自动标注。

眉毛参考线的数量远少于眉形图像所包括的单根眉毛的数量,由此仅需在二维眉形图像中标注少量的眉毛参考线,即可自动生成该二维眉形图像对应的三维眉形,能够减少计算量,提高计算效率。眉毛参考线的具体数量可以根据需要进行设置,例如设置为5、10、20等。本公开对眉毛参考线的数量不作限制。

根据一些实施例,为了保证三维眉形的生成效果,多条眉毛参考线包括对应于不同走向的多个眉毛参考线组。每个眉毛参考线组包括至少两条眉毛参考线,该至少两条眉毛参考线具有相同的走向。根据一些实施例,可以将由根部点指向外端点的向量的角度记为眉毛参考线的方向角。进一步地,将方向角的夹角小于阈值(例如5°、8°、10°等)的两条眉毛参考线判定为具有相同的走向。需要说明的是,同一条眉毛参考线可能被划分至不同的眉毛参考线组。通过标注不同走向的多组眉毛参考线,可以充分表达二维眉形中的不同眉毛的形状和位置信息,从而提高所生成的三维眉形的准确性和细腻度。

图3示出了根据本公开实施例的眉形图像300的示意图。如图3所示,眉形图像300标注有多条眉毛参考线310-380。每条眉毛参考线包括根部点Ai和外端点Bi(i=1,2,3,…,8)。眉毛参考线310-380根据走向被划分为3个眉毛参考线组。其中,眉毛参考线310、320、340、360具有相同的走向(两两方向角的夹角小于阈值),属于眉毛参考线组G1。眉毛参考线330、340具有相同的走向(二者的方向角的夹角小于阈值),属于眉毛参考线组G2。眉毛参考线350、370、380具有相同的走向(两两方向角的夹角小于阈值),属于眉毛参考线组G3。

在步骤S220中,对通过步骤S210所获得的眉形图像进行深度估计,以得到每条眉毛参考线的根部点的深度值和外端点的深度值。

根据一些实施例,步骤S220可以包括步骤S221和S222。

在步骤S221中,将眉形图像输入经训练的深度估计模型,以得到眉形图像对应的深度图。该深度图指示眉形图像中的各像素的深度值。

在步骤S222中,基于深度图,确定根部点的深度值和外端点的深度值。

根据上述实施例,利用经训练的深度估计模型估计深度值,无需获取额外的信息,在保证准确性的前提下提高了深度估计的效率。

深度图与眉形图像的尺寸相同,深度图中的像素与眉形图像中的像素一一对应。将眉形图像记为I,将深度图记为D,则深度图中坐标为(x,y)的像素D(x,y)的像素值即为眉形图像I中的像素I(x,y)的深度值。深度值表示像素到图像采集设备的距离。

深度估计模型可以是神经网络模型,其以图像为输入,输出该图像对应的深度图。深度估计模型可以基于标注有深度图标签的样本图像训练得出。样本图像及其深度图标签例如可以通过深度相机(又称为3D相机)拍摄得到。

可以理解,眉毛参考线的根部点和外端点分别对应于眉形图像中的一个像素。相应地,根据一些实施例,在步骤S222中,可以直接从深度图中获取根部点的深度值和外端点的深度值。由此能够提高深度值的获取效率。

根据一些实施例,步骤S222可以包括步骤S2221和S2222。

在步骤S2221中,从深度图中获取根部点的初始深度值和外端点的初始深度值。即,将深度图中的深度值作为根部点和外端点的初始深度值。

在步骤S2222中,基于根部点和外端点相对于人脸表面的高度,对根部点的初始深度值和外端点的初始深度值进行标准化,以得到根部点的深度值和外端点的深度值。

可以理解,眉毛的根部点位于人脸表面,即,根部点相对于人脸表面的高度为0。眉毛的外端点位于人脸上方,其相对于人脸表面的高度大于0。将深度图中的根部点和外端点的深度值作为初始深度值,基于根部点和外端点相对于人脸表面的高度对二者的初始深度值进行标准化,即,标准化后的深度值是相对于人脸表面的深度值。三维虚拟形象通常采用三维人脸网格(mesh)模型的形式进行存储,即,将人脸表面表示为多个网格,存储各个网格的顶点的三维坐标和顶点之间的连接关系。根据上述实施例,根部点和外端点的标准化后的深度值是相对于人脸表面的深度值。由此能够便于将所生成的三维眉形与已有的三维人脸网格模型进行组合,得到三维虚拟形象。

可以理解,不同眉形在人脸上的位置大致相同(均位于眼睛上方一定距离)、占据的人脸面积较小,并且整体形状类似(均为横向的长条形)。不同眉形的区别多体现在细微之处,例如外部轮廓的弧度变化、单根眉毛的走向和分布等。

由于眉形在人脸上的位置相对固定且占据的面积较小,因此被眉形区域所覆盖的正面的人脸表面可以近似为一个垂直的平面,即,该人脸表面的深度值处处相同。相应地,眉形区域的眉毛点的深度可以转化为该眉毛点相对于人脸表面的高度。因此,基于根部点和外端点相对于人脸表面的高度对二者的初始深度值进行标准化,标准化后的深度值不仅能够便于将生成的三维眉形与三维人脸网格模型进行组合,而且能够保证深度值的准确性,从而保证三维眉形的真实性和细腻度。

而对于头发、胡须等毛发来说,由于不同的发型、须型的形状差异较大,在人脸上的位置和面积均不固定,被头发、胡须等毛发所覆盖的人脸表面通常是一个曲面。如果头发、胡须等毛发所覆盖的人脸表面近似为一个平面,采用与上述实施例类似的方法得到头发、胡须的深度值,那么这些深度值的误差较大,难以达到三维重建的精度要求,导致生成的三维毛发严重失真。

根据一些实施例,在步骤S2222中,可以计算根部点的初始深度值r与外端点的初始深度值o的差值d。可以理解,由于眉毛的根部点相对于外端点距离图像采集设备更远,因此在深度图中,根部点的初始深度值大于外端点的初始深度值。随后,将根部点的标准化后的深度值r’设置为人脸表面的预设深度值s,将外端点的标准化后的深度值o’设置为上述预设深度值s与上述差值d的和。人脸表面的预设深度值通常为0(即s=0),相应地,可以将根部点的标准化后的深度值r’设置为0,外端点的标准化后的深度值o’设置为上述差值d。

根据一些实施例,步骤S230可以包括步骤S231-S233。

在步骤S231中,对于多条眉毛参考线中的任一眉毛参考线,基于眉毛参考线的根部点的深度值和外端点的深度值,生成三维眉毛参考线。

在步骤S232中,从眉形图像中提取出眉形区域。

在步骤S233中,基于与多条眉毛参考线分别对应的多条三维眉毛参考线,在眉形区域对应的三维空间中进行三维眉毛插值,以生成三维眉形。

根据上述实施例,通过眉毛点插值和眉毛插值,自动生成三维眉形。由此提高三维眉形的生成效率。

眉形图像中标注的眉毛参考线是二维眉毛参考线,指示眉毛的二维图像信息。根部点和外端点的深度值指示眉毛的三维空间信息。在步骤S231中,将眉毛参考线的二维图像信息与三维空间信息相结合,可以得到该眉毛参考线对应的三维眉毛参考线。可以理解,针对每条眉毛参考线,均可以得到相应的三维眉毛参考线。

根据一些实施例,步骤S231可以包括步骤S2311和S2312。

在步骤S2311中,基于眉毛参考线的根部点的深度值和外端点的深度值,通过插值获得眉毛参考线上的多个中间点各自的深度值。

在步骤S2312中,基于眉毛参考线上的各个点的深度值,生成三维眉毛参考线。

在上述步骤S2311中,根部点的深度值和外端点的深度值可以是基于人脸表面标准化后的深度值(通过上述步骤S2222)。眉毛参考线是一条曲线,可以通过在曲线上进行采样来得到该曲线上的多个中间点。基于根部点的深度值和外端点的深度值,通过插值来拟合曲线,可以得到每个中间点的深度值。

在上述步骤S2312中,眉毛参考线上的各个点包括根部点、中间点和外端点。可以理解,眉毛参考线上的每个点包括二维像素坐标(x,y)和相对于人脸表面的深度值z。将每个点表示为由二维像素坐标(x,y)和深度值z所组成的三维信息(x,y,z)。各个点的三维信息组合形成三维眉毛参考线。

根据上述实施例,先进行深度值的插值,在基于深度值将二维的眉毛参考线转化为三维眉毛参考线。由此能够便于三维眉形与已有的三维人脸网格模型进行融合。

根据一些实施例,眉形图像可以是图像采集设备采集的真实的正面人脸图像。相应地,步骤S231可以包括步骤S2313和S2314。

在步骤S2313中,基于眉毛参考线的根部点的深度值、外端点的深度值和图像采集设备的内参矩阵,确定根部点的三维坐标和外端点的三维坐标。

在步骤S2314中,基于根部点的三维坐标和外端点的三维坐标,通过插值获得该眉毛参考线上的多个中间点各自的三维坐标,以得到三维眉毛参考线。

根据上述实施例,先确定根部点和外端点的三维坐标,再做三维坐标的插值,由此得到三维眉毛参考线。

在上述步骤S2313中,根部点的深度值和外端点的深度值可以是从眉形图像对应的深度图中直接获取的深度值。图像采集设备的内参矩阵用于描述相机坐标系到像素坐标系的坐标转换关系。根部点的深度值相当于根部点在相机坐标系下的z坐标值,外端点的深度值相当于外端点在相机坐标系下的z坐标值。基于内参矩阵、根部点在图像中的像素坐标(u,v)和根部点在相机坐标系下的z坐标值,可以解算出根部点在相机坐标系下的x坐标值和y坐标值,由此得到根部点在相机坐标系下的三维坐标(x,y,z)。类似地,也可以得到外端点在相机坐标系下的三维坐标。

根据一些实施例,可以基于图像采集设备的外参矩阵,进一步将根部点和外端点在相机坐标系下的三维坐标转化为世界坐标系下的三维坐标。外参矩阵用于描述世界坐标系到相机坐标系的坐标转换关系。

根据一些实施例,在上述步骤S2314中,可以通过对眉毛参考线进行采样来得到多个中间点。基于根部点和外端点的三维坐标,在三维空间内做插值,以得到每个中间点的三维坐标。眉毛参考线上的各个点对应的三维坐标组合形成三维眉毛参考线。

根据一些实施例,在步骤S232中,可以利用经训练的语义分割模型来从眉形图像中分割出眉形区域,即得到眉形区域的掩膜(mask)。将眉形图像输入语义分割模型,语义分割模型输出眉形图像中的各个像素的类别。像素的类别例如可以是眉毛、眼睛、鼻子、人脸表面等。类别为“眉毛”的多个像素组成眉形区域。

语义分割模型可以是神经网络模型,其以图像为输入,输出图像中的每个像素的类别。语义分割模型可以基于标注类别标签的样本图像训练得出。

根据一些实施例,语义分割模型可以是能够接收提示信息(prompt)的模型,例如SAM(Segment Anything Model)模型。相应地,可以将眉形图像和分割提示信息(prompt)一并输入经训练的语义分割模型,以得到语义分割模型输出的眉形区域。分割提示信息包括属于眉形区域的至少一个前景像素和不属于眉形区域的至少一个背景像素。例如,可以任意指定眉毛区域内的三个像素(前景像素)和眉毛区域以外的区域(例如眼睛、脸颊、人脸以外的区域)内的三个像素(背景像素)作为分割提示信息。

根据上述实施例,分割提示信息能够为语义分割模型提供知识指引。语义分割模型结合分割提示信息来提取眉形区域,能够提高眉形区域的准确性。

在步骤S233中,基于与多条眉毛参考线分别对应的多条三维眉毛参考线,在眉形区域对应的三维空间中进行三维眉毛插值,以提高三维眉毛的稠密度,生成三维眉形。

根据一些实施例,在步骤S233中,可以在具有相同走向的相邻的三维眉毛参考线之间进行三维眉毛的插值,以提高三维眉毛的稠密度和真实性。多条三维眉毛参考线和通过插值得到的多根三维眉毛组合形成三维眉形。

图4示出了根据本公开实施例的三维眉形的生成过程400的示意图。如图4所示,过程400包括步骤S410-S460。

在步骤S410中,通过图像处理工具自动识别2D人脸图像(眉形图像)的眉形区域中的曲线,从而自动标注出多条眉毛参考线。每条眉毛参考线包括眉毛根部点和外端点。

在步骤S420中,对2D人脸图像进行深度信息估计,得到2D人脸图像的深度图。

在步骤S430中,对2D人脸图像进行语义分割,以提取出眉形区域的掩膜。

在步骤S440中,基于步骤S420中得到的深度图,获取每条眉毛参考线的眉毛根部点和外端点的深度值,进而得到根部点和外端点的三维坐标。基于根部点和外端点的三维坐标,可以得到眉毛参考线的3D走向。

在步骤S450中,基于眉毛参考线的根部点和外端点的三维坐标,生成3D眉毛参考线。

在步骤S460中,在3D走向相同的两条3D眉毛参考线之间进行3D眉毛插值,以提升眉毛稠密度,使所生成的3D眉毛填满眉形区域,生成3D眉形。

根据本公开的实施例,还提供一种三维眉形的生成装置。图5示出了根据本公开实施例的三维眉形的生成装置500的结构框图。如图5所示,装置500包括获取模块510、估计模块520和生成模块530。

获取模块510被配置为获取眉形图像,其中,所述眉形图像标注有多条眉毛参考线,所述多条眉毛参考线中的每条眉毛参考线包括眉毛的根部点和外端点。

估计模块520被配置为对所述眉形图像进行深度估计,以得到所述多条眉毛参考线各自的根部点的深度值和外端点的深度值。

生成模块530被配置为基于所述多条眉毛参考线各自的根部点的深度值和外端点的深度值,生成所述眉形图像对应的三维眉形。

根据本公开的实施例,通过估计二维眉形图像中的眉毛参考线的根部点和外端点的深度值,生成眉形图像对应的三维眉形。由此仅需在二维眉形图像中标注少量的眉毛参考线,即可自动生成该二维眉形图像对应的三维眉形,实现了三维眉形的自动化生成,大大提高了三维眉形的生成效率。

根据一些实施例,所述估计模块520包括:估计单元,被配置为将所述眉形图像输入经训练的深度估计模型,以得到所述眉形图像对应的深度图,其中,所述深度图指示所述眉形图像中的各像素的深度值;以及确定单元,被配置为基于所述深度图,确定所述根部点的深度值和所述外端点的深度值。

根据一些实施例,所述确定单元包括:第一获取子单元,被配置为从所述深度图中获取所述根部点的初始深度值和所述外端点的初始深度值;以及标准化子单元,被配置为基于所述根部点和所述外端点相对于人脸表面的高度,对所述根部点的初始深度值和所述外端点的初始深度值进行标准化,以得到所述根部点的深度值和所述外端点的深度值。

根据一些实施例,所述标准化子单元进一步被配置为:计算所述根部点的初始深度值与所述外端点的初始深度值的差值;将所述根部点的深度值设置为人脸表面的预设深度值;以及将所述外端点的深度值设置为所述预设深度值与所述差值的和。

根据一些实施例,所述确定单元包括:第二获取子单元,被配置为从所述深度图中获取所述根部点的深度值和所述外端点的深度值。

根据一些实施例,所述生成模块530包括:第一生成单元,被配置为对于所述多条眉毛参考线中的任一眉毛参考线,基于所述眉毛参考线的根部点的深度值和外端点的深度值,生成三维眉毛参考线;提取单元,被配置为从所述眉形图像中提取出眉形区域;以及第二生成单元,被配置为基于与所述多条眉毛参考线分别对应的多条三维眉毛参考线,在所述眉形区域对应的三维空间中进行三维眉毛插值,以生成所述三维眉形。

根据一些实施例,所述第一生成单元包括:第一插值子单元,被配置为基于所述眉毛参考线的根部点的深度值和外端点的深度值,通过插值获得所述眉毛参考线上的多个中间点各自的深度值;以及生成子单元,被配置为基于所述眉毛参考线上的各个点的深度值,生成三维眉毛参考线。

根据一些实施例,所述第一生成单元包括:确定子单元,被配置为基于所述眉毛参考线的根部点的深度值、外端点的深度值和所述图像采集设备的内参矩阵,确定所述根部点的三维坐标和所述外端点的三维坐标;以及第二插值子单元,被配置为基于所述根部点的三维坐标和所述外端点的三维坐标,通过插值获得所述眉毛参考线上的多个中间点各自的三维坐标,以得到所述三维眉毛参考线。

根据一些实施例,所述提取单元进一步被配置为:将所述眉形图像和分割提示信息输入经训练的语义分割模型,以得到所述语义分割模型输出的所述眉形区域,其中,所述分割提示信息包括属于所述眉形区域的至少一个前景像素和不属于所述眉形区域的至少一个背景像素。

应当理解,图5中所示装置500的各个模块和单元可以与参考图2描述的方法200中的各个步骤相对应。由此,上面针对方法200描述的操作、特征和优点同样适用于装置500及其包括的模块和单元。为了简洁起见,某些操作、特征和优点在此不再赘述。

虽然上面参考特定模块讨论了特定功能,但是应当注意,本文讨论的各个模块的功能可以分为多个模块,和/或多个模块的至少一些功能可以组合成单个模块。

还应当理解,本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。上面关于图5描述的各个单元可以在硬件中或在结合软件和/或固件的硬件中实现。例如,这些单元可以被实现为计算机程序代码/指令,该计算机程序代码/指令被配置为在一个或多个处理器中执行并存储在计算机可读存储介质中。可替换地,这些单元可以被实现为硬件逻辑/电路。例如,在一些实施例中,模块510-530中的一个或多个可以一起被实现在片上系统(System on Chip,SoC)中。SoC可以包括集成电路芯片(其包括处理器(例如,中央处理单元(Central Processing Unit,CPU)、微控制器、微处理器、数字信号处理器(Digital Signal Processor,DSP)等)、存储器、一个或多个通信接口、和/或其他电路中的一个或多个部件),并且可以可选地执行所接收的程序代码和/或包括嵌入式固件以执行功能。

根据本公开的一方面,还提供一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的三维眉形的生成方法200。

根据本公开的一方面,还提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述的三维眉形的生成方法200。

根据本公开的一方面,还提供一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现上述的三维眉形的生成方法200。

参考图6,现将描述可以作为本公开的服务器或客户端的电子设备600的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605,包括:输入单元606、输出单元607、存储单元608以及通信单元609。输入单元606可以是能向设备600输入信息的任何类别的设备,输入单元606可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入,并且可以包括但不限于鼠标、键盘、触摸屏、轨迹板、轨迹球、操作杆、麦克风和/或遥控器。输出单元607可以是能呈现信息的任何类别的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元608可以包括但不限于磁盘、光盘。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙设备、802.11设备、Wi-Fi设备、WiMAX设备、蜂窝通信设备和/或类似物。

计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如三维眉形的生成方法200。例如,在一些实施例中,三维眉形的生成方法200可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的三维眉形的生成方法200的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行三维眉形的生成方法200。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行、也可以顺序地或以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

虽然已经参照附图描述了本公开的实施例或示例,但应理解,上述的方法、系统和设备仅仅是示例性的实施例或示例,本公开的范围并不由这些实施例或示例限制。实施例或示例中的各种要素可以被省略或者可由其等同要素替代。此外,可以通过不同于本公开中描述的次序来执行各步骤。进一步地,可以以各种方式组合实施例或示例中的各种要素。重要的是随着技术的演进,在此描述的很多要素可以由本公开之后出现的等同要素进行替换。

相关技术
  • 一种健美操形体训练装置及训练方法
  • 一种基于训练系统的球类训练装置
  • 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
  • 一种神经网络模型训练方法及装置、文本标签确定方法及装置
  • 一种驼背恢复训练装置
  • 一种矫正驼背、训练收腹的装置
技术分类

06120116558852