医用显示器跟随用户的方法和电子设备

文献发布时间：2023-06-19 18:37:28

技术领域

本申请涉及医疗设备控制领域，特别是涉及医用显示器跟随用户的方法和电子设备。

背景技术

在手术中，主刀医师需要具有显示屏的电子设备辅助手术，例如，通过对患者手术部位进行高清晰度摄像后放大显示到医用显示器上，以便于主刀医生进行手术操作。在术中，主刀医生的姿态(俯仰)和位置(走动)可能发生变化，因此医用显示器需要根据主刀医生的姿态和位置调整朝向，以方便主刀医生观察屏幕。

相关技术中提供的显示器跟随用户的方法，采用固装在显示屏上的摄像头对显示屏前的使用者进行摄像或连续拍照，由智能图像自动识别系统及其相应软件，对使用者处于所摄取图形中的位置与预设的使用者参考位置进行自动识别比较并判别其是否全部或部分进入参考区域外所另划分的上、下、左、右四个区域中的一个及或两个，如有进入即发出相应的电信号控制支撑架中可分别拖动显示屏左右方向转动的铰链电机及或俯仰方向转动的铰链电机中各自关联电机正反转供电电流的接通和切换，从而带动显示屏及其上的摄像头一起使后续摄取的图形中使用者出现的位置向预设位置方向转动直至全部脱离上、下、左、右四个区域即停止铰链转动电机的供电，使显示屏可自动追踪朝向使用者。

然而，由于手术室中手术参与人员并不止主刀医师一人，还至少会有麻醉师及多位助理。采用相关技术的显示器跟随方案，容易因显示画面中存在多个使用者而导致错误切换或者跟随非主刀医师。

针对相关技术的显示器跟随用户的方法在多人场景下容易出现跟随目标错误的问题，目前尚未提出有效的解决方案。

发明内容

在本实施例中提供了一种医用显示器跟随用户的方法和电子设备，以至少解决相关技术的显示器跟随用户的方法在多人场景下容易出现跟随目标错误的问题。

一种医用显示器跟随用户的方法，包括：

采集手术场景数据和包括手术参与人员的第一手术室视频；

使用经过训练的主刀医师识别模型处理所述手术场景数据和所述第一手术室视频，获得在所述第一手术室视频中标注有主刀医师的第二手术室视频；

根据所述主刀医师在所述第二手术室视频中的位置信息，控制所述医用显示器跟随所述主刀医师。

在其中的一些实施例中，所述经过训练的主刀医师识别模型用于从所述第一手术室视频中识别手术参与人员的衣着服装、人员站位、操作动作和眼神状态信息，以及手术器械中的一种或者多种识别信息，并根据该一种或多种识别信息和所述手术场景参数，在所述手术参与人员中识别主刀医师，并进行标注。

在其中的一些实施例中，在使用经过训练的主刀医师识别模型处理所述手术场景数据和所述第一手术室视频，获得在所述第一手术室视频中标注有主刀医师的第二手术室视频之前，所述方法还包括：

对所述手术场景数据进行独热编码并重排为预设尺寸的第一输入数据；

将所述第一手术室视频下采样为所述预设尺寸的第二输入数据；

将所述第一输入数据和所述第二输入数据进行组合，将组合得到的多通道数据作为经过训练的主刀医师识别模型的输入数据。

在其中的一些实施例中，在使用经过训练的主刀医师识别模型处理所述手术场景数据和所述第一手术室视频，获得在所述第一手术室视频中标注有主刀医师的第二手术室视频之后，所述方法还包括：

将所述第一手术室视频中标注的主刀医师作为候选医师，通过预设的医师身份信息数据验证所述候选医师是否为主刀医师。

在其中的一些实施例中，通过预设的医师身份信息数据验证所述候选医师是否为主刀医师包括：

从所述第二手术室视频中获取所述候选医师的人脸图像；

将所述候医师的人脸图像发送给人脸识别系统，获得所述候选医师的身份信息；

根据所述候选医师的身份信息，从所述预设的医师身份信息数据中查询所述候选医师是否为主刀医师。

在其中的一些实施例中，所述方法还包括：

在所述候选医师不为主刀医师的情况下，通过与所述医用显示器的人机交互在所述手术参与人员确定主刀医师。

在其中的一些实施例中，根据所述主刀医师在所述第二手术室视频中的位置信息，控制所述医用显示器跟随所述主刀医师包括：

根据所述主刀医师在所述第二手术室视频中的位置信息，确定第一向量与第二向量的夹角，其中，所述第一向量为自所述医用显示器的显示屏中心指向所述主刀医师的向量，所述第二向量为所述医用显示器的显示屏的法向量；

在所述第一向量与所述第二向量的夹角大于设定阈值的情况下，控制所述医用显示器的姿态，以使得所述第一向量与所述第二向量的夹角不大于所述设定阈值。

在其中的一些实施例中，所述方法还包括：

采集语音数据；

使用语音识别模型处理所述语音数据，获得所述医用显示器的控制指令；

根据所述医用显示器的控制指令，控制所述医用显示器的姿态。

在其中的一些实施例中，

所述控制指令包括：通用控制指令和/或个性控制指令；在使用语音识别模型处理所述语音数据，获得所述医用显示器的控制指令中包括个性控制指令的情况下，所述方法还包括：将所述个性控制指令与所述主刀医生相关联并存储在个性数据库；

在根据所述医用显示器的控制指令，控制所述医用显示器的姿态之前，所述方法还包括：根据与所述主刀医生相关联的个性控制指令，调整所述医用显示器的初始姿态。

一种电子设备，包括：处理器；以及存储程序的存储器，其中，所述程序包括指令，所述指令在由所述处理器执行时使所述处理器执行上述的方法。

本实施例提供的医用显示器跟随用户的方法和电子设备，通过采集手术场景数据和包括手术参与人员的第一手术室视频；使用经过训练的主刀医师识别模型处理手术场景数据和第一手术室视频，获得在第一手术室视频中标注有主刀医师的第二手术室视频；根据主刀医师在第二手术室视频中的位置信息，控制医用显示器跟随主刀医师的方式，解决了相关技术的显示器跟随用户的方法在多人场景下容易出现跟随目标错误的问题，提高了显示器跟随的可靠性。

本申请的一个或多个实施例的细节在以下附图和描述中提出，以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本实施例的医用显示器跟随用户的方法的流程图。

图2a是本实施例的腔镜直肠手术中手术参与人员的站位和手术器械的分布示意图。

图2b是本实施例的后腹腔镜手术中手术参与人员的站位和手术器械的分布示意图。

图3是本实施例的医用显示器跟随用户的示意图。

图4是本实施例的电子设备的结构示意图。

图5是本实施例的医用显示器跟随用户的方法的优选流程图。

具体实施方式

下面将参照附图更详细地描述本实施例的实施例。虽然附图中显示了本实施例的某些实施例，然而应当理解的是，本实施例可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本实施例。应当理解的是，本实施例的附图及实施例仅用于示例性作用，并非用于限制本实施例的保护范围。

应当理解，本实施例的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本实施例的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意，本实施例中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本实施例中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本实施例提供了一种医用显示器跟随用户的方法，应用于医用显示器。该方法可以在服务端或客户端执行。例如，在该方法在客户端执行时，该客户端可以是用于医用显示器的数据处理和控制的处理器，或者是与医用显示器共同工作以实现上述方法的电子设备。在该方法在服务端执行时，服务端可以执行本实施例提供的方法，并将用于控制医用显示器运动的控制信号发送给医用显示器，以使得医用显示器实现跟随用户的功能。该服务端可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。服务器可以为分布式系统的服务器，或者是结合了区块链的服务器。服务器也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器或智能云主机等。

图1是本实施例的医用显示器跟随用户的方法的流程图。如图1所示，该流程包括如下步骤：

步骤S101，采集手术场景数据和包括手术参与人员的第一手术室视频。

步骤S102，使用经过训练的主刀医师识别模型处理手术场景数据和第一手术室视频，获得在第一手术室视频中标注有主刀医师的第二手术室视频。

步骤S103，根据主刀医师在第二手术室视频中的位置信息，控制医用显示器跟随主刀医师。

本实施例手术场景数据包括但不限于手术室的标识信息、手术室的环境信息。该手术室的标识信息可以用于标识手术室的类型或者用途，该标识信息可以与医用显示器绑定，例如，不同的医用显示器对应于不同的手术室，即医用显示器与手术室的标识信息对应。当得知当前医用显示器的唯一标识信息时，则根据预先确定的对应关系可以获得手术室的标识信息。

例如，手术室的标识信息包括但不限于：特别洁净手术室(特殊实验室)、标准洁净手术室、一般洁净手术室、体外循环灌注专用准备室等等。各不同标识的手术室要求不同的静压差、温度、照度等等环境信息。

手术室的环境信息则可以为通过各类传感器实时获取，例如，通过气压传感器获取手术室内外的静压差，通过温度传感器获取手术室的温度范围，通过与新风系统的信息交互获得的新风量和换气次数；通过噪声测量设备获取手术室的噪声范围，以及通过光照传感器获得的手术室的照度范围。

由于手术室的场景数据与手术类型存在关联，手术类型与主刀医师存在关联；以及包括手术参与人员的手术室视频信息中也携带有有关辨识主刀医师的信息，因此，在本实施例中，通过经过训练的主刀医师识别模型能够借助于手术室的场景数据和包括手术参与人员的第一手术室视频，在第一手术室视频中标注主刀医师，得到第二手术室视频。该经过训练的主刀医师识别模型是基于手术室的场景数据和包括手术参与人员的手术室视频，以预先标注的主刀医师的标注框为金标准，通过监督学习的方式对深度学习网络进行训练而来。该深度学习网络选用可以进行图像处理的网络，例如U-Net网络等。

在获得了主刀医师在第二手术室视频后，根据主刀医师在第二手术室视频中的位置信息，则可以控制医用显示器跟随主刀医师。位置信息转换为控制信息的方式可以基于机器视觉的方式获得，例如，采用在第二手术室视频为深度摄像头获取的视频时，基于深度摄像头预先标定的参数信息，可以获得主刀医师在全局坐标系中与医用显示器之间的相对位姿关系，根据该相对位姿关系，将医用显示器的显示器平面旋转到面向主刀医师的头部或者双眼连线的中心点，对应的控制信息则为用于进行医用显示器跟随主刀医师的控制信息。

此外，在其中的一些实施例中，也可以采用与相关技术中的跟随方案相似的方式进行主刀医师的位置信息和医用显示器的控制信息的转换，即通过将主刀医师的脸部标注框显示在医用显示器的中心位置的方式，实现医用显示器跟随用户。但与相关技术不同之处在于，在相关技术中不对主刀医师的身份进行识别，即脸部标注框并未标注是否为主刀医师，因此在多人场景下容易出现错误跟随的情形。而采用本申请的上述步骤，对主刀医师的身份进行了识别，在第二手术室视频中标注出了主刀医师的位置信息，因而在进行医用显示器跟随时，即使在多人场景下，也能够准确识别和跟随主刀医师，避免了医用显示器的跟随错误。

在上述的实施例中，经过训练的主刀医师识别模型可以直接将未经标注画面信息的手术室视频作为训练数据，而可以不必对手术室视频标注画面信息。然而，为了提高收敛效率，在其中的一些实施例中，也可以对手术室视频中重要的画面信息进行标注，从而加快模型训练的收敛效率。

主刀医师的身份识别，可以分为几个方面：其一，从静态方面看，不同的手术，手术参与人员的人数、衣着服装和站位，手术器械(设备和工具)的类型等均有各自的特征。其二，从动态方面看，在手术中，手术参与人员的角色不同，因此各自的操作动作和眼神状态均存在明显区别。因此，如果在手术室视频中对上述静态和动态的特征进行标注，则能够提高主刀医师识别模型的训练效率。

其中，衣着服装包括但不限于：帽子样式和颜色、手术服样式和颜色、手套样式和颜色、口罩样式和颜色、配饰(如眼镜等)、鞋子样式和颜色等。

其中，图2a和图2b分别示出了腔镜直肠手术和后腹腔镜手术中手术参与人员的站位和手术器械(设备)的分布示意图。可知，不同的手术主刀医生以及其他的手术参与人员均有相对固定的站位位置和手术器械的摆放位置。

其中，主刀医师在术中的操作动作包括但不限于：切、抓、挑、割、剪等动作。

那么，在采用经过上述方式训练的主刀医师识别模型进行主刀医师识别时，经过训练的主刀医师识别模型可以从第一手术室视频中识别手术参与人员的衣着服装、人员站位、操作动作和眼神状态信息，以及手术器械中的一种或者多种识别信息，并根据该一种或多种识别信息和手术场景参数，在手术参与人员中识别主刀医师，并进行标注。

在其中的一些实施例中，对于静态特征的标注，可以采用不同颜色的标注框进行标注，例如，在手术室视频中，将主刀医师标注为黄色标注框，而将其他手术参与人员和手术器械等非主刀医师的目标均标注为红色标注框。对于动态特征的标注，则可以通过对动态特征进行动作特征提取的方式获得，例如，对于手术参与人员的眼神状态，可以基于几何特征或纹理特征等，提取特征描述子，并使用特征描述子表示每个画面中的眼神特征以及整个视频中眼神特征的变化情况。

在本实施例中，手术场景数据以参数为主，而第一手术室视频为视频画面。因此，在本实施例中，通过将手术场景数据和第一手术室视频预处理为多通道数据以便于经过训练的主刀医师识别模型处理。例如，对手术场景数据进行独热(onehot)编码并重排为预设尺寸的第一输入数据；将第一手术室视频下采样为预设尺寸的第二输入数据；将第一输入数据和第二输入数据进行组合，将组合得到的多通道数据作为经过训练的主刀医师识别模型的输入数据。

独热编码可以将手术场景数据的特征进行数字化。独热编码为一位有效编码，是采用N位状态寄存器来对N个状态进行编码，每个状态都由他独立的寄存器位，并且在任意时候只有一位有效。例如，某个参数有三个状态，则可以分别编码为001，010和100。采用独热编码，一方面，可以保证不同来源的参数具有相同的长度，从而保证了输入数据具有相同的尺寸；另一方面，采用独热编码将离散的手术场景数据的取值扩展到了欧式空间，使得特征之间的距离计算更加合理，能够提高模型的训练效率和预测的精度。

为了进一步地提升医用显示器跟随的准确性，避免主刀医师模型对主刀医师的预测错误，在其中一些实施例中，还对主刀医生进行二次验证。例如，将第一手术室视频中标注的主刀医师作为候选医师，通过预设的医师身份信息数据验证候选医师是否为主刀医师。

在其中的一些实施例中，可以通过人脸识别的方式对主刀医师进行二次验证，例如，从第二手术室视频中获取候选医师的人脸图像；将候医师的人脸图像发送给人脸识别系统，获得候选医师的身份信息；根据候选医师的身份信息，从预设的医师身份信息数据中查询候选医师是否为主刀医师。在上述实施例中，在本地并不存储人脸数据，而是通过从第二手术室视频中获取候选医师的人脸图像，并提供给服务端的人脸识别系统识别候选医师的身份信息，进而再在医师身份信息数据中查询该候选医师是否为主刀医师的方式实现主刀医师的二次验证，保证了个人信息数据的安全。

若在进行二次验证后，确认候选医师不为主刀医师，则可以通过与医用显示器的人机交互在手术参与人员确定主刀医师。其中，人机交互方式可以为语音交互或者隔空手势交互，以避免手术参与人员对医用显示器的触碰导致设备脏污或者细菌传播。同时，在主刀医师的二次验证不通过时，由人工介入处理确认主刀医师，提高了系统的鲁棒性和适应能力。在通过与医用显示器的人机交互确定主刀医师后，上述实施例中将会将在第二手术室视频中跟踪重新确定的主刀医师的位置信息，并根据该位置信息控制医用显示器跟随该主刀医师。在进行主刀医师的跟随时，在跟随结束之前均不再切换跟随目标。

为避免因主刀医师活动导致医用显示器频繁调整影像使用体验，在其中的一些实施例中为医用显示器的每次跟随操作设置调整阈值。图3是本实施例的医用显示器跟随用户的示意图，如图3所示，在本实施例中，可以根据主刀医师在第二手术室视频中的位置信息，确定第一向量a与第二向量b的夹角，其中，第一向量a为自医用显示器的显示屏中心O指向主刀医师(例如其头部中心或两眼连线的中心点)的向量，第二向量b为医用显示器的显示屏的法向量；在第一向量a与第二向量b的夹角α大于设定阈值的情况下，控制医用显示器的姿态，以使得第一向量a与第二向量b的夹角α不大于设定阈值。而在第一向量a与第二向量b的夹角α不大于设定阈值的情况下，则保持医用显示器的姿态不作调整。

在本实施例中，用户与医用显示器的人机交互采用语音交互方式。医用显示器在采集语音数据后，可以通过预先训练好的语音识别模型处理该语音数据，从而获得医用显示器的控制指令，进而根据医用显示器的控制指令，控制医用显示器的姿态。该控制指令例如可以是：向左，向左10°；向右，向右10°；提升高度；降低高度；提升仰角，降低仰角等。为了避免医用显示器错误识别语音，还可以设置多种语音控制指令激活关键词，以在检测到语音控制指令激活关键词之后，再激活语音交互功能。例如，设置语音控制指令激活关键词为“请调整”；则当主刀医师说出：“请调整，向左10°”时，控制医用显示器向左旋转10°；而若主刀医师仅说出“向左10°”时，则不对该语音数据做出响应。

不同的语音控制指令激活关键词可以用来区分控制指令的类型。例如，在其中的一些实施例中，控制指令可以分为通用控制指令和个性控制指令。其中，通用控制指令是指无需医用显示器记忆的控制指令，个性控制指令是指与主刀医师相关联的、需要医用显示器记忆的控制指令。由于各主刀医师因身材高矮的不同以及习惯的显示器俯仰角度等存在差异，设置个性数据库以存储各个主刀医师的个性控制指令实现对医用显示器的姿态微调，从而可以为每个主刀医师设置个性化的、更舒适的医用显示器的初始位姿。上述的医用显示器自动跟随用户的控制方法将会以该初始位姿为基准，实现对医用显示器的位姿调整。

例如，将语音控制指令激活关键词设置为“请通用调整”和“请个性调整”，分别对应于通用控制指令和个性控制指令。在使用语音识别模型处理语音数据，确定语音数据中包含“请个性调整”时，则可以确定医用显示器的控制指令中包括个性控制指令。在此情况下，则可以将该条语音数据对应的个性控制指令与主刀医生相关联并存储在个性数据库。在本次以及未来根据医用显示器的控制指令，控制医用显示器的姿态之前，将会根据与主刀医生相关联的个性控制指令，调整医用显示器的初始姿态。

本实施例还提供一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序，所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本实施例的方法。

本实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质，其中，所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本实施例的方法。

本实施例还提供一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本实施例的方法。

参考图4，现将描述可以作为本实施例的服务器或客户端的电子设备400的结构框图，其是可以应用于本实施例的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本实施例的实现。

如图4所示，电子设备400包括计算单元401，其可以根据存储在只读存储器(ROM)402中的计算机程序或者从存储单元404加载到随机访问存储器(RAM)403中的计算机程序，来执行各种适当的动作和处理。在RAM 403中，还可存储设备400操作所需的各种程序和数据。计算单元401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

电子设备400中的多个部件连接至I/O接口405，包括：输入单元406、输出单元407、存储单元404以及通信单元409。输入单元406可以是能向电子设备400输入信息的任何类型的设备，输入单元406可以接收输入的数字或字符信息，以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元407可以是能呈现信息的任何类型的设备，并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元408可以包括但不限于磁盘、光盘。通信单元409允许电子设备400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据，并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组，例如蓝牙设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。

计算单元401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元401执行上文所描述的各个方法和处理。例如，在一些实施例中，医用显示器跟随用户的方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元408。在一些实施例中，计算机程序的部分或者全部可以经由ROM 402和/或通信单元409而被载入和/或安装到电子设备400上。在一些实施例中，计算单元401可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行医用显示器跟随用户的方法。

用于实施本实施例的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本实施例的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

如本实施例使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

图5是本实施例的医用显示器跟随用户的方法的优选流程图，如图5所示，结合上述的附图1至附图3所描述的方法，该流程包括如下步骤：

步骤1，利用显示器内置摄像头对当前场景进行数据采集，数据种类包括但不限于：衣着服装、人员站位、装备、操作动作、眼神状态、灯光等。并实时采集医护人员的人脸数据，接入医院的后台数据库。

步骤2，对进入房间的医护人员进行人脸数据验证，确认每位医护人员的身份。

步骤3，利用经过训练的用户识别深度学习算法将采集的场景数据、人脸数据等作为特征参数，通过推理、预测或识别等过程，初步判断主刀医师。

步骤4，将手术中实时采集的医护人员的人脸数据与医院后台数据库进行验证比对，判断经过步骤3识别出的使用者的身份，若为主刀医师，则标记结束。若验证比对失败，则调整显示器回归初始化位置，或根据具体需要选择标记一助或二助。

步骤5，标记结束自动调节显示器方位，达到使用者最舒适的方位角度，并规定活动阈值以避免因主刀医师活动导致显示器频繁调整影响使用体验，超过阈值则重新进行调节跟随。

步骤6，自动追随结束，提供确认选项供医护人员选择，如选择确认，则过程结束。若选择拒绝，则算法重新进行步骤2或使用步骤7进行再调整。

步骤7，同时采用智能音频深度学习算法作为辅助，添加多种语音识别关键词，例如：向左，向左10°；向右，向右10°；提升高度；降低高度；提升仰角，降低仰角等，采集主刀医生手术时的个人习惯数据和常用操作数据，利用该深度学习算法，改善显示器自动追踪用户的效果。并且可用以显示器微调或识别失误的备选方案。

应该明白的是，这里描述的具体实施例只是用来解释这个应用，而不是用来对它进行限定。根据本申请提供的实施例，本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例，均属本申请保护范围。

显然，附图只是本申请的一些例子或实施例，对本领域的普通技术人员来说，也可以根据这些附图将本申请适用于其他类似情况，但无需付出创造性劳动。另外，可以理解的是，尽管在此开发过程中所做的工作可能是复杂和漫长的，但是，对于本领域的普通技术人员来说，根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段，不应被视为本申请公开的内容不足。

“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例，也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是，本申请中描述的实施例在没有冲突的情况下，可以与其它实施例结合。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对专利保护范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：石小威;申川;贺光琳;李馨;
专利申请人：杭州海康慧影科技有限公司;

上一篇：一种换向打磨装置的打磨方法
下一篇：卫星状态异常检测方法、系统、计算机设备及存储介质