掌桥专利:专业的专利平台
掌桥专利
首页

一种会议中展示发言人的方法、装置、设备以及介质

文献发布时间:2023-06-19 18:37:28


一种会议中展示发言人的方法、装置、设备以及介质

技术领域

本申请涉及信息处理技术领域,特别是涉及一种会议中展示发言人的方法、装置、设备以及介质。

背景技术

当前,随着视联网业务在全国范围内的普及发展,视联网高清视联交互技术在政府部门以及其它行业中发挥着举足轻重的作用。视联网采用全球最先进的VisionVera实时高清视频交换技术,实现了目前互联网无法实现的全网高清视频实时传输,将高清视频会议、视频监控、远程培训、智能化监控分析、应急指挥、视频电话、现场直播、电视邮件、信息发布等数十种视频、语音、图片、文字、通讯、数据等服务全部整合在一个系统平台,通过多种终端设备实现高清品质视频通信实时互联互通。

其中,在进行视联网视频会议时,通常情况下,所有的麦克风均处于打开状态,任何参会人员均能够通过面前的麦克风进行发言,如果参会人员的声音失真,或者个别参会人员误触麦克风进行发言的话,均会导致参会人员无法听清会议内容,导致所有参会人员的发言均是无效发言,从而影响会议的顺利进行,例如:当一个话题需要多人发言时,若发言人都同时发言或者有个别的参会人员误触打开麦克风说话,这样就会导致主持人和其他参会人员听不清到底谁在说话和具体说话内容,导致所有的发言均是无效发言。

发明内容

本申请提供了一种会议中展示发言人的方法、装置、设备以及介质,以解决目前无法过滤掉会议中的无效发言的问题。

为了解决上述问题,本申请公开了一种会议中展示发言人的方法,包括:

获取参会人员中发言人的音频数据;

根据预设策略确定所述音频数据是否为有效发言;

若是有效发言,生成控制信令,将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端。

可选地,所述根据预设策略确定所述音频数据是否为有效发言人包括:

将所述音频数据的振幅与设定阈值比较,若大于设定阈值,则对所述音频数据进行处理,得到所述发言人的文本信息;

提取所述文本信息中的关键词;

根据所述关键词确定所述发言人的发言是否为有效发言;

可选地,所述根据所述关键词确定所述发言人的发言是否为有效发言包括:

根据所述关键词查找预先生成的关键词集合,若存在,则确定所述发言人的发言为有效发言。

可选地,所述将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端包括:

将所述控制信令发送至服务器,以使所述服务器对所述控制信令进行解析,获取有效发言人的标识和所述标识对应的振幅,所述服务器将所述标识和所述振幅同步且实时展示在包含所述发言人的会议的参会终端。

为了解决上述问题,本申请还公开了一种会议中展示发言人的方法,包括:

服务器接收参会终端发送的控制信令;

对所述控制信令进行解析,获得有效发言人的标识信息;

将所述标识信息同步且实时展示在包含所述发言人的会议的参会终端。

可选地,服务器获取会议的音频数据,对所述音频数据进行识别,得到音频数据的文本信息,提取所述文本信息中的第一关键词;

对会议资料进行识别,提取第二关键词;

根据所述第一关键词和所述第二关键词生成所述关键词集合。

可选地,按照设定时间间隔将所述关键词集合同步给会议中的所有参会终端。

可选地,所述对所述控制信令进行解析,获得获取有效发言人的标识信息包括:

对所述控制指令进行解析,获得有效发言人的标识以及所述标识对应的振幅。

为了解决上述问题,本申请还公开了一种会议中展示发言人的装置,包括:

获取模块,用于获取参会人员中发言人的音频数据;

有效发言模块,用于根据预设策略确定所述音频数据是否为有效发言;

生成模块,用于若是有效发言,生成控制信令,将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端。

为了解决上述问题,本申请还公开了一种会议中展示发言人的装置,包括:

接收模块,用于接收参会终端发送的控制信令;

解析模块,用于对所述控制信令进行解析,获得获取有效发言人的标识信息;

推送模块,用于将所述标识信息展示在包含所述发言人的会议的参会终端。

为了解决上述问题,本申请还公开了一种电子设备,包括:

一个或多个处理器;和

其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行所述的会议中展示发言人的方法。

为了解决上述问题,本申请还公开了一种计算机可读存储介质,其存储的计算机程序使得处理器执行所述的会议中展示发言人的方法。

与现有技术相比,本申请包括以下优点:

本实施例,获取参会人员中发言人的音频数据,根据预设策略过滤掉音频数据中的无效发言,在音频数据为有效发言时生成控制信令,将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端,经过上述处理,从而保证在会议中展示的均是有效发言,保证了会议的顺利进行。

当然,实施本申请的任一产品不一定需要同时达到以上所述的所有优点。

附图说明

图1是本申请实施例所述一种会议中展示发言人的方法的流程图;

图2是本申请实施例所述一种会议中展示发言人的方法的流程图;

图3是本申请实施例所述一种会议中展示发言人的装置的结构图;

图4是本申请实施例所述一种会议中展示发言人的装置的结构图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。

现有技术中,在进行视联网会议时,会议的人员包括会议主持人和参会人员,由会议主持人主持会议的进行,在会议进行中,由会议主持人从参会人员中确定发言人,而且,每一个参会人员面前均设置有麦克风。通常情况下,所有的麦克风均处于打开状态,任何参会人员均能够通过面前的麦克风进行发言,例如:发言人1在说会议安排,发言人2在会议中因为个人原因或者网络卡顿一直在重复说“我插两句”,由于发言人1和2同时都在说话,这样就会导致主持人和其他参会人员听不清到底谁在说话和具体说话内容,并且发言人2的发言与会议无关,因此需要过滤掉。又或者,有些发言人由于没有禁音,会通过麦克风发出各种杂音,也会导致主持人和其他参会人员听不清到底谁在说话和具体说话内容,因此也需要过滤掉。也就是说,现有技术中缺少对会议中无效发言过滤的机制。

为了解决上述技术问题,本申请发明人创新的提出通过预设策略对音频数据进行过滤,即根据振幅和关键词的方式对音频数据进行过滤,从而保证在会议中展示的均是有效发言,保证了会议的顺利进行。

参照图1,其示出了本申请实施例所述一种会议中展示发言人的方法的流程图,所述方法应用于参会终端,具体包括:

步骤101:获取参会人员中发言人的音频数据。

在实际应用中,参会终端可以每秒采集设定次数的音频数据,例如:设定次数为2次、5次或者10次等等,也就是说,参会终端每秒采集2次、5次或者10次音频数据。

步骤102:根据预设策略确定所述音频数据是否为有效发言,若是,则执行步骤103,若否,则执行步骤104。

作为其中一种实现方式,步骤102包括如下子步骤:

子步骤1021:将所述音频数据的振幅与设定阈值比较,若大于设定阈值,则对音频数据进行处理,得到发言人的文本信息,若小于设定阈值,则不对该音频数据进行任何处理。

在一些实施例中,发言人的数量为一个或者多个,而且多个发言人可能同时发言。当每个参会人员采用手机等带有摄像头和麦克风的终端设备进行线上会议时,终端设备可直接获取发言人的音频数据,并进行语音识别,得到文本信息,也就是说,终端对每个发言人的音频数据进行语音识别,得到每个发言人的文本信息。

若音频数据的振幅大于设定阈值,说明该音频数据可以在会议中的其他参会终端进行展示。若音频数据的振幅小于设定阈值,说明该音频数据不需要在会议中的其他参会终端进行展示,因此需要舍弃。

在实际应用中,可以将音频数据的振幅大于设定阈值的发言人统一放到一个发言人集合中,然后将该发言人集合在终端进行展示,若检测到发言人集合中的发言人的振幅小于设定阈值,则将该发言人从发言人集合中删除,若有新的发言人的音频数据的振幅大于设定阈值时,则将新的发言人加入到发言人集合,同时在参会终端的屏幕中进行展示,这样主持人可以根据发言人集合按照先后顺序安排发言。其中,阈值的设定可以由本领域技术人员采用任意适当方式进行设定,如可以采用人工经验设定阈值,或者针对历史数据的差异值设定阈值,优先地,设定阈值可以为0,也可以为其他值,例如:2或3等等,本申请对此不作限制。

子步骤1022:提取所述文本信息中的关键词。

在一些实施例中,可以对文本信息进行分词处理,得到文本信息中的关键词,也可以采用其他方式,对此本申请不做具体限制。

子步骤1023:根据所述关键词确定所述发言人的发言是否为有效发言。

作为一种实现方式,子步骤1023可以根据所述关键词查找预先生成的关键词集合,若存在,则确定所述发言人的发言为有效发言。

在实际应用中,参会终端可以按照设定时间间隔从服务器中获取预先生成的关键词集合,并保存在参会终端中,然后参会终端根据所述关键词查找预先生成的关键词集合,若存在,则确定所述发言人的发言为有效发言。也可以参会终端将该关键词发送给服务器,服务器根据所述关键词查找预先生成的关键词集合,若存在,则确定所述发言人的发言为有效发言。

其中一种示例:若参会人员中发言人的音频数据为环境音,该音频数据的振幅大于设定阈值,也就是说,有声音振幅,振幅有起伏,在对音视数据进行语音识别处理,获得文本信息,若无文本信息,则判断该音频数据无效发言,参会终端将会触发提示信息,提示该参会终端的发言人关闭本地麦克风。

其中另一种示例:获取参会人员中发言人的音频数据,该音频数据的振幅大于设定阈值,也就是说,有声音振幅,振幅有起伏,在对音视数据进行语音识别处理,获得文本信息,提取所述文本信息中的关键词,若该关键词不存在预先生成的关键词集合,则该发言也属于无效发言,参会终端将会触发提示信息,提示该参会终端的发言人偏离主题。

其中另一种示例:获取参会人员中发言人的音频数据,该音频数据的振幅大于设定阈值,也就是说,有声音振幅,振幅有起伏,在对音视数据进行语音识别处理,获得文本信息,提取所述文本信息中的关键词,若该关键词存在预先生成的关键词集合,则该发言也属于有效发言,但是由于网络卡顿或者参会终端故障,该发言人一直重复该关键词,参会终端也会触发提示信息,提示该参会终端“重复发言内容,稍后再发言或者查看网络是否正常”。

其中另一种示例:获取参会人员中发言人的音频数据,该音频数据的振幅大于设定阈值,也就是说,有声音振幅,振幅有起伏,在对音视数据进行语音识别处理,获得文本信息,提取所述文本信息中的关键词,若该关键词存在预先生成的关键词集合,则该发言也属于有效发言,此时参会终端生成信令,并将该信令发送至服务器,其中,该信令包括发言人标识以及振幅,在实际应用中,该信令也可以为有效发言人集合,该集合中包括发言人标识和该标识对应的振幅集合,其中,振幅集合为一串数据,可以为一个或多个,若是多个,可以是一段音频数据,也可以是一帧音视数据。

在实际应用中,可以通过以下方式预先生成的关键词集合:

参会终端获取会议的音频数据,对所述音频数据进行识别,得到音频数据的文本信息,提取所述文本信息中的第一关键词;对会议资料进行识别,提取第二关键词;根据所述第一关键词和所述第二关键词生成所述关键词集合。

或者,服务器获取会议的音频数据,对所述音频数据进行识别,得到音频数据的文本信息,提取所述文本信息中的第一关键词;对会议资料进行识别,提取第二关键词;根据所述第一关键词和所述第二关键词生成所述关键词集合。

具体的,在会议开始后,参会终端会提前设置一个参会终端对会议进行录制,即参会终端会持续对会议进行录音,这样可以保证实时更新生成的关键词集合,服务器会获取该会议的录音(音频数据)、会议前发放的会议资料等(比如共享的多媒体演示文件、音视频信息等),提取出关键词词汇,将关键词汇根据次数进行依次排序,确定关键词集合,例如获得关键词词汇阈值为20个,将获取前20个提及的关键词词汇进行排序,确定关键词集合,服务器将确定的关键词结合按照设定时间间隔持续同步给会议中的所有参会的终端。

其中,时间间隔的设定可以由本领域技术人员采用任意适当方式进行设定,如可以采用人工经验设定阈值,例如:时间为1分钟,2分钟或3分钟等等,本申请对此不作限制。

步骤103:若是有效发言,生成控制信令,将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端。

若参会终端确定是有效发言,则生成控制信令,该控制信令中包括有效发言人的标识和所述标识对应的所述振幅,然后将该控制信令发送至服务器,服务器对所述控制信令进行解析,获取有效发言人的标识和所述标识对应的所述振幅,所述服务器将所述标识和所述振幅同步且实时展示在包含所述发言人的会议的其他参会终端。

在实际应用中,服务器可以根据有效发言人的标识和所述标识对应的振幅生成有效发言人集合,然后将有效发言人集合发送至所有参会终端,所有参会终端对有效发言人集合进行解析,获得多个发言人的振幅,并将该振幅转化为可视化振幅标度,将该可视化振幅标度和有效发言人的标识同时展示在参会终端显示界面上。

在本方案中,有效发言人集合是动态变化的,会增加有效发言人,也会删除有效发言人,当遇到增加的有效发言人就会直接在参会终端显示界面上增加该发言人标识和该发言人的振幅动态变化的展示效果(展示效果为振幅显示柱起伏显示),当遇到删除有效发言人,发言人标识在设定时间内不会删除,该发言人的振幅数据不会有动态的效果展示,其振幅显示柱会显示“空”,经过设定时间后,会将该发言人在界面上删除,或者会议终端下线,或者发言人下线,也会将该发言人在界面上删除。

其中,有效发言人的标识可以是发言人的姓名或者终端登录的标识等等,标识对应的振幅可以是录制的声音振幅音频段,也可以部分振幅音频段。

步骤104:丢弃该音频数据。

本实施例,获取参会人员中发言人的音频数据,将音频数据的振幅与设定阈值比较,若小于设定阈值,则不进行处理,从而将无声音的音频数据过滤掉,若大于设定阈值对音频数据进行处理,得到发言人的文本信息,提取文本信息中的关键词,根据所述关键词确定所述发言人的发言是否为有效发言;根据比较结果,过滤掉无效发言,然后生成控制信令,将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端,经过上述处理,从而保证在会议中展示的均是有效发言,保证了会议的顺利进行。

参照图2,其示出了本申请实施例所述一种会议中展示发言人的方法的流程图,所述方法应用于服务端,具体包括:

步骤201:接收参会终端发送的控制信令。

在实际应用中,在接收参会终端发送的控制指令之前,参会终端获取参会人员中发言人的音频数据;将所述音频数据的振幅与设定阈值比较,若大于设定阈值,则对所述音频数据进行处理,得到所述发言人的文本信息;提取所述文本信息中的关键词;根据所述关键词确定所述发言人的发言是否为有效发言;若是有效发言,则生成控制信令,将所述控制信令发送至服务器。

步骤202:服务器对所述控制信令进行解析,获得获取有效发言人的标识信息。

步骤203:将所述有效发言人的标识信息实时展示在包含所述发言人的会议的参会终端。

在实际应用中,对所述控制指令进行解析,获得有效发言人的标识以及所述标识对应的振幅。

在实际应用中,服务器可以根据有效发言人的标识和所述标识对应的振幅生成有效发言人集合,然后将有效发言人集合发送至所有参会终端,所有参会终端对有效发言人集合进行解析,获得多个发言人的振幅,并将该振幅转化为可视化振幅标度,将该可视化振幅标度和有效发言人的标识同时展示在参会终端显示界面上。

在本方案中,有效发言人集合是动态变化的,会增加有效发言人,也会删除有效发言人,当遇到增加的有效发言人就会直接在参会终端显示界面上增加该发言人标识和该发言人的振幅动态变化的展示效果(展示效果为振幅显示柱起伏显示),当遇到删除有效发言人,发言人标识在设定时间内不会删除,该发言人的振幅数据不会有动态的效果展示,其振幅显示柱会显示“空”,经过设定时间后,会将该发言人在界面上删除,或者会议终端下线,或者发言人下线,也会将该发言人在界面上删除。

其中,有效发言人的标识可以是发言人的姓名或者终端登录的标识等等,标识对应的振幅可以是录制的声音振幅音频段,也可以部分振幅音频段。

可选地,所述方法还包括:

服务器获取会议的音频数据,对所述音频数据进行识别,得到音频数据的文本信息,提取所述文本信息中的第一关键词;

对会议资料进行识别,提取第二关键词;

根据所述第一关键词和所述第二关键词生成所述关键词集合。

在生成关键词集合之后,可以按照设定时间间隔将所述关键词集合同步给会议中的所有参会终端。

在实际应用中,服务器可以将生成的关键词集合发送至会议中的所有参会终端,以使所述参会终端根据参会发言人的关键词查找预先生成的关键词集合,若存在,则确定所述发言人的发言为有效发言。

本实施例,接收参会终端发送的控制信令;服务器对所述控制信令进行解析,获得获取有效发言人的标识和所述标识对应的所述振幅;将所述有效发言人的标识和所述标识对应的所述振幅同步且实时展示在包含所述发言人的会议的参会终端,从而保证在会议中展示的均是有效发言,保证了会议的顺利进行。

需要说明的是,对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请所必需的。

基于上述方法实施例的说明,本申请还提供了相应的装置实施例,来实现上述方法实施例所述的内容。

参照图3,其示出了本申请实施例所述一种会议中展示发言人的装置的结构图,具体包括:

获取模块301,用于获取参会人员中发言人的音频数据。

有效发言模块302,用于根据预设策略确定所述音频数据是否为有效发言。

生成模块303,用于若是有效发言,生成控制信令,将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端。

可选地,有效发言模块包括:

比较单元,用于将所述音频数据的振幅与设定阈值比较,若大于设定阈值,则对所述音频数据进行处理,得到所述发言人的文本信息。

提取单元,用于提取文本信息中的关键词;

确定单元,用于根据所述关键词确定所述发言人的发言是否为有效发言。

可选地,所述确定单元,具体用于根据所述关键词查找预先生成的关键词集合,若存在,则确定所述发言人的发言为有效发言。

可选地,所述生成模块包括:

发送单元,用于将所述控制信令发送至服务器,以使所述服务器对所述控制信令进行解析,获取有效发言人的标识和所述标识对应的所述振幅,所述服务器将所述标识和所述振幅同步且实时展示在包含所述发言人的会议的参会终端。

本实施例,获取参会人员中发言人的音频数据,将音频数据的振幅与设定阈值比较,若小于设定阈值,则不进行处理,从而将无声音的音频数据过滤掉,若大于设定阈值对音频数据进行处理,得到发言人的文本信息,提取文本信息中的关键词,根据所述关键词确定所述发言人的发言是否为有效发言;根据比较结果,过滤掉无效发言,然后生成控制信令,将所述控制信令发送至服务器,以使所述服务器将所述控制信令同步且实时展示在包含所述发言人的会议的参会终端,经过上述处理,从而保证在会议中展示的均是有效发言,保证了会议的顺利进行。

参照图4,其示出了本申请实施例所述一种会议中展示发言人的装置的结构图,具体包括:

接收模块401,用于接收参会终端发送的控制信令;

解析模块402,用于对所述控制信令进行解析,获得有效发言人的标识信息;

展示模块403,用于将所述标识信息同步且实时展示在包含所述发言人的会议的参会终端。

可选地,所述装置还包括:

第一提取模块,用于获取会议的音频数据,对所述音频数据进行识别,得到音频数据的文本信息,提取所述文本信息中的第一关键词;

第二提取模块,用于对会议资料进行识别,提取第二关键词;

关键词模块,用于根据所述第一关键词和所述第二关键词生成所述关键词集合。

所述关键词模块,还用于按照设定时间间隔将所述关键词集合同步给会议中的所有参会终端。

可选地,所述装置还包括:

发送模块,用于将所述关键词集合发送至参会终端,以使所述参会终端根据参会发言人的关键词查找预先生成的关键词集合,若存在,则确定所述发言人的发言为有效发言。

可选地,所述解析模块,具体用于对所述控制指令进行解析,获得有效发言人的标识以及所述标识对应的振幅。

本实施例,接收参会终端发送的控制信令;服务器对所述控制信令进行解析,获得获取有效发言人的标识和所述标识对应的所述振幅;将所述有效发言人的标识和所述标识对应的所述振幅同步且实时展示在包含所述发言人的会议的参会终端,从而保证在会议中展示的均是有效发言,保证了会议的顺利进行。

对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见图1所示方法实施例的部分说明即可。

本发明实施例还提供了一种电子设备,包括:

一个或多个处理器;和

其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行所述的一种会议中展示发言人的方法。

本发明实施例还提供了一种计算机可读存储介质,其存储的计算机程序使得处理器执行所述的一种会议中展示发言人的方法。

可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本申请的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

以上对本申请所提供的一种会议中展示发言人的方法、装置、设备及介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

技术分类

06120115629400