掌桥专利:专业的专利平台
掌桥专利
首页

一种通信数据处理方法及系统

文献发布时间:2024-04-18 20:01:55


一种通信数据处理方法及系统

技术领域

本发明涉及数据通信技术领域,具体是涉及一种通信数据处理方法及系统。

背景技术

视频会议,是指位于两个或多个地点的人们,通过通信设备和网络,进行面对面交谈的会议。根据参会地点数目不同,视频会议可分为点对点会议和多点会议。

会议一般都需要有会议记录,因为视频会议的出现,会议记录的形式也在增加,当下很多视频会议会有相关的视频存档,很多企业便会将视频存档作为会议记录。

视频存档固然能够完整记录整个视频会议的经过,但是其中仍然包含有很多无效信息,后续在调取使用时需要人力去筛选,因此视频会议的视频记录和文字记录都是要具备的,虽然通过现有的语音识别技术能够将视频转化成文字信息,但无论是视频还是文字因为没有人为精简处理,都掺杂大量的无效信息,在后续调取时需要操作者消耗大量时间去识别甄选,因此,提出了一种通信数据处理方法及系统,旨在解决上述的问题。

发明内容

针对现有技术存在的不足,本发明的目的在于提供一种通信数据处理方法及系统,以解决上述背景技术中存在的问题。

本发明是这样实现的,一种通信数据处理方法,所述方法包括以下步骤:

实时获取视频会议中的录像数据;

拆分所述录像数据得到视频数据和音频数据,对所述视频数据和音频数据进行时间轨标定;

根据音频数据生成关键词信息,所述关键词信息为视频会议参与人员发言语句中的关键词;

根据关键词信息生成标签指示信息;

将标签指示信息对时间轨上的视频数据进行标识,使得用户在查看视频数据时点击标签指示信息便跳转至对应地时间节点。

作为本发明进一步的方案:所述实时获取视频会议中的录像数据的步骤,具体包括:

通过终端设备实时获取单人视频,所述单人视频为视频会议参与人员单体的影像;

整合多个单人视频得到录像数据,所述录像数据的显示界面内具有多个显示视频会议参与人员的窗口。

作为本发明进一步的方案:所述整合多个单人视频得到录像数据的步骤,具体包括:

对单人视频进行识别得到会议参与人员数量信息;

根据会议参与人员数量信息对单人视频进行分辨率缩放得到录像数据。

作为本发明进一步的方案:所述根据音频数据生成关键词信息的步骤,具体包括:

对音频数据进行语音识别得到多个文本信息和人员编码,所述人员编码与文本信息相对应;

对文本信息进行内容识别并筛选得到多个关键词;

整合所述关键词以及与其对应地人员编码得到关键词信息,使得关键词信息与视频参与人员相对应。

作为本发明进一步的方案:所述对音频数据进行语音识别得到多个文本信息的步骤,具体包括:

设置语言数据库,所述语言数据库中包含企业工作中使用的词语和语句;

对音频数据进行语音识别得到参考文本信息;

根据语言数据库对参考文本信息进行处理得到文本信息,使得参考文本信息中语音识别的错误得以修改。

作为本发明进一步的方案:所述将标签指示信息对时间轨上的视频数据进行标识的步骤,具体包括:

将标签指示信息按照音频数据的时间轨进行排序;

根据视频数据的时间轨生成视频进度条;

整合标签指示信息至视频进度条中,所述音频数据的时间轨与视频数据的时间轨相同。

作为本发明进一步的方案:所述方法还包括:

根据录像数据得到时间信息,所述时间信息为录像数据生成的时间;

整合时间信息对标签指示信息标识后的录像数据进行保存得到存档视频,使得存档视频名称包含视频会议进行的日期时间。

本发明的另一目的在于提供一种通信数据处理系统,所述系统包括:

数据获取模块,实时获取视频会议中的录像数据;

数据处理模块,拆分所述录像数据得到视频数据和音频数据,对所述视频数据和音频数据进行时间轨标定;

关键词信息生成模块,根据音频数据生成关键词信息,所述关键词信息为视频会议参与人员发言语句中的关键词;

标签指示信息生成模块,根据关键词信息生成标签指示信息;

标签指示信息标识模块,将标签指示信息对时间轨上的视频数据进行标识,使得用户在查看视频数据时点击标签指示信息便跳转至对应地时间节点。

作为本发明进一步的方案:所述关键词信息生成模块还包括:

音频识别单元,对音频数据进行语音识别得到多个文本信息和人员编码,所述人员编码与文本信息相对应;

信息筛选单元,对文本信息进行内容识别并筛选得到多个关键词;

信息整合单元,整合所述关键词以及与其对应地人员编码得到关键词信息,使得关键词信息与视频参与人员相对应。

作为本发明进一步的方案:所述标签指示信息标识模块包括:

数据排序单元,将标签指示信息按照音频数据的时间轨进行排序;

视频进度条生成单元,根据视频数据的时间轨生成视频进度条;

标签信息整合单元,整合标签指示信息至视频进度条中,所述音频数据的时间轨与视频数据的时间轨相同。

与现有技术相比,本发明的有益效果是:

本发明利用视频会议过程中的数据传输获取录像数据,根据录像数据可以进行识别得到相关音频数据,通过对音频数据进行语音识别便可以得到关键词信息,随后根据关键词信息生成标签指示信息,将标签指示信息与视频数据进行绑定后能够作为视频会议的记录,后期在进行调取使用时,不需要完整看完录像数据,也不需要完全浏览文字记录的文件,只需要根据标签指示信息便能够跳转至视频对应的时间节点,便可以直接观察到当时的视频内容,综上所述,本发明能够使得视频会议记录工作更加精简,并且在后期调取查看时也十分便捷。

附图说明

图1为一种通信数据处理方法的流程图。

图2为一种通信数据处理方法中实时获取视频会议中的录像数据的流程图。

图3为一种通信数据处理方法中整合多个单人视频得到录像数据的流程图。

图4为一种通信数据处理方法中根据音频数据生成关键词信息的流程图。

图5为一种通信数据处理方法中对音频数据进行语音识别得到多个文本信息的流程图。

图6为一种通信数据处理方法中将标签指示信息对时间轨上的视频数据进行标识的流程图。

图7为一种通信数据处理方法中根据录像数据得到时间信息的流程图。

图8为一种通信数据处理系统的结构示意图。

图9为一种通信数据处理系统中关键词信息生成模块的结构示意图。

图10为一种通信数据处理系统中标签指示信息标识模块的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清晰,以下结合附图及具体实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述。

如图1所示,本发明实施例提供了一种通信数据处理方法,所述方法包括以下步骤:

S100,实时获取视频会议中的录像数据;

S200,拆分所述录像数据得到视频数据和音频数据,对所述视频数据和音频数据进行时间轨标定;

S300,根据音频数据生成关键词信息,所述关键词信息为视频会议参与人员发言语句中的关键词;

S400,根据关键词信息生成标签指示信息;

S500,将标签指示信息对时间轨上的视频数据进行标识,使得用户在查看视频数据时点击标签指示信息便跳转至对应地时间节点。

需要说明的是,一般来说在进行视频会议时,视频影像是通过网络实时传输的,此时获取录像数据也十分方便,可以通过录制的方式来获取,所述录像数据可以作为视频会议的记录材料,对所述音频数据进行语音识别便可以得到完整的视频会议的文字记录材料。

本发明实施例中,本发明利用视频会议过程中的数据传输获取录像数据,根据录像数据可以进行识别得到相关音频数据,通过对音频数据进行语音识别便可以得到关键词信息,随后根据关键词信息生成标签指示信息,将标签指示信息与视频数据进行绑定后能够作为视频会议的记录,后期在进行调取使用时,不需要完整看完录像数据,也不需要完全浏览文字记录的文件,只需要根据标签指示信息便能够跳转至视频对应的时间节点,便可以直接观察到当时的视频内容,综上所述,本发明能够使得视频会议记录工作更加精简,并且在后期调取查看时也十分便捷。

如图2所示,作为本发明一个优选的实施例,所述实时获取视频会议中的录像数据的步骤,具体包括:

S101,通过终端设备实时获取单人视频,所述单人视频为视频会议参与人员单体的影像;

S102,整合多个单人视频得到录像数据,所述录像数据的显示界面内具有多个显示视频会议参与人员的窗口。

本发明实施例中,所述终端设备可以为会议室内多媒体设备,当然也可以是办公用的电脑,将多个单人视频进行整合便可以得到录像数据,使得录像数据能够包含多有视频会议参与人员的发言内容。

如图3所示,作为本发明一个优选的实施例,所述整合多个单人视频得到录像数据的步骤,具体包括:

S1021,对单人视频进行识别得到会议参与人员数量信息;

S1022,根据会议参与人员数量信息对单人视频进行分辨率缩放得到录像数据。

本发明实施例中,所述单人视频有多个,每个单人视频对应一个视频会议参与人员的录像,例如会议参与人员的数量为四个,此时便可以将单人视频的分辨率缩小至四分之一,使得在查看时,一个界面内能够同时显示四个会议参与人员的影像。

如图4所示,作为本发明一个优选的实施例,所述根据音频数据生成关键词信息的步骤,具体包括:

S301,对音频数据进行语音识别得到多个文本信息和人员编码,所述人员编码与文本信息相对应;

S302,对文本信息进行内容识别并筛选得到多个关键词;

S303,整合所述关键词以及与其对应地人员编码得到关键词信息,使得关键词信息与视频参与人员相对应。

本发明实施例中,根据音频数据可以得到多个文本信息,文本信息和视频会议参与人员的发言相对应,而根据会议中发言的顺序以及视频会议参与人员的名单能够确定人员编码,根据文本信息生成关键词后,便可以将人员编码和关键词进行绑定,使得关键词信息中包含视频会议参与人员的编码以及他发言的一些关键词。

如图5所示,作为本发明一个优选的实施例,所述对音频数据进行语音识别得到多个文本信息的步骤,具体包括:

S3011,设置语言数据库,所述语言数据库中包含企业工作中使用的词语和语句;

S3012,对音频数据进行语音识别得到参考文本信息;

S3013,根据语言数据库对参考文本信息进行处理得到文本信息,使得参考文本信息中语音识别的错误得以修改。

本发明实施例中,在现有技术中,通过语音识别将音频文件转化为文字形式是比较常见的,但是在转化时很可能会出现偏差,表现形式就是错字,读音虽然相同但是整个词语的意思已经发生变化,通过和语言数据库进行比对,从而能够对参考文本信息进行纠正得到文本信息,从而保证文本信息的准确性。

如图6所示,作为本发明一个优选的实施例,所述将标签指示信息对时间轨上的视频数据进行标识的步骤,具体包括:

S501,将标签指示信息按照音频数据的时间轨进行排序;

S502,根据视频数据的时间轨生成视频进度条;

S503,整合标签指示信息至视频进度条中,所述音频数据的时间轨与视频数据的时间轨相同。

本发明实施例中,所述视频进度条和视频数据的时间轨是相对应的,而将标签指示信息和视频进度条进行关联,在查看视频时,只需要点击视频进度条上的标签指示信息便可以调整到相应的进度。

如图7所示,作为本发明一个优选的实施例,所述通信数据处理方法还包括:

S601,根据录像数据得到时间信息,所述时间信息为录像数据生成的时间;

S602,整合时间信息对标签指示信息标识后的录像数据进行保存得到存档视频,使得存档视频名称包含视频会议进行的日期时间。

本发明实施例中,通过上述能够对处理后的视频数据进行保存,并且保存的文件名与日期时间相关联,能够方便进行后续地查看。

如图8所示,本发明实施例还提供了一种通信数据处理系统,所述系统包括:

数据获取模块100,实时获取视频会议中的录像数据;

数据处理模块200,拆分所述录像数据得到视频数据和音频数据,对所述视频数据和音频数据进行时间轨标定;

关键词信息生成模块300,根据音频数据生成关键词信息,所述关键词信息为视频会议参与人员发言语句中的关键词;

标签指示信息生成模块400,根据关键词信息生成标签指示信息;

标签指示信息标识模块500,将标签指示信息对时间轨上的视频数据进行标识,使得用户在查看视频数据时点击标签指示信息便跳转至对应地时间节点。

本发明实施例中,本发明利用视频会议过程中的数据传输获取录像数据,根据录像数据可以进行识别得到相关音频数据,通过对音频数据进行语音识别便可以得到关键词信息,随后根据关键词信息生成标签指示信息,将标签指示信息与视频数据进行绑定后能够作为视频会议的记录,后期在进行调取使用时,不需要完整看完录像数据,也不需要完全浏览文字记录的文件,只需要根据标签指示信息便能够跳转至视频对应的时间节点,便可以直接观察到当时的视频内容,综上所述,本发明能够使得视频会议记录工作更加精简,并且在后期调取查看时也十分便捷。

如图9所示,作为本发明一个优选的实施例,所述关键词信息生成模块300还包括:

音频识别单元301,对音频数据进行语音识别得到多个文本信息和人员编码,所述人员编码与文本信息相对应;

信息筛选单元302,对文本信息进行内容识别并筛选得到多个关键词;

信息整合单元303,整合所述关键词以及与其对应地人员编码得到关键词信息,使得关键词信息与视频参与人员相对应。

如图10所示,作为本发明一个优选的实施例,所述标签指示信息标识模块500包括:

数据排序单元501,将标签指示信息按照音频数据的时间轨进行排序;

视频进度条生成单元502,根据视频数据的时间轨生成视频进度条;

标签信息整合单元503,整合标签指示信息至视频进度条中,所述音频数据的时间轨与视频数据的时间轨相同。

以上仅对本发明的较佳实施例进行了详细叙述,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本领域技术人员在考虑说明书及实施例处的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

技术分类

06120116570917