掌桥专利:专业的专利平台
掌桥专利
首页

基于多数据源生成图表的方法、系统、设备及存储介质

文献发布时间:2023-06-19 11:35:49


基于多数据源生成图表的方法、系统、设备及存储介质

技术领域

本发明涉及多数据源的信息整合领域,具体地说,涉及基于多数据源生成图表的方法、系统、设备及存储介质。

背景技术

信息化是当今时代发展的大趋势,代表着先进的生产力,计算机的诞生推动了一次“信息革命”,而随着计算机软硬件的发展,人类可能会爆发第二次第三次“信息革命”;而在信息化的背后,离不开的就是数据,古人结绳记事是数据,而现在不管你做什么,无时无刻都在生产数据,上班乘坐交通、打卡、使用手机或电脑,在这个信息爆炸的时代,怎么使用数据,就成为关键。

用户对平台的反馈不再仅限于文本,很多用户习惯于使用语音、图片(表情包)等来回复,这加大了数据聚类、合并的难度,难以准确评价客服的服务表现。

因此,本发明提供了一种基于多数据源生成图表的方法、系统、设备及存储介质。

发明内容

针对现有技术中的问题,本发明的目的在于提供基于多数据源生成图表的方法、系统、设备及存储介质,克服了现有技术的困难,能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。

本发明的实施例提供一种基于多数据源生成图表的方法,包括以下步骤:

S110、数据采集,接收第一文本信息集合或非文本信息集合;

S120、将所述非文本信息集合转化为第二文本信息;

S130、将所述第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库;

S140、对所述第三文本信息集合根据文本分析,添加标签,所述标签至少包括观点类标签和情感类标签;

S150、基于所述标签进行聚合计算;

S160、响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板;以及

S170、将所述展示数据导入所述预设数据图表模板,生成展示图表。

优选地,所述步骤S110中,包括通过数据直连或者数据代理接收第一文本信息集合或非文本信息集合。

优选地,所述步骤S110中,包括通过SAAS端口接收第一文本信息集合或非文本信息集合,并同步到所述数据仓库;或者,通过数据适配器接收第一文本信息集合或非文本信息集合。

优选地,所述步骤S120中,所述非文本信息集合包括图片信息和音频信息,通过ORC图文识别自所述图片信息中获取第四文本信息,通过语音识别自所述音频信息获取第五文本信息,合并所述第四文本信息和第五文本信息为第二文本信息。

优选地,所述步骤S150中,通过分析所述第三文本信息集合的标签,获得所述第三文本信息中包含的维度信息和度量信息,根据所述维度信息和度量信息进行聚合计算。

优选地,所述步骤S160中,根据所述查询维度集合中的查询维度来自所述数据仓库中采集展示数据,并根据所述维度信息、所述度量信息来匹配预设数据图表模板。

优选地,所述步骤S110中,所述第一文本信息集合为用户反馈的文本类服务评价,所述非文本信息集合为用户反馈的非文本信类服务评价;

所述步骤S170中,还包括通过每个客服获得的第三文本信息集合的标签进行聚合计算,并对所述客服的服务好评度进行排序。

本发明的实施例还提供一种基于多数据源生成图表的系统,用于实现上述的基于多数据源生成图表的方法,所述基于多数据源生成图表的系统包括:

数据采集模块,接收第一文本信息集合或非文本信息集合;

信息转化模块,将所述非文本信息集合转化为第二文本信息;

信息合并模块,将所述第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库;

文本分析模块,对所述第三文本信息集合根据文本分析,添加标签,所述标签至少包括观点类标签和情感类标签;

聚合计算模块,基于所述标签进行聚合计算;

模板匹配模块,响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板;以及

展示图表模块,将所述展示数据导入所述预设数据图表模板,生成展示图表。

本发明的实施例还提供一种基于多数据源生成图表的设备,包括:

处理器;

存储器,其中存储有所述处理器的可执行指令;

其中,所述处理器配置为经由执行所述可执行指令来执行上述基于多数据源生成图表的方法的步骤。

本发明的实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被执行时实现上述基于多数据源生成图表的方法的步骤。

本发明的目的在于提供基于多数据源生成图表的方法、系统、设备及存储介质,能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。

图1是本发明的基于多数据源生成图表的方法的流程图。

图2是本发明的基于多数据源生成图表的方法中数据采集的流程图。

图3是本发明的基于多数据源生成图表的方法数据分析的流程图。

图4是本发明的基于多数据源生成图表的方法图表呈现的流程图。

图5是本发明的基于多数据源生成图表的系统的模块示意图。

图6是本发明的基于多数据源生成图表的设备的结构示意图。以及

图7是本发明一实施例的计算机可读存储介质的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。

图1是本发明的基于多数据源生成图表的方法的流程图。如图1所示,本发明的实施例提供的一种基于多数据源生成图表的方法,包括以下步骤:

S110、数据采集,接收第一文本信息集合或非文本信息集合。

S120、将非文本信息集合转化为第二文本信息。

S130、将第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库。

S140、对第三文本信息集合根据文本分析,添加标签,标签至少包括观点类标签和情感类标签。

S150、基于标签进行聚合计算。

S160、响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板。以及

S170、将展示数据导入预设数据图表模板,生成展示图表。

在一个优选实施例中,步骤S110中,包括通过数据直连或者数据代理接收第一文本信息集合或非文本信息集合。

在一个优选实施例中,步骤S110中,包括通过SAAS端口接收第一文本信息集合或非文本信息集合,并同步到数据仓库。或者,通过数据适配器接收第一文本信息集合或非文本信息集合。

在一个优选实施例中,步骤S120中,非文本信息集合包括图片信息和音频信息,通过ORC图文识别自图片信息中获取第四文本信息,通过语音识别自音频信息获取第五文本信息,合并第四文本信息和第五文本信息为第二文本信息。

在一个优选实施例中,步骤S150中,通过分析第三文本信息集合的标签,获得第三文本信息中包含的维度信息和度量信息,根据维度信息和度量信息进行聚合计算。

在一个优选实施例中,步骤S160中,根据查询维度集合中的查询维度来自数据仓库中采集展示数据,并根据维度信息、度量信息来匹配预设数据图表模板。

在一个优选实施例中,步骤S110中,第一文本信息集合为用户反馈的文本类服务评价,非文本信息集合为用户反馈的非文本信类服务评价。

步骤S170中,还包括通过每个客服获得的第三文本信息集合的标签进行聚合计算,并对客服的服务好评度进行排序。

本发明的一种实施是过程如下:收集用户反馈的服务评价,接收第一文本信息集合或非文本信息集合。第一文本信息集合为用户反馈的文本类服务评价,非文本信息集合为用户反馈的非文本信类服务评价。非文本信息集合包括图片信息和音频信息,通过ORC图文识别自图片信息中获取第四文本信息,通过语音识别自音频信息获取第五文本信息,合并第四文本信息和第五文本信息为第二文本信息。将第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库。对第三文本信息集合根据文本分析,添加标签,标签至少包括观点类标签和情感类标签。通过分析第三文本信息集合的标签,获得第三文本信息中包含的维度信息和度量信息,根据维度信息和度量信息进行聚合计算。根据查询维度集合中的查询维度来自数据仓库中采集展示数据,并根据维度信息、度量信息来匹配预设数据图表模板。将展示数据导入预设数据图表模板,生成展示图表。通过每个客服获得的第三文本信息集合的标签进行聚合计算,并对客服的服务好评度进行排序,从而获得更准确的排序结果。

为了方便将数据通过智能图表实现可视化,让数据可以更快速,更精准的使用起来,本发明主要有数据采集、数据分析、图表呈现三个核心功能组成,对于没有数据分析能力的企业、组织或个人,可以非常便捷的将数据用智能图表呈现出来。

图2是本发明的基于多数据源生成图表的方法中数据采集的流程图。图3是本发明的基于多数据源生成图表的方法数据分析的流程图。图4是本发明的基于多数据源生成图表的方法图表呈现的流程图。如图2至4所示,本发明的基于多数据源生成图表的方法主要包括数据采集、数据分析、图表呈现三个部分。

数据采集支持多种数据源接入,主要分两大类:

1、已经有数据收集和存储能力的企业、组织或个人。

2、使用本发明配套的Saas平台的用户,可以采用本发明配套的Saas平台用户,可以用后台系统,自住的上传数据文件。数据文件解析后,会进入数据同步环节,数据同步会将数据同步至数据仓库,以备后续分析;如果有自有数据库、并且有一定开发能力的企业、组织或个人,使用以下的方式进行数据入仓。

3、如果有自有数据库的客户、可以通过提供数据库直连的方式或者数据库代理连接的方式,提供数据,然后通过openapi将数据投递至数据同步服务,数据同步服务负责数据入仓(在互联网时代,把网站的服务封装成一系列计算机易识别的数据接口开放出去,供第三方开发者使用,这种行为就叫做开放网站的API,与之对应的,所开放的API就被称作openAPI)。

4、有大量原始文件数据或通过api采集数据的客户需要数据入仓,需要通过数据适配器(DataAdapter)将数据初步处理后,投递至数据同步服务,数据同步服务负责数据入仓。

5、数据入仓后,会根据数据类型,使用不同的分析器进行分析。文本数据分析器,主要负责观点抽取、情感倾向、标签分类、敏感词过滤、内容摘要等进行分析,并保存分析结果;语音数据首先进行语音识别转文本,成功转文本后,采用文本数据分析器进行分析,并保存分析结果;数值函数库,主要进行聚合函数计算,提前计算出求和、平均值、总量都常规使用数据,并保存结算结果;日期聚合函数,主要负责将数据根据日期不同维度,对数据进行聚合计算,并保存计算结果。

6、对于已经分析好的数据,可以通过数据看板-数据模型进行智能图表编辑,智能图表支持自定义列、维度、过滤器等提取数据,通过切换图标样式,让数据根据需求呈现出不同的样式,已达到数据分析的目的。

在如今的大数据时代,有着各种各样的数据分析工具,但是都有着同样的问题,对普通用户不友好,使用难度高,呈现方式不易理解等等,导致大多人对数据分析望而却步;但是数据如果不进行科学的分析,那么数据的价值是无法被挖掘出来的,本发明主要的目的是帮助我们快速将各种数据源,使用同一的采集引擎,采集到的数据仓库,通过科学的分析器进行分析,最后通过智能图表的方式呈现,当数据在图表呈现的时候,可以非常清晰的将数据中价值呈现出来

本发明能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。

图5是本发明的基于多数据源生成图表的系统的模块示意图。如图5所示,本发明的实施例还提供一种基于多数据源生成图表的系统,用于实现上述的基于多数据源生成图表的方法,基于多数据源生成图表的系统5包括:

数据采集模块51,接收第一文本信息集合或非文本信息集合。

信息转化模块52,将非文本信息集合转化为第二文本信息。

信息合并模块53,将第一文本信息集合和第二文本信息集合合并作为第三文本信息集合存入数据仓库。

文本分析模块54,对第三文本信息集合根据文本分析,添加标签,标签至少包括观点类标签和情感类标签。

聚合计算模块55,基于标签进行聚合计算。

模板匹配模块56,响应查询维度集合采集展示数据,并匹配对应的预设数据图表模板。以及

展示图表模块57,将展示数据导入预设数据图表模板,生成展示图表。

本发明能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。

本发明实施例还提供一种基于多数据源生成图表的设备,包括处理器。存储器,其中存储有处理器的可执行指令。其中,处理器配置为经由执行可执行指令来执行的基于多数据源生成图表的方法的步骤。

如上,该实施例能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。

所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。

图6是本发明的基于多数据源生成图表的设备的结构示意图。下面参照图6来描述根据本发明的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。

其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。

存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。

存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。

本发明实施例还提供一种计算机可读存储介质,用于存储程序,程序被执行时实现的基于多数据源生成图表的方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。

如上所示,该实施例的计算机可读存储介质的程序在执行时,通过能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。

图7是本发明的计算机可读存储介质的结构示意图。参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

综上,本发明的目的在于提供基于多数据源生成图表的方法、系统、设备及存储介质,能够对各类型的数据源进行信息提取和聚类计算,最后通过智能图表的方式呈现,加强了大数据的兼容性,提高了数据统计的准确性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

相关技术
  • 基于多数据源生成图表的方法、系统、设备及存储介质
  • 一种基于Threejs生成全景图表的方法、终端设备及存储介质
技术分类

06120112986214