掌桥专利:专业的专利平台
掌桥专利
首页

基于人工智能的商务智能系统及其分析方法

文献发布时间:2023-06-19 10:06:57


基于人工智能的商务智能系统及其分析方法

技术领域

本发明涉及商业智能系统,尤其涉及基于人工智能的商务智能系统及其分析方法。

背景技术

商业智能(Business Intelligence,BI)应用广泛适用于存在多种系统及数据库的企业,其可提供诸如数据分析、数据采掘、数据搜索、数据库串联、报告、性能测量、记账和图表绘制等功能。一个或多个BI应用可以同时工作以提供具有宽范围功能的BI系统。

一种传统的BI系统100如图1所示,该BI系统的建立关键是从许多来自不同的组织运作系统的数据并进行清理,以保证数据的正确性,然后经过多次抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,经过操作数据存储(Operation Data Store,ODS),合并到一个企业级的数据仓库(Data Warehouse,DW)和/或数据集市(Data Mart)里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘(Data Mining)工具、联机分析处理(OLAP)工具等对其进行分析和处理,最后将分析结果呈现给管理者,为管理者的决策过程提供支持。

然而,此传统BI系统有以下缺陷:

现有BI系统的操作面需要由IT人员预先采用计算机语言建立搜寻条件,且条件设定较为僵化,必须限定于特定条件才得以顺利检索。而且,针对与之对接的系统(如ERP)进行数据捞取过程采单维度直线式,无法自主判断关联数据并横向式链接。

现有BI系统的应用面由于设定皆需人为操作,除了无法让使用者进行深入的多维度分析,更无法做出包含广度的跨面向决策。

因此,亟需提供一种结合人工智能(AI)的BI系统,以克服以上缺陷。

发明内容

本发明的目的在于提供一种基于人工智能的分析方法及商务智能系统,其具有自然语言应答功能,可快速高效分析用户意图提取并分析关联性数据从而辅助用户做出更精准的决策。

为了实现上述目的,本发明提供的一种基于人工智能的商务智能系统,包括:

搜索引擎,用于接收用户的自然语言并拆解自然语言中包含的关联词句;

人工智能分析模块,用于分析所述关联词句并获取与所述关联语句关联的数据提取语法;

特征提取模块,用于从与所述数据提取语法对应的多个特征数据库中提取多个特征数据;以及

数据管理器,用于处理所述多个数据特征并将所述多个数据特征呈现至用户。

较佳地,所述人工智能分析模块用于从预先建立的多个语句分群数据库中提取多个单词函式以及比较所述关联词句与所述单词函式以确定所述数据提取语法。

较佳地,所述人工智能分析模块还用于从所述多个特征数据库中提取数据表单、字段、图表,经跨维度整合和深度特征萃取后生成所述单词函式。

较佳地,所述人工智能分析模块用于将相关联的所述多个关联词句归类。

较佳地,所述人工智能分析模块用于将相关联的所述多个关联词句反馈至用户。

较佳地,所述特征提取模块包括虚拟数据集、用于在多个数据库表之间进行数据连接的数据连接模块、用于标记数据的数据标记模块以及特征提取单元。

较佳地,所述数据管理器用于将所述多个特征数据进行整并、分群、拆分、预测、关联、标记。

较佳地,所述数据管理器包括:检查并修正所述多个特征数据并将重复的数据移除的数据清理模块、将所述多个特征数据按照预定规则进行索引分类的索引模块;以及对所述多个特征数据进行ETL处理的ETL处理模块。

较佳地,还包括用户界面,用于供用户输入所述自然语言,并将所述特征数据呈现图表、文字、数据之一者或多者。

较佳地,还包括与所述人工智能分析模块相连的重新训练模块,以记录用户的历史操作并更新所述多个特征数据库。

本发明提供的一种基于人工智能的分析方法,包括以下步骤:

搜索并分析用户的自然语言中包含的关联词句,获取与所述关联语句关联的数据提取语法;

从与所述数据提取语法对应的多个特征数据库中提取多个特征数据;以及

处理并呈现所述多个特征数据。

较佳地,搜索并分析用户的自然语言中包含的关联词句,获取与所述关联语句关联的数据提取语法的步骤包括:

将自然语言拆解成多个关联词句;

从预先建立的多个语句分群数据库中提取多个单词函式;以及

比较所述关联词句与所述单词函式以确定所述数据提取语法。

较佳地,所述从预先建立的多个语句分群数据库中提取多个单词函式的步骤包括:从所述多个语句分群数据库中提取数据表单、字段、图表,经跨维度整合和深度特征萃取后生成所述单词函式。

较佳地,还包括将相关联的所述多个关联词句归类。

较佳地,还包括将相关联的所述多个关联词句反馈至用户。

较佳地,所述从与所述数据提取语法对应的多个特征数据库中提取多个特征数据的步骤包括:建立虚拟数据集、建立可连接的多个数据库表、在不同数据上进行标记,以及提取所述特征数据。

较佳地,所述处理所述多个特征数据的步骤包括:将所述多个特征数据进行整并、分群、拆分、预测、关联、标记以及翻译。

较佳地,所述处理所述多个特征数据的步骤包括:检查并修正所述多个特征数据并将重复的数据移除;将所述多个特征数据按照预定规则进行索引分类;以及对所述多个特征数据进行ETL处理。

较佳地,所述呈现所述多个特征数据的步骤包括:根据用户习惯和数据属性呈现图表、文字、数据之一者或多者。

较佳地,还包括记录用户的历史操作并更新所述多个特征数据库。

本发明的基于人工智能的商务智能系统及其分析方法具有自然语言应答功能,用户可使用简单口语询问,系统即能透过机械学习分析语句的意图以及其间的关联性,快速提取跨数据库内的关联性数据,并将相关数据处理出多种数据分析后将结果呈现至用户,自主分析能力强,快速辅助企业做出更精准的决策。

附图说明

图1是传统的商务智能系统的结构示意图。

图2为本发明基于人工智能的商务智能系统的一个实施例的结构框图。

图3为本发明基于人工智能的商务智能系统的另一个实施例的结构框图。

图4为本发明基于智能的分析方法的一个实施例的流程图。

图5为本发明基于智能的分析方法的另一个实施例的流程图。

具体实施方式

为详细说明本发明的技术内容、构造特征、所实现的效果,以下结合实施方式并配合附图详予说明。本发明旨在提供过一种基于人工智能的商务智能系统以及分析方法,其广泛适用于数据难以汇整的生产制造业以及要求数据实时性与正确性的金融业,为企业提供跨领域的智慧分析,解决企业决策问题。

如图2所示,本发明基于人工智能的商务智能系统200的一个实施例的示意图。该商务智能系统200包括搜索引擎210、人工智能(AI)分析模块220、特征提取模块230以及数据管理器240。具体地,该搜索引擎210用于接收用户的自然语言;AI分析模块220用于分析用户的自然语言中包含的关联词句并获取所述关联语句关联的数据提取语法;特征提取模块230,用于从与所述数据提取语法对应的多个特征数据库中提取多个特征数据;数据管理器240用于处理所述多个数据特征并将所述多个数据特征呈现至用户。

本发明的基于人工智能的商务智能系统具有自然语言应答功能,用户可使用简单口语询问,系统即能透过机械学习分析语句的意图以及其间的关联性,快速提取跨数据库内的关联性数据,并将相关数据处理出多种数据分析后将结果呈现至用户,自主分析能力强,快速辅助企业做出更精准的决策。

图3为本发明基于人工智能的商务智能系统300的另一个优选实施例的示意图。该商务智能系统300还包括用户界面201,作为用户直接操作的人机互动界面,例如供用户以文字或语音方式向搜索引擎210输入自然语言,并为用户呈现视觉图像、文字、图表、列表或动画影片等信息。

搜索引擎210作为信息检索系统,用于接收用户的自然语言并拆解自然语言中包含的关联词句。例如,用户可以文字或语音的方式输入期望找寻的内容,搜索引擎210采用NLP技术将其通过关键词与断句机制来对自然语言进行拆解,将拆解后的关联词句发送至AI分析模块220并反馈至用户界面201供用户选择。

较佳地,搜索引擎210可接收中文自然语言输入,也可接收其他语种的自然语言输入,接入语言翻译服务模块202即可。该语言翻译服务模块202不仅可将自然语言翻译,也可将特征数据自动翻译成目标语言。

具体地,AI分析模块220包括分析服务模块221,当搜索引擎210拆解自然语言后,分析服务模块221透过机械学习建立多个语句分群数据库222,从多个语句分群数据库中提取多个单词函式。其中,在语句分群数据库222中提取单词函式的方式具体包括从多个语句分群数据库222中提取数据表单、字段、图表,经跨维度整合和深度特征萃取后生成该单词函式。较佳地,在接收关联词句后,分析多个关联词句之间的关联性,若关联,则可归为一类。继而,比较关联词句与单词函式,当关联词句与单词函式存在特定关联时,即可确定并产生数据提取语法,依此向对应的特征数据库提取对应的特征数据。

较佳地,在AI分析模块220的分析服务模块221中,可将多个关联词句进行排列组合,并多个形成疑问句反馈用户供用户选择,依照用户的选择,特征提取模块230提取对应的数据特征。

具体地,如图3所示,该特征提取模块230包含虚拟数据集231、数据连接模块232、数据标记模块233以及特征提取单元234。该虚拟数据集231用于储存特征工程处理后的信息以便于提升搜寻速度。数据连接模块232用于在多个数据库表之间的数据连接,以将数据结构化。较佳地,数据连接(JOIN)的类型包括INNER JOIN,LEFT OUTER JOIN,RIGHT OUTERJOIN以及FULL OUTER JOIN。数据标记模块233用于在数据上进行标记,例如卷标内容为关键词、关键字或可解释的内容,从而提升识别度以及用户操作便利性;更佳地,该数据标记模块233可与分析服务模块221相通信,协助分析服务模块221的关联分析。特征提取单元234依照数据提取语法向对应的特征数据库提取对应的特征数据。

继续参考图3,该数据管理器240接收来自特征提取单元234的特征数据并对其进行加值处理,如:整并、分群、拆分、预测、关联、标记。具体地,该数据管理240包括虚拟数据集241、数据清理模块242、索引模块243、ETL处理模块244。特定地,该虚拟数据集241用于储存原始特征数据在处理的信息,以提升后续的特征辨识度。数据清理模块242用于重复检测与修正每笔数据的字段,处理缺失值(Missing Value)、移除重复的数据等,并通过评估数据的有效性、完整性、精度、一致性来确保数据清理的质量。索引模块243,即为把文字数据中包括的各种专名(人名、地名、书名、篇名、事名、物名)、主题或语词(字、词、句)等提作索引标目,再按一定方法序列,如笔画、字顺、拼音、四角号码或分类,并注明出处,以便快速检索。ETL(Extraction-Transformation-Loading)处理模块244即数据提取、转换和加载,主要负责完成数据从数据源向目标数据仓库转化的过程,该处理为本领域常规技术,在此不赘述。特征数据经过上述加工处理后,根据用户习惯以及数据属性提供合适的图表内容、样式以及整体分布来呈现在用户界面201上。

较佳地,该商务智能系统300还包括与数据管理器240相连的企业数据库250以存储经处理后的所述多个特征数据。特定地,该企业数据库250是按照数据结构来存储、组织以及管理企业数据的集合,即为按一定组织方式存储在一起的、具有一定相关性的、为用户所共同关注的全部数据的集合。该企业数据库250与数据管理器240建立链接,数据管理器240可实时或定期获取数据内容,从而提供用户期望信息。

作为优选实施例,该商务智能系统300还包括与AI分析模块相连的重新训练模块260,以记录用户的历史操作并更新多个特征数据库。例如,通过Log日志方式记录用户的操作历程以及数据结果,并将Log日志内容重新训练到AI分析模块中的既有模型,从而调整要呈现的内容,使得精准度提高;其亦可关联搜寻结果、最佳呈现图表等,从而持续优化使用体验与信息准确性。

相应地,本发明的基于人工智能的分析方法,架设于上述的商务智能系统而实现,作为一个实施例的流程图请参考图。如图4所示,该方法包括:

S1,搜索并分析用户的自然语言中包含的关联词句;

S2,获取与关联语句关联的数据提取语法;

S3,从与数据提取语法对应的多个特征数据库中提取多个特征数据;以及

S4,处理并呈现多个特征数据。

本发明的基于人工智能的分析方法具有自然语言应答功能,用户可使用简单口语询问,系统即能透过机械学习分析语句的意图以及其间的关联性,快速提取跨数据库内的关联性数据,并将相关数据处理出多种数据分析后将结果呈现至用户,自主分析能力强,快速辅助企业做出更精准的决策。

作为优选实施例,如图5所示,该分析方法包括以下步骤:

S12,将自然语言拆解成多个关联词句;

S13,从预先建立的多个语句分群数据库中提取多个单词函式;

S14-S15,比较所述关联词句与所述单词函式以确定所述数据提取语法;

S16,依照数据提取语法提取多个特征数据;

S17,处理并呈现特征数据。

特定地,用户以文字或语音方式从搜索引擎中输入自然语言。可以采用中文语种输入,也可采用其他语种的自然语言输入,本发明的自然语言分析步骤中包括将自然语言翻译为目标语言。

较佳地,当自然语言被拆解后,透过机械学习建立多个语句分群数据库222,从多个语句分群数据库222中提取多个单词函式。其中,在语句分群数据库222中提取单词函式的方式具体包括从多个语句分群数据库222中提取数据表单、字段、图表,经跨维度整合和深度特征萃取后生成该单词函式。较佳地,多个关联词句之间可进行归类,例如相关联或相近似的多个关联词句可归为一类。继而,比较关联词句与单词函式,当关联词句与单词函式存在特定关联时,即可确定并产生数据提取语法,依此向对应的特征数据库提取对应的特征数据。

更优地,可将拆解后的多个关联词句进行排列组合,并多个形成疑问句反馈用户供用户选择,依照用户的选择而提取对应的数据特征。

优选地,提取特征数据的步骤包括:在多个特征数据库中建立虚拟数据集、建立可连接的多个数据库表、在不同数据上进行标记,以及依照数据提取语法进行特征数据提取。

如图5所示,对特征数据的处理包括:将所述多个特征数据进行整并、分群、预测、关联、标记以及翻译。具体包括:S171检查并修正多个特征数据并将重复的数据移除;S172将多个特征数据按照预定规则进行索引分类;以及S173对多个特征数据进行ETL处理。特征数据经过上述加工处理后,根据用户习惯以及数据属性提供合适的图表内容、样式以及整体分布来呈现在用户界面201上。

优选地,该分析方法还包括记录用户的历史操作并更新多个特征数据库。例如,通过Log日志方式记录用户的操作历程以及数据结果,并将Log日志内容重新训练到AI分析模块中的既有模型,从而调整要呈现的内容,使得精准度提高;其亦可关联搜寻结果、最佳呈现图表等,从而持续优化使用体验与信息准确性。另外,该分析方法还包括将多个特征数据存储到企业数据库,可实时或定期获取企业数据库的数据内容,从而提供用户期望信息。

以上所揭露的仅为本发明的较佳实例而已,当然不能以此来限定本发明之权利范围,因此依本发明申请专利范围所作的等同变化,仍属于本发明所涵盖的范围。

相关技术
  • 基于人工智能的商务智能系统及其分析方法
  • 基于人工智能的电子商务信息推送方法及人工智能云平台
技术分类

06120112422749