导航：首页> 石油、煤气及炼焦工业；含一氧化碳的工业气体；燃料；润滑剂；泥煤>一种基于知识图谱的外贸行业人工智能客服系统

一种基于知识图谱的外贸行业人工智能客服系统

文献发布时间：2024-01-17 01:27:33

技术领域

本发明涉及人工智能客服领域，具体来说，涉及一种基于知识图谱的外贸行业人工智能客服系统。

背景技术

随着时代的发展，外贸行业也在不断的蓬勃发展额，而外贸行业是指进行跨国贸易的行业，也称为国际贸易、对外贸易等，是全球经济的一个重要组成部分，对于各个国家的经济发展和国际贸易格局具有重要影响，同时外贸行业还涉及到贸易融资、关税、汇率等问题，是全球化时代下的典型产业，具有复杂的运作模式和特殊的市场环境，且随着信息技术和物流技术的不断发展，外贸行业也在不断变革和发展。

而人工智能客服是一种利用人工智能技术，为用户提供自动化、智能化的客户服务的方式，可以不间断地提供服务，从而提高客户满意度，提升客户体验，其中人工智能客服系统基于各种自然语言处理和机器学习技术，通过对用户输入的文本或语音进行分析和理解，识别用户的需求和意图，并给出相应的答案或解决方案，使得人工智能客服的优点包括：高效性、便捷性、可定制性及数据驱动，进一步提高服务质量，且随着技术的不断发展和完善人工智能客服的运用也越发广泛。

而知识图谱是一种用于描述实体、概念及它们之间关系的图形化结构。可以想象成是一个巨大的语义网络，用于存储和表示丰富的知识和信息，且知识图谱包括实体、属性和关系三部分，使得知识图谱可以为各种基于AI技术的应用提供基础数据和知识支持，从而促进智能化应用的发展。知识图谱在各种领域都有广泛的应用，如搜索引擎、智能客服、自动驾驶等。

但是现有的外贸行业人工智能客服系统在进行使用时无法对用户提出的问题进行语句的调节，使得人工智能在进行客服服务时极易因问题的语句的排序或是错别字而产生问题的识别判断产生错误，导致现有的外贸行业人工智能客服系统在进行使用时的效率方面并不理想，极大的影响了外贸行业通过人工智能客服系统使用的效果。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题，本发明提出一种基于知识图谱的外贸行业人工智能客服系统，以克服现有相关技术所存在的上述技术问题。

为此，本发明采用的具体技术方案如下：

一种基于知识图谱的外贸行业人工智能客服系统，包括问题收集模块、问题解读分类模块、数据提取模块、知识图谱模块、数据对比模块、问题应答模块及数据更新模块；

其中，问题收集模块，用于获取民众对外贸行业提出的问题数据；

问题解读分类模块，用于根据获取的问题数据进行解读，并根据解读结果进行分类；

数据提取模块，用于根据分类结果对问题数据进行重点词汇数据进行提取；

知识图谱模块，用于收集外贸行业相关领域的知识数据，并将收集的知识数据进行总结串联；

数据对比模块，用于将提取后的重点词汇数据和知识数据进行关联性比较；

问题应答模块，用于根据重点词汇数据和知识数据的对比结果进行问题回答；

数据更新模块，用于根据问题应答模块对知识图谱模块的知识数据进行实时更新。

进一步的，为了通过问题解读分类模对问题进行接收并分析，问题解读分类模块包括问题接收模块、语句分析模块、问题解读模块及问题分类模块；

其中，问题接收模块，用于将问题收集模块获取的问题数据进行接收；

语句分析模块，用于将接收的问题数据进行语句分析，获取一级问题点数据；

问题解读模块，用于根据一级问题点数据进行解读一级问题点，并获得二级问题点数据；

问题分类模块，用于根据二问题点数据对问题数据进行问题分类。

进一步的，为了语句判断模块对接收的问题进行解读调节，提高识别精准度，语句判断模块包括语句识别模块、语音识别模块、问题调节模块及问题分析模块；

其中，语句识别模块，用于将接收问题数据中的文字问题进行筛分；

语音识别模块，用于将接收问题数据中的语音问题进行筛分，并转换为文字问题；

问题调节模块，用于将文字问题中的错别字及语序进行调节；

问题分析模块，用于将调节后的文字问题进行分析，并得到第一问题点数据。

进一步的，为了问题分析模块对语句调节后的问题进行解读，提高客服对问题的辨识度，将调节后的文字问题进行分析，并得到第一问题点数据包括：

S1、根据外贸行业的词汇使用评率，预设外贸行业关键词；

S2、根据文字问题进行关键词筛选，并对文字问题中多次出现的词汇进行频率记录，获得词汇的词频；

S3、根据文字问题进行对出现预设外贸行业关键词相关的文档数的倒数进行记录，并得到逆文档频率，并将逆文档频率传输至问题解读模块；

S4、将词频与逆文档频率结合，计算词汇在问题中的重要性，同时对根据重要性对问题的范围进行一级分类范围进行计算，并得到一级问题点数据。

进一步的，为了问题解读模块问题进行更精准的分析，根据一级问题点数据进行解读一级问题点，并获得二级问题点数据包括：

S11、将全部文字问题逆文档频率进行计算，算并根据计算结果对逆文档频率进行赋权；

S22、根据赋权结果对一级问题点数据进行二次计算，并根据计算结果获取二问题点数据；

将全部文字问题逆文档频率进行计算，算并根据计算结果对逆文档频率进行赋权的计算公式为：

DF(w，d)＝BF(w，d)*log(N/GF(w))

式中，DF(w，d)为词汇w在全部文字问题d中的权重值；

BF(w，d)表示词汇w在全部文字问题d中出现的次数除以文字问题d的总词数；

DF(w)表示含有词汇w的文字问题数；

N表示语料库中的文字问题总数。

进一步的，为了将分析后的问题进行回答，数据对比模块包括数据比较模块和自然语音处理模块；

其中，数据比较模块，用于将提取的重点词汇与知识图谱模块内部数据进行对比；

自然语音处理模块，用于使用自然语言处理技术来分析问题内容。

进一步的，为了数据比较模块对提取的重点词汇与知识图谱模块内部数据进行对比挑选答案，将提取的重点词汇与知识图谱模块内部数据进行对比包括：

S111、将重点词汇与知识图谱模块内部数据进行匹配；

S222、根据重点词汇与知识图谱模块内部数据匹配结果对词汇位置进行调节；

S333、根据重点词汇调节后的词汇顺序与知识图谱模块内部数据进行比较。

进一步的，为了问题应答模块便于对客户提出的问题进行不同需求的解答，问题应答模块包括回答生成模块、自然语言处理模块及用户交互模块；

其中，回答生成模块，用于将重点词汇数据和知识数据的对比结果进行总结，得到问题回答数据；

自然语言处理模块，用于将问题回答数据进行文字，并对提出问题申请人进行答复；

用户交互模块，用于将使用者对问题的回答进行评价。

进一步的，为了数据更新模块对知识图谱模块的内部数据进行更新，提高解答的效率，数据更新模块包括数据抓取模块、数据清洗模块、数据转换模块及数据加载模块；

其中，数据抓取模块，用于根据预设时间从数据源中获取数据；

数据清洗模块，用于对获取的数据进行清洗和处理，并确保数据格式的统一性；

数据转换模块，用于将清洗后的数据转换为使用所需格式；

数据加载模块，用于将转换后的数据加载入知识图谱模块。

本发明的有益效果为：

1、本发明通过对采集到的用户问题进行收集，通过对问题进行解读分类，并对分类后的问题进行重点词汇的提取，将提取后的重点词汇与知识图谱内部数据信息对比，且根据对比结果对用户提出的问题进行解答，避免了人工客服的劳力成本，同时通过实时对知识图谱进行数据更新，减少了客服使用时的数据错误，提高了外贸行业人工智能客服系统的精准度，使得基于知识图谱的外贸行业人工智能客服系统使用时的效率大大提高。

2、本发明通过对获取的问题进行调节，减少了因用户提出问题中错别字及语序错误，对基于知识图谱的外贸行业人工智能客服系统的误导，提高了客服回答用户问题的效率，且通过对问题进行细致的分析，提高外贸行业人工智能客服系统对问题回答的精度，同时通过对重点词汇的排序提高问题进行回答的着重顺序，提高用户对问题答案的了解，使得基于知识图谱的外贸行业人工智能客服系统的使用效果大大提高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种基于知识图谱的外贸行业人工智能客服系统的结构框图；

图2是根据本发明实施例的一种基于知识图谱的外贸行业人工智能客服系统中语句分析模块的结构框图。

图中：

1、问题收集模块；2、问题解读分类模块；21、问题接收模块；22、语句分析模块；221、语句识别模块；222、语音识别模块；223、问题调节模块；224、问题分析模块；23、问题解读模块；24、问题分类模块；3、数据提取模块；4、知识图谱模块；5、数据对比模块；51、数据比较模块；52、自然语音处理模块；6、问题应答模块；61、回答生成模块；62、自然语言处理模块；63、用户交互模块；7、数据更新模块；71、数据抓取模块；72、数据清洗模块；73、数据转换模块；74、数据加载模块。

具体实施方式

为进一步说明各实施例，本发明提供有附图，这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理，配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点，图中的组件并未按比例绘制，而类似的组件符号通常用来表示类似的组件。

根据本发明的实施例，提供了一种基于知识图谱的外贸行业人工智能客服系统。

现结合附图和具体实施方式对本发明进一步说明，如图1和图2所示，根据本发明实施例的基于知识图谱的外贸行业人工智能客服系统，包括问题收集模块1、问题解读分类模块2、数据提取模块3、知识图谱模块4、数据对比模块5、问题应答模块6及数据更新模块7；

其中，问题收集模块1，用于获取民众对外贸行业提出的问题数据；

具体的，问题收集模块通常包括，问题描述：用户可以输入他们遇到的问题说明，问题优先级：根据问题的紧急程度或重要性，可以自动或手动设置每个问题的优先级，问题状态：问题在处理过程中可能会经历多个状态，例如“待处理”、“进行中”、“已解决”等，问题反馈：管理员或支持人员可以向用户提供有关问题解决进度的更新和反馈。

问题解读分类模块2，用于根据获取的问题数据进行解读，并根据解读结果进行分类；

具体的，问题解读分类模块2包括问题接收模块21、语句分析模块22、问题解读模块23及问题分类模块24；

其中，问题接收模块21，用于将问题收集模块1获取的问题数据进行接收；

语句分析模块22，用于将接收的问题数据进行语句分析，获取一级问题点数据；

问题解读模块23，用于根据一级问题点数据进行解读一级问题点，并获得二级问题点数据；

问题分类模块24，用于根据二问题点数据对问题数据进行问题分类；

具体的，语句分析模块22包括语句识别模块221、语音识别模块222、问题调节模块223及问题分析模块224；

其中，语句识别模块221，用于将接收问题数据中的文字问题进行筛分；

语音识别模块222，用于将接收问题数据中的语音问题进行筛分，并转换为文字问题；

问题调节模块223，用于将文字问题中的错别字及语序进行调节；

问题分析模块224，用于将调节后的文字问题进行分析，并得到第一问题点数据。

具体的，将调节后的文字问题进行分析，并得到第一问题点数据包括：

S1、根据外贸行业的词汇使用评率，预设外贸行业关键词；

S2、根据文字问题进行关键词筛选，并对文字问题中多次出现的词汇进行频率记录，获得词汇的词频；

S3、根据文字问题进行对出现预设外贸行业关键词相关的文档数的倒数进行记录，并得到逆文档频率，并将逆文档频率传输至问题解读模块23；

S4、将词频与逆文档频率结合，计算词汇在问题中的重要性，同时对根据重要性对问题的范围进行一级分类范围进行计算，并得到一级问题点数据。

具体的，根据一级问题点数据进行解读一级问题点，并获得二级问题点数据包括：

S11、将全部文字问题逆文档频率进行计算，算并根据计算结果对逆文档频率进行赋权；

S22、根据赋权结果对一级问题点数据进行二次计算，并根据计算结果获取二问题点数据。

具体的，将全部文字问题逆文档频率进行计算，算并根据计算结果对逆文档频率进行赋权的计算公式为：

DF(w，d)＝BF(w，d)*log(N/GF(w))

式中，DF(w，d)为词汇w在全部文字问题d中的权重值；

BF(w，d)表示词汇w在全部文字问题d中出现的次数除以文字问题d的总词数；

GF(w)表示含有词汇w的文字问题数；

N表示语料库中的文字问题总数；

数据提取模块3，用于根据分类结果对问题数据进行重点词汇数据进行提取；

知识图谱模块4，用于收集外贸行业相关领域的知识数据，并将收集的知识数据进行总结串联；

具体的，采用全外连接进行内部数据的串联，通过将返回的结果集包括左表和右表中的所有行，如果某些行在对应的表中没有匹配的记录，则它们的值将为NULL，如果在左表和右表中都存在匹配的记录，则每个匹配的行将合并成一行，并包含左表和右表中的所有列。

数据对比模块5，用于将提取后的重点词汇数据和知识数据进行关联性比较；

具体的，数据对比模块5包括数据比较模块51和自然语音处理模块52；

其中，数据比较模块51，用于将提取的重点词汇与知识图谱模块4内部数据进行对比；

自然语音处理模块52，用于使用自然语言处理技术来分析问题内容。

具体的，将提取的重点词汇与知识图谱模块4内部数据进行对比包括：

S111、将重点词汇与知识图谱模块4内部数据进行匹配；

S222、根据重点词汇与知识图谱模块4内部数据匹配结果对词汇位置进行调节；

具体的，对比重点词汇和知识图谱模块内部数据，将重点词汇与知识图谱模块内部数据进行匹配，得到它们之间的相似度或匹配结果，再将匹配结果可视化，将重点词汇和匹配成功的实体、属性或关系等分别标注出来，以便于观察和分析，且对于那些没有匹配成功的词汇，可以计算它们与最近的匹配成功的词汇之间的编辑距离，以确定需要插入、删除或替换的操作，再进行词汇位置调整，根据编辑距离计算出需要插入、删除或替换的操作，并在重点词汇的左侧或右侧执行相应的操作，从而实现词汇位置的调整；

S333、根据重点词汇调节后的词汇顺序与知识图谱模块4内部数据进行比较；

问题应答模块6，用于根据重点词汇数据和知识数据的对比结果进行问题回答；

具体的，问题应答模块6包括回答生成模块61、自然语言处理模块62及用户交互模块63；

其中，回答生成模块61，用于将重点词汇数据和知识数据的对比结果进行总结，得到问题回答数据；

自然语言处理模块62，用于将问题回答数据进行文字，并对提出问题申请人进行答复；

用户交互模块63，用于将使用者对问题的回答进行评价；

数据更新模块7，用于根据问题应答模块6对知识图谱模块4的知识数据进行实时更新。

具体的，数据更新模块7包括数据抓取模块71、数据清洗模块72、数据转换模块73及数据加载模块74；

其中，数据抓取模块71，用于根据预设时间从数据源中获取数据；

数据清洗模块72，用于对获取的数据进行清洗和处理，并确保数据格式的统一性；

具体的，检查数据中的缺失值并填补缺失值或删除含有缺失值的行，检查数据中的异常值确定是否将其视为错误数据并删除或修正，将检测后的数据从一种类型转换为另一种类型，再对数据进行格式化以方便后续处理和分析，同时检查数据中是否存在重复记录，去重后将来自不同数据源的数据进行合并，再将一个大的数据集分割成多个较小的数据集以便于处理和分析。

数据转换模块73，用于将清洗后的数据转换为使用所需格式；

数据加载模块74，用于将转换后的数据加载入知识图谱模块4。

综上所述，借助于本发明的上述技术方案，本发明通过对采集到的用户问题进行收集，通过对问题进行解读分类，并对分类后的问题进行重点词汇的提取，将提取后的重点词汇与知识图谱内部数据信息对比，且根据对比结果对用户提出的问题进行解答，避免了人工客服的劳力成本，同时通过实时对知识图谱进行数据更新，减少了客服使用时的数据错误，提高了外贸行业人工智能客服系统的精准度，使得基于知识图谱的外贸行业人工智能客服系统使用时的效率大大提高。

此外，本发明通过对获取的问题进行调节，减少了因用户提出问题中错别字及语序错误，对基于知识图谱的外贸行业人工智能客服系统的误导，提高了客服回答用户问题的效率，且通过对问题进行细致的分析，提高外贸行业人工智能客服系统对问题回答的精度，同时通过对重点词汇的排序提高问题进行回答的着重顺序，提高用户对问题答案的了解，使得基于知识图谱的外贸行业人工智能客服系统的使用效果大大提高。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载