掌桥专利:专业的专利平台
掌桥专利
首页

供电服务客户电量电费诉求识别方法

文献发布时间:2023-06-19 10:38:35



技术领域

本发明涉及供电服务技术领域,尤其涉及一种供电服务客户电量电费诉求识别方法。

背景技术

供电服务是电力经营机制中的一个重要环节,是电力安全的保证.是电力生产部门与客户之间的特殊纽带。

现有的供电服务客户电量电费诉求大多采用人工进行逐条进行阅读分类,工作量较大、且易出错。

因此,有必要提供一种新的基于文本相似度度量的供电服务客户电量电费诉求识别方法解决上述技术问题。

发明内容

本发明解决的技术问题是提供一种具有能够自动进行分类识别、大大降低了人工、识别效率高的基于文本相似度度量的供电服务客户电量电费诉求识别方法。

为解决上述技术问题,本发明提供的基于文本相似度度量的供电服务客户电量电费诉求识别方法包括以下步骤:

S1:文本预处理:将工单中的文本进行文本分词及文本量化,对文本长内容按照规则进行切分,剔除停用词;通过文本预处理形成专业词库和同义词库,用于提高对新数据进行分词的准确性和有效性;

S2:余弦相似度算法:在全量样本中随机选择一万条样本作为训练样本和测试样本,在全量样本中随机选择一万条样本,依据余弦相似度算法识别工单中包含的客户诉求,结合业务知识及逻辑,定义各个主题的业务意义,形成客户诉求热点体系表;

S3:自动化文本分类:根据识别的主题及对应的词库,结合分类算法对全量客服工单实现自动化的分类,同时结合包含多户停电诉求主题的其他工单进行丰富词库,最终形成各个诉求主题分别对应各自词库;之后结合分类算法对全量客服工单实现自动分类,以及当新的工单数据产生之后。

优选的,所述S1中,停用词包括对文本分析无影响的语气助词、量大且无效的词汇、标点符号。

优选的,所述S3中,根据识别的主题及对应的词库,结合分类算法对全量客服工单实现自动化的分类,如停电诉求主题对应的词库包括处理、导致、电话、反映、核查、来电和要求。

优选的,所述S3中结合分类算法,对新产生的工单数据进行分类,用于识别客户诉求。

优选的,所述S1中,采用调用封存的jar包,所述jar包中通过开发的java程序一方面实现分词工具的调用,在调用ICTCLAS分词工具,用于保证分词结果准确和有效性,所述jar包中加入电力行业专业词库和同义词库。

优选的,所述jar包中加入电力行业专业词库和同义词库,如专业词库中专业词三相不平衡、三相负荷、三相平衡统一定义为同义词三相问题,专业词库中专业词时间不要这么长、时间过长、时间跨度长、时间太长、时间长统一定义为同义词时间过长。

与相关技术相比较,本发明提供的基于文本相似度度量的供电服务客户电量电费诉求识别方法具有如下有益效果:

本发明提供供电服务客户电量电费诉求识别方法,通过对文件进行预处理然后再进行余弦相似度算法形成客户诉求热点体系表并最终形成自动化文本,能够快速有效的对客户电量电费诉求进行识别,且通过将专业词同一定义为一类同义词,方便了对客户电量电费诉求进行分类查阅。

具体实施方式

下面结合实施方式对本发明作进一步说明。

基于文本相似度度量的供电服务客户电量电费诉求识别方法包括以下步骤:

S1:文本预处理:将工单中的文本进行文本分词及文本量化,对文本长内容按照规则进行切分,剔除停用词;通过文本预处理形成专业词库和同义词库,用于提高对新数据进行分词的准确性和有效性;

S2:余弦相似度算法:在全量样本中随机选择一万条样本作为训练样本和测试样本,在全量样本中随机选择一万条样本,依据余弦相似度算法识别工单中包含的客户诉求,结合业务知识及逻辑,定义各个主题的业务意义,形成客户诉求热点体系表;

S3:自动化文本分类:根据识别的主题及对应的词库,结合分类算法对全量客服工单实现自动化的分类,同时结合包含多户停电诉求主题的其他工单进行丰富词库,最终形成各个诉求主题分别对应各自词库;之后结合分类算法对全量客服工单实现自动分类,以及当新的工单数据产生之后。

优选的,所述S1中,停用词包括对文本分析无影响的语气助词、量大且无效的词汇、标点符号。

优选的,所述S3中,根据识别的主题及对应的词库,结合分类算法对全量客服工单实现自动化的分类,如停电诉求主题对应的词库包括处理、导致、电话、反映、核查、来电和要求。

优选的,所述S3中结合分类算法,对新产生的工单数据进行分类,用于识别客户诉求。

优选的,所述S1中,采用调用封存的jar包,所述jar包中通过开发的java程序一方面实现分词工具的调用,在调用ICTCLAS分词工具,用于保证分词结果准确和有效性,所述jar包中加入电力行业专业词库和同义词库。

优选的,所述jar包中加入电力行业专业词库和同义词库,如专业词库中专业词三相不平衡、三相负荷、三相平衡统一定义为同义词三相问题,专业词库中专业词时间不要这么长、时间过长、时间跨度长、时间太长、时间长统一定义为同义词时间过长。

与相关技术相比较,本发明提供的基于文本相似度度量的供电服务客户电量电费诉求识别方法具有如下有益效果:

本发明提供供电服务客户电量电费诉求识别方法,供电服务客户电量电费诉求识别方法,通过对文件进行预处理然后再进行余弦相似度算法形成客户诉求热点体系表并最终形成自动化文本,能够快速有效的对客户电量电费诉求进行识别,且通过将专业词同一定义为一类同义词,方便了对客户电量电费诉求进行分类查阅。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 供电服务客户电量电费诉求识别方法
  • 一种基于文本相似度度量的供电服务客户诉求识别方法
技术分类

06120112623787