掌桥专利:专业的专利平台
掌桥专利
首页

一种网络推广中快速分词的方法

文献发布时间:2023-06-19 11:35:49


一种网络推广中快速分词的方法

技术领域

本发明涉及计算机技术领域,具体来说,涉及一种网络推广中快速分词的方法。

背景技术

随着越来越多的企业转型互联网进行网络营销推广,企业在进行网络推广时的方法以及做付费推广时的关键词需要越来越精准有效,怎么从几万、几十万以及几百万的关键词中筛选有效的关键词是企业在做网络推广时首先需要考虑的问题,筛选出有效关键词后,如何进行关键词分类组合,也是企业比较头疼的问题,如果不能筛选有效词以及根据不同词的属性进行分词,那么企业在推广过程中就会造成很大的浪费。

目前分词基本上都是通过传统的人工分词,传统的人工分词一开始就需要从所有长尾词中,找出来有哪些共性词,比如厂家词,价格词,型号词,场景词等,一方面不同行业需要很精通才能清楚要分的长尾词有哪些词根,繁琐耗时耗精力,并且容易遗漏关键词,需要一种更便捷,更能提高分词速度的一种方法,而分词系统,根据中文分词词根技术,自动打散所有长尾词,进行整合统计出现频次比较高的词根,直接分析出常见词根和出现的次数,供用户分析使用。

传统的人工分词在操作过程中,需要一个词一个词的进行分类,如果一个核心关键词有几十万个长尾词, 那么在分词过程中需要耗费大量的时间一个词一个词的进行查找分类,并且容易遗漏关键词,如果要分厂家词,那么需要从这几十万个长尾词里面一个一个的把包含厂家的词找出来,归类到一起,这样分一类词,就需要从几十万个词中人工筛选一次,那么如果要把所有的词分出来,就需要重复人工提取好多次。而通过分词系统,只需要输入词根“厂家”系统就会自动把含厂家的长尾词,全部提取出来,并且按照厂家在头部、中间、尾部的结构分类。因此,传统的人工分词在操作过程中还是存在许多弊端。

发明内容

针对相关技术中的上述技术问题,本发明提出一种网络推广中快速分词的方法,能够克服现有技术方法的上述不足。

为实现上述技术目的,本发明的技术方案是这样实现的:

一种网络推广中快速分词的方法,包括以下步骤:

S1:用户输入关键词,分词系统根据用户输入的关键词自动挖掘所有包含该关键词的长尾词,保存为txt文件;

S2:分词系统从txt文件中读取所有长尾词,根据中文进行分词,打散所有长尾词,提取出现频率比较高的关键词,提取汇总高频词根,返回给用户;

S3:用户根据分词系统提取的高频词根,保留有效词;

S4:根据剩余保留的有效词,筛选出有效词根;

S5:分词系统根据筛选出的有效词根,进行分词,导出xls分词表。

进一步地,保留有效词是通过分词系统提取高频词根,剔除无效词,重复此操作,直至剔除完所有的无效词为止。

进一步地,筛选有效词根是通过高频词根在剩余有效词中,根据词性相近,结构相同的原则,筛选出有效词,直至剩余有效词中无可提取的有效词为止。

进一步地,分词阶段,在选择有效词根后,分词系统根据用户选择的所有有效词根,从所有长尾词中,按照词根顺序提取同类关键词进行分类,并且在同类关键词中,根据字符长度,把同长度的关键词进行分列,最终生成xls分词表。

进一步地,关键词进行分列是通过把同一类有效词根的词分成一列以后,根据每一列中关键词字符的长度,把关键词字符长度一致的词再细化分成一列,然后再每列中提取地域词,再分成一列,循环操作每一列的内容。

本发明的有益效果:通过系统导出对同一类关键词时,根据字符长度自动分组,来更好的推广,通过一键导出分词结果至xls文件至本地,解决分词速度慢、遗漏关键词的问题,提高企业在从大量关键词中筛选有效词并进行分类整合的时间效率,提高工作效率及结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本发明实施例所述的网络推广中快速分词的方法的关键词在分词系统中的流程示意图。

图2是根据本发明实施例所述的网络推广中快速分词的方法的实现流程示意图。

图3是根据本发明实施例所述的网络推广中快速分词的方法的实现流程示意图二。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

如图1-2所示,根据本发明实施例所述的网络推广中快速分词的方法,包括用户输入关键词,分词系统根据用户输入关键词自动挖掘所有包含该关键词的长尾词,保存为txt长尾词文件;分词系统从txt长尾词文件中读取所有长尾词,根据中文分词词根技术打散所有长尾词,进行整合统计出现频次比较高的词根,直接分析出常见的词根和出现的次数,也就是提取出现频率比较高的关键词,提取汇总高频词根,返回给用户分析使用。

用户根据分词系统自动提取的高频词根,剔除无效词,重复操作,直至剔除完所有的无效词为止,保留剩余有效词至下一步骤。

然后高频词根在剩余保留的有效词中,根据词性相近,结构相同的原则,筛选出有效词,直至剩余关键词中无可提取的关键词为止。

分词系统在所有关键词中根据用户选择的所有有效词根,筛选出的有效词根,从所有长尾词中,按照词根顺序提取同类关键词进行分类,并在同类关键词中,根据字符长度,把同长度的关键词分到一列,根据每一列中关键词字符长度,把关键词字符长度一致的词再细化分成一列,然后再每一列中提取地域词,再分成一列,这样循环操作每一列内容,最后生成xls分词表。

为了方便理解本发明的上述技术方案,以下通过具体使用方式上对本发明的上述技术方案进行详细说明。

如图3所示,首先,输入核心词:FFU,系统自动进行长尾词挖掘,共挖掘出FFU所有长尾词13649个。系统根据中文分词原理,打散全部关键词进行组合,共可筛选出出现频次较高的词根220个:山东,节能,格式,检漏,夹层,售后,洁净度,阻力,达到,应用,百科,介绍,德国,推荐,郑州,材料,评测,问题,天花,富泰,排名,选型,昆山,滴度,出风,比较,实验室,洁净车间,点检,距离,除甲醛,原理图,示意图,专业,吊装,原因,管道,改装,正压,效率,次数,武汉,技术,开关,下载,对比,十万,直流电机,玻璃纤维,清洗,说明书,回收,广东,处理,换气……。

根据以上列出来的一部分词根,筛选出有效词根以及无效词根;然后过滤掉无效词根,系统自动按照所有词根进行分组排序,首选根据字符长度进行排序,然后自动筛选出地域词进行排序,如:节能,格式,检漏,夹层,售后,阻力,达到,应用,百科,介绍, 推荐, 材料,评测,问题,天花,富泰,排名,选型, 滴度,出风,比较,点检,距离,专业,吊装,原因,管道,改装,正压,效率,次数, 技术,开关,下载,对比,十万,清洗,回收,处理,换气,说明书,除甲醛,原理图,示意图,洁净度, 实验室,洁净车间,直流电机,玻璃纤维……。

最后根据分好的关键词,最终导出xls表。如表1分词表。

表1分词表

综上所述,借助于本发明的上述技术方案,通过系统导出对同一类关键词时,根据字符长度自动分组,来更好的推广,通过一键导出分词结果至xls文件至本地,解决分词速度慢、遗漏关键词的问题,提高企业在从大量关键词中筛选有效词并进行分类整合的时间效率,提高工作效率及结果。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种网络推广中快速分词的方法
  • 一种基于最小信息量的汉语快速分词系统及方法
技术分类

06120112986046