掌桥专利:专业的专利平台
掌桥专利
首页

一种基于机器学习的企业数据特征提取方法

文献发布时间:2023-06-19 18:37:28


一种基于机器学习的企业数据特征提取方法

技术领域

本发明属于计算机技术领域,特别涉及企业大数据处理和机器学习。

背景技术

在企业管理中,上层决策非常重要。很多的决策需要以大量的客观企业数据为支撑。由于相应企业部门众多,数据量非常大,收集手段大相径庭,这些数据需要进行处理,才能给上层决策者提供帮助。但是现实的情况是,由于设计的人员和部门比较大多,再加上管理等因素。这些数据比较难以进行分析。

企业大数据每一条记录都和企业高度相关,都可能蕴含巨大信息量,价值密度高,需要企业更加重视。从另一方面来说,企业大数据是当前能快速挖掘利用,能高效分析,支撑决策管理的数据。例如营销的数据,主要是对复杂多样的各渠道企业营销数据进行处理分析,建立统一的数据仓库和数据模型,以实现企业的精细化运营和精准营销,提升企业数据的管理和驱动能力。企业大数据主要来自日常经营活动。企业管理信息系统里,各个岗位管理者和部门都有相应的数据清单。在现代企业管理中,企业大数据作为企业的命脉,至关重要。

迄今为止,在该方面还没有好的处理方案。一般采用人工的方法对相应的数据进行分类和分析,并提供给上层。缺点是该方法的结果严重依赖于执行者的业务能力。如果执行者非常专业非常了解设计,得出的分析检测效果比较好。如果执行者的业务水平和偏好所致,可能会给企业带来巨大损失。

本发明的有益效果是:本发明的所提出的方法的有益效果主要表现在本发明通过机器学习的方法进行企业数据的分析,不依赖于人工的业务能力和偏好,可以实现快速和精确的客观特征提取。

发明内容

本发明基于机器学习的思想,提出了一种新的企业数据特征提取方法。本发明通过机器学习的方法进行企业数据的分析,不依赖于人工的业务能力和偏好,可以实现快速和精确的客观特征提取。

本发明基于机器学习提出了一种基于机器学习的企业数据特征提取方法。本发明的技术方案主要包括8个步骤具体如下:

S1、建立企业数据预分析特征库:基于企业的要求和企业数据分析,得出企业数据需要分析的特征,完成特征提取,从而建立企业数据预分析特征库,该特征库将用来指导后面的机器学习建模;

S2、确定企业数据需分析的特征:在步骤S1中选取进行企业数据分析的特征;

S3、企业数据预处理:将数据导入相应的处理工具进行数据预处理;

S4、数据清洗:根据“脏数据”情况,制定数据清洗算法和清洗方案;

S5、建立企业数据训练集:基于企业已有数据,通过步骤S3完成企业数据预处理,通过步骤S4数据清洗,通过步骤S1完成特征提取,从而建立企业数据训练集;

S6、建立企业数据机器学习模型:基于步骤S2所选择的特征和机器学习算法,建立企业数据初步机器学习模型;

S7、企业数据机器学习模型训练:基于步骤S5建立的企业数据训练集进行机器学习模型训练

S8、企业数据机器学习模型优化:根据相应的机器学习模型优化策略,进行机器学习模型调参和优化,得出最后的企业数据机器学习模型。

本发明的有益效果:本发明的所提出的方法的有益效果主要表现在本发明通过机器学习的方法进行企业数据的分析,不依赖于人工的业务能力和偏好,可以实现快速和精确的客观特征提取。

附图说明

图1为本发明的建立流程图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步的说明。

本发明基于机器学习提出了一种基于机器学习的企业数据特征提取方法。本发明的技术方案主要包括8个步骤具体如下:

(1)建立企业数据预分析特征库:基于企业的要求和企业数据分析,得出企业数据需要分析的特征,完成特征提取,从而建立企业数据预分析特征库,该特征库将用来指导后面的机器学习建模。

(2)确定企业数据需分析的特征:在步骤(1)中选取进行企业数据分析的特征。

(3)企业数据预处理:将数据导入相应的处理工具进行数据预处理。

(4)数据清洗:根据“脏数据”情况,制定数据清洗算法和清洗方案,并根据指定的数据清洗算法和清洗方案,编写数据清洗程序,使其自动执行清洗过程对数据进行自动清洗,直到处理后的数据满足数据清洗的要求。

(5)建立企业数据训练集:基于企业已有数据,通过步骤(3)完成企业数据预处理,通过步骤(4)数据清洗,通过步骤(1)完成特征提取,从而建立企业数据训练集。

(6)建立企业数据机器学习模型:基于步骤(2)所选择的特征和机器学习算法,建立企业数据初步机器学习模型。

(7)企业数据机器学习模型训练:基于步骤(5)建立的企业数据训练集进行机器学习模型训练。

(8)企业数据机器学习模型优化:根据相应的机器学习模型优化策略,进行机器学习模型调参和优化,得出最后的企业数据机器学习模型。

按照上面技术方案完成机器模型的建模后,即可以用来进行企业数据特征提取。企业数据经过相应的处理,得出相应类似训练集中的样本,该样本结合所建立的机器模型,即可以实现数据分析。该分析可以在相应的机器学习框中实现。

本发明的企业数据特征提取方法基于机器学习模型和算法,通过企业前期数据所得数据集,对企业所提取特征进行优化建模,从而可以实现快速和客观的特征提取。

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

技术分类

06120115632800