掌桥专利:专业的专利平台
掌桥专利
首页

宏观经济指标舆情数据库

文献发布时间:2023-06-19 19:30:30


宏观经济指标舆情数据库

技术领域

本发明属于数据库技术领域,具体涉及宏观经济指标舆情数据库。

背景技术

近些年,随着国家不断加大对经济类、管理类等社会学科的支持,这些学科科研呈现出百花齐放的局面。与之相对应的是,相关科研工作者对于科研的需求也越来越多。总结、挖掘前人的研究成果,并从中得到启发、进而创新,是科研工作者进行研究的一个重要方面。

随着网络信息的发展,越来越多的人通过网络了解信息,发表言论,网络逐渐占据人们生活的大多数时间,由于网络存在匿名言论的优势,对网络的舆情监控则应运而生。而经济学对于舆情的研究更多的是舆情的传播路径等方面的研究,尚未有学者研究舆情指标数据对某一些宏观经济指标的影响。

舆情应用的发展现状主要是做舆情监控,监测不良舆情事件的发生,传播,影响等,目前市场上有很多舆情监控平台,从文本舆情到视频舆情,都是为政府企业或者个人提供舆情监测,舆情预警,舆情分析和舆情报告。

我国统计局每年都会发布很多统计数据,市面上有很多产品将这些数据进行收集整理,做成数据库的形式,为高校的科研提供数据服务,但是市面上的宏观数据库里边的数据均为国家发布的统计数据,市面上目前还没有产品发布宏观指标的舆情数据库,宏观数据本身具有一定的研究价值,但是在网络舆情越来越发达的现在社会,宏观指标的舆情统计数据也有很好的研究价值。

综上,舆情指标数据对宏观指标数据的影响这个方向目前还没有人研究,宏观经济指标和舆情指标整合在一个数据库中,同时可以为舆情数据寻找一个新的研究形式,其次可以为被研究过太多次的宏观指标增加新的研究方向。

发明内容

本发明的目的在于提供宏观经济指标舆情数据库,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:宏观经济指标舆情数据库,包括宏观数据指标模块和舆情数据指标模块;

所述数据库建立过程为从社交平台收集舆情数据,筛选出国民经济行业指标的舆情文本数据,根据正负面等进行判断,并统计不同分类下的舆情数量,按照时间,地区,经济指标,舆情指标等筛选条件建立相应的数据库,其中指标包括宏观数据指标模块和舆情数据指标模块。

所述判断标准采用判别分析模型,包括不限于逻辑回归,决策树,神经网络等。

所述宏观数据指标模块包括国民经济核算单元、人口单元、就业人员和职工工资单元、固定资产投资单元、对外经济贸易单元、能源单元、财政单元、价格指数单元、人民生活单元、城市概况单元、资源与环境单元、农业单元、工业单元、建筑业单元、运输和邮电单元、国内贸易单元、金融单元、教育和科技单元、文化体育和卫生单元、社会管理单元、社会服务单元和社会保障单元;

所述舆情数据指标模块包括标题出现关键词的新闻总数单元、内容出现关键词的新闻总数单元、正面舆情新闻数单元、中性舆情新闻数单元、负面舆情新闻数单元、发帖数量单元、参与发帖人数单元、阅读次数单元、评论次数单元、转发次数单元、分享次数单元、收藏次数单元、负面关联词语单元、正面关联词语单元、中性关联词语单元、关联词语词频单元。

优选的,所述国民经济核算单元包括第一产业、农林牧渔业、第二产业、工业增加值、建筑业、第三产业、交通运输业、邮政业、批发业、住宿业、餐饮业、金融业、房地产业、仓储业、居民消费水平、农村居民消费水平、城镇消费水平;所述人口单元包括全国总人口、男性人口、女性人口、城镇、乡村、出生率、死亡率、自然增长率、流动、普查、抽样调查;所述就业人员和职工工资单元包括就业人员数、职工工资、工资总额、城镇平均工资、农村失业人数、国有单位失业率、私营企业劳动报酬、外商投资单位平均工资指数、个体户平均货币工资指数、农-林-牧-渔业平均实际工资指数、采掘业、制造业、交通运输、仓储和邮政业、批发零售贸易和餐饮业、批发和零售业、住宿和餐饮业、租赁和商务服务业、居民服务和其他服务业、社会服务业、城镇投资者人数、乡村投资者人数。

优选的,所述固定资产投资单元包括全社会固定资产投资的固定资产投资总额、民间固定资产投资的固定资产建设总规模、城镇固定资产投资的住宅投资、第一产业固定资产投资、第二产业固定资产投资、第三产业固定资产投资、房地产开发企业和销售面积;所述对外经济贸易单元包括进出口贸易和对外经济合作,所述进出口贸易包括进出口总额、出口总额、进口总额、进出口差额、出口货物、进口货物、货物进出口和外商投资企业货物进出口总额。

优选的,所述能源单元包括能源生产、能源消费、石油的可供量、煤炭的生产量、电力、能源加工转换效率,所述能源生产包括生产总量、原煤比重、原油比重、天然气比重、水电比重、核电比重和风电比重,所述电力包括进口量、出口量、消费量、平衡差额、能源生产弹性系数和能源消费弹性系数;所述能源加工转换效率包括发电及电站供热转换效率、炼焦转换效率和炼油转换效率。

优选的,所述财政单元包括国家财政收入、国家财政支出和国家债务,所述国家财政收入包括财政收入占比、税收和非税收收入,所述税收包括增值税、营业税、外贸企业出口退税、资源税、城市维护建设税、企业所得税、个人所得税、城镇土地使用税、契税、烟叶税、耕地占用税、证券交易印花税、房产税、印花税、土地增值税和车船税,所述非税收收入包括专项收入、行政事业性收费、罚没收入、国有资本经营收入、国有资源有偿使用收入、捐赠收入和政府住房基金收入,所述国家财政支出包括财政支出占比、一般公共服务支出、国内外债务付息支出、外交支出、对外援助支出、国防支出、公共安全支出、武装警察支出、教育支出、科学技术支出、文化体育与传媒支出、社会保障和就业支出、医疗卫生支出、环境保护支出、城乡社区事务支出、农林水事务支出、交通运输支出、车辆购置税支出、资源勘探电力信息事务支出、工业-商业-金融事务支出、商业服务业事务支出、金融监管支出、援助其他地区支出、地震灾后恢复重建支出、国土气象事务支出、住房保障支出、粮油物资储备管理事务支出、灾害防治及应急管理支出、国债付息支出和债务发行费用支出,所述国家债务包括国内债务、国外债务、外债余额、外国政府贷款、国际金融组织贷款、国际商业贷款、贸易信贷、长期债务余额、短期债务余额、偿债率、负债率、债务率、政府性基金收入决算、政府性基金支出预算、股利、股息收入和国有资本经营收入决算。

优选的,所述价格指数单元包括居民消费价格指数、商品零售价格指数、工业品出厂价格指数、固定资产投资价格指数、农业生产资料价格指数、农产品生产价格指数、进出口商品价格指数和建筑安装工程价格指数;所述人民生活单元包括人民币储蓄存款、人均国内旅游花费、五险一金、人均收入、人均支出、人均消费和居民人均可支配收入。

优选的,所述城市概况单元包括城市年底人口数、地区生产总值、用电量、工业总产值、客运量、货运量、国内贸易、在校学生数、城乡居民储蓄存款、学校、医院、卫生院、执业医师、城市建设、城市集中供热、城市燃气、城市公共交通、城市市政设施、城市设施水平、城市环境卫生、城市供水和城市绿化和园林;所述资源与环境单元包括资源储量、工业废水排放、生活污水排放、工业废气排放量、二氧化硫排放量、烟尘排放量、工业粉尘排放量、废气处理状况、固体废物、危险废物处理、城市生活垃圾清运和处理、生态环境和自然灾害及防治;所述农业单元包括农村机械化程度、灌溉面积、化肥施用量、农村用电量、农作物总播种面积、农产品、畜牧业、水产品、林产品、农村水电建设、农村发电、灌溉水库、除涝治水治碱、受灾和农场。

优选的,所述工业单元包括规模以上工业企业、工业总产值、资产负债、资产总计、流动资产、固定资产、资产净值、流动负债、长期负债、所有者权益、主营业务收入、主营业务成本、主营业务税金及附加、利润总额和工业产品产量;所述建筑业单元包括建筑业总产值、房屋建筑、土木工程建筑、建筑安装业、建筑装饰业、劳务分包建筑业、勘察设计机构、工程招标代理机构和建筑业技术装备;所述运输和邮电单元包括铁路运输业、道路运输业、城市公共交通业、水上运输业、航空运输业、管道运输业、装卸搬运和其他运输服务业、运输线路长度、运输线路质量、客运量、货运量、旅客周转量、货物周转量、公路运输装备、水路运输装备及运行、民航运输装备基本运行、邮电业务和电信业务量。

优选的,所述国内贸易单元包括商品购进额、商品销售额、零售市场、乘用车销售、二手乘用车销售和旅游业;所述金融单元包括存款、贷款、有价证券、投资、股权、黄金、外汇、货币、黄金外汇储备、流通现金、活期存款、定期存款、债券、社会融资、股票融资、直接融资、上市公司、股票发行、股票成交、上证综合指数、深证综合指数、投资者开户、市盈率、债券发行、国债发行、企业债券发行、投资基金、期货、新三板股票、上交所、深交所、股票筹资和保险业;所述教育和科技单元包括九年义务教育、初级教育、高等教育、毕业生、在校学生、研究生教育、资格证书、岗位证书、职业技术培训、民办教育、学校、教师、培训机构、农村留守儿童、教育经费、科技活动、专利、专业技术人员、测绘地理信息、测绘资料、地震监测、产品质量监督和出入境货物检验检疫。

优选的,所述文化体育和卫生单元包括文公共图书馆、艺术表演团体、戏曲剧团、艺术表演场馆、文物业、广播电视事业、运动员、运动项目、竞技、冠军、世界纪录、体育运动、卫生机构、卫生人员和疾病;所述社会管理单元、社会服务单元和社会保障单元包括妇联、工会、律师、公证和调解、调解民间纠纷、刑事案件、治安案件、交通事故、火灾事故、起诉案件、申诉案件、青少年犯罪、社会工作师、助理社会工作师、社会救助、收养、优抚安置、福利彩票、社会捐赠、结婚登记、离婚、殡葬服务、社会保障、低保、养老保险、退休、失业保险、工伤保险、残疾人和残联组织。

与现有技术相比,本发明的有益效果是:

(1)本发明基于原始的宏观数据库,通过二次挖掘宏观数据指标,创造了宏观指标的网络舆情数值数据,为学者研究丰富了数据指标与内容,增加新的学术研究场景;

(2)本发明将宏观数据库与舆情数据结合起来,对宏观数据指标创建网络舆情数据库,不是着力于舆情监控,而是提炼历史舆情数据的有效信息,保留其学术研究价值;

(3)本发明通过对宏观数据库指标的梳理,重新建立一套指标框架,提炼出历史宏观指标的网络舆情统计数据,深度挖掘宏观指标的统计数据和舆情数据的相关关系为学者研究,便于为科学决策提供数据帮助。

附图说明

图1为本发明的宏观数据指标模块的结构框图;

图2为本发明的舆情数据指标模块的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-图2,本发明提供一种技术方案:宏观经济指标舆情数据库,包括宏观数据指标模块和舆情数据指标模块;

所述宏观数据指标模块包括国民经济核算单元、人口单元、就业人员和职工工资单元、固定资产投资单元、对外经济贸易单元、能源单元、财政单元、价格指数单元、人民生活单元、城市概况单元、资源与环境单元、农业单元、工业单元、建筑业单元、运输和邮电单元、国内贸易单元、金融单元、教育和科技单元、文化体育和卫生单元、社会管理单元、社会服务单元和社会保障单元;

所述舆情数据指标模块包括标题出现关键词的新闻总数单元、内容出现关键词的新闻总数单元、正面舆情新闻数单元、中性舆情新闻数单元、负面舆情新闻数单元、发帖数量单元、参与发帖人数单元、阅读次数单元、评论次数单元、转发次数单元、分享次数单元、收藏次数单元、负面关联词语单元、正面关联词语单元、中性关联词语单元、关联词语词频单元。

本实施例中,优选的,所述国民经济核算单元包括第一产业、农林牧渔业、第二产业、工业增加值、建筑业、第三产业、交通运输业、邮政业、批发业、住宿业、餐饮业、金融业、房地产业、仓储业、居民消费水平、农村居民消费水平、城镇消费水平;所述人口单元包括全国总人口、男性人口、女性人口、城镇、乡村、出生率、死亡率、自然增长率、流动、普查、抽样调查;所述就业人员和职工工资单元包括就业人员数、职工工资、工资总额、城镇平均工资、农村失业人数、国有单位失业率、私营企业劳动报酬、港澳台商投资单位工资指数、外商投资单位平均工资指数、个体户平均货币工资指数、农-林-牧-渔业平均实际工资指数、采掘业、制造业、交通运输、仓储和邮政业、批发零售贸易和餐饮业、批发和零售业、住宿和餐饮业、租赁和商务服务业、居民服务和其他服务业、社会服务业、城镇投资者人数、乡村投资者人数。

本实施例中,优选的,所述固定资产投资单元包括全社会固定资产投资的固定资产投资总额、民间固定资产投资的固定资产建设总规模、城镇固定资产投资的住宅投资、第一产业固定资产投资、第二产业固定资产投资、第三产业固定资产投资、房地产开发企业和销售面积;所述对外经济贸易单元包括进出口贸易和对外经济合作,所述进出口贸易包括进出口总额、出口总额、进口总额、进出口差额、出口货物、进口货物、货物进出口和外商投资企业货物进出口总额。

本实施例中,优选的,所述能源单元包括能源生产、能源消费、石油的可供量、煤炭的生产量、电力、能源加工转换效率,所述能源生产包括生产总量、原煤比重、原油比重、天然气比重、水电比重、核电比重和风电比重,所述电力包括进口量、出口量、消费量、平衡差额、能源生产弹性系数和能源消费弹性系数;所述能源加工转换效率包括发电及电站供热转换效率、炼焦转换效率和炼油转换效率。

本实施例中,优选的,所述财政单元包括国家财政收入、国家财政支出和国家债务,所述国家财政收入包括财政收入占比、税收和非税收收入,所述税收包括增值税、营业税、外贸企业出口退税、资源税、城市维护建设税、企业所得税、个人所得税、城镇土地使用税、契税、烟叶税、耕地占用税、证券交易印花税、房产税、印花税、土地增值税和车船税,所述非税收收入包括专项收入、行政事业性收费、罚没收入、国有资本经营收入、国有资源有偿使用收入、捐赠收入和政府住房基金收入,所述国家财政支出包括财政支出占比、一般公共服务支出、国内外债务付息支出、外交支出、对外援助支出、国防支出、公共安全支出、武装警察支出、教育支出、科学技术支出、文化体育与传媒支出、社会保障和就业支出、医疗卫生支出、环境保护支出、城乡社区事务支出、农林水事务支出、交通运输支出、车辆购置税支出、资源勘探电力信息事务支出、工业-商业-金融事务支出、商业服务业事务支出、金融监管支出、援助其他地区支出、地震灾后恢复重建支出、国土气象事务支出、住房保障支出、粮油物资储备管理事务支出、灾害防治及应急管理支出、国债付息支出和债务发行费用支出,所述国家债务包括国内债务、国外债务、外债余额、外国政府贷款、国际金融组织贷款、国际商业贷款、贸易信贷、长期债务余额、短期债务余额、偿债率、负债率、债务率、政府性基金收入决算、政府性基金支出预算、股利、股息收入和国有资本经营收入决算。

本实施例中,优选的,所述价格指数单元包括居民消费价格指数、商品零售价格指数、工业品出厂价格指数、固定资产投资价格指数、农业生产资料价格指数、农产品生产价格指数、进出口商品价格指数和建筑安装工程价格指数;所述人民生活单元包括人民币储蓄存款、人均国内旅游花费、五险一金、人均收入、人均支出、人均消费和居民人均可支配收入。

本实施例中,优选的,所述城市概况单元包括城市年底人口数、地区生产总值、用电量、工业总产值、客运量、货运量、国内贸易、在校学生数、城乡居民储蓄存款、学校、医院、卫生院、执业医师、城市建设、城市集中供热、城市燃气、城市公共交通、城市市政设施、城市设施水平、城市环境卫生、城市供水和城市绿化和园林;所述资源与环境单元包括资源储量、工业废水排放、生活污水排放、工业废气排放量、二氧化硫排放量、烟尘排放量、工业粉尘排放量、废气处理状况、固体废物、危险废物处理、城市生活垃圾清运和处理、生态环境和自然灾害及防治;所述农业单元包括农村机械化程度、灌溉面积、化肥施用量、农村用电量、农作物总播种面积、农产品、畜牧业、水产品、林产品、农村水电建设、农村发电、灌溉水库、除涝治水治碱、受灾和农场。

本实施例中,优选的,所述工业单元包括规模以上工业企业、工业总产值、资产负债、资产总计、流动资产、固定资产、资产净值、流动负债、长期负债、所有者权益、主营业务收入、主营业务成本、主营业务税金及附加、利润总额和工业产品产量;所述建筑业单元包括建筑业总产值、房屋建筑、土木工程建筑、建筑安装业、建筑装饰业、劳务分包建筑业、勘察设计机构、工程招标代理机构和建筑业技术装备;所述运输和邮电单元包括铁路运输业、道路运输业、城市公共交通业、水上运输业、航空运输业、管道运输业、装卸搬运和其他运输服务业、运输线路长度、运输线路质量、客运量、货运量、旅客周转量、货物周转量、公路运输装备、水路运输装备及运行、民航运输装备基本运行、邮电业务和电信业务量。

本实施例中,优选的,所述国内贸易单元包括商品购进额、商品销售额、零售市场、乘用车销售、二手乘用车销售和旅游业;所述金融单元包括存款、贷款、有价证券、投资、股权、黄金、外汇、货币、黄金外汇储备、流通现金、活期存款、定期存款、债券、社会融资、股票融资、直接融资、上市公司、股票发行、股票成交、上证综合指数、深证综合指数、投资者开户、市盈率、债券发行、国债发行、企业债券发行、投资基金、期货、新三板股票、上交所、深交所、股票筹资和保险业;所述教育和科技单元包括九年义务教育、初级教育、高等教育、毕业生、在校学生、研究生教育、资格证书、岗位证书、职业技术培训、民办教育、学校、教师、培训机构、农村留守儿童、教育经费、科技活动、专利、专业技术人员、测绘地理信息、测绘资料、地震监测、产品质量监督和出入境货物检验检疫。

本实施例中,优选的,所述文化体育和卫生单元包括文公共图书馆、艺术表演团体、戏曲剧团、艺术表演场馆、文物业、广播电视事业、运动员、运动项目、竞技、冠军、世界纪录、体育运动、卫生机构、卫生人员和疾病;所述社会管理单元、社会服务单元和社会保障单元包括妇联、工会、律师、公证和调解、调解民间纠纷、刑事案件、治安案件、交通事故、火灾事故、起诉案件、申诉案件、青少年犯罪、社会工作师、助理社会工作师、社会救助、收养、优抚安置、福利彩票、社会捐赠、结婚登记、离婚、殡葬服务、社会保障、低保、养老保险、退休、失业保险、工伤保险、残疾人和残联组织。

本发明的优点:本发明基于原始的宏观数据库,通过二次挖掘宏观数据指标,创造了宏观指标的网络舆情数值数据,为学者研究丰富了数据指标与内容,增加新的学术研究场景;将宏观数据库与舆情数据结合起来,对宏观数据指标创建网络舆情数据库,不是着力于舆情监控,而是提炼历史舆情数据的有效信息,保留其学术研究价值;通过对宏观数据库指标的梳理,重新建立一套指标框架,提炼出历史宏观指标的网络舆情统计数据,深度挖掘宏观指标的统计数据和舆情数据的相关关系为学者研究,便于为科学决策提供数据帮助。

本发明的原理:宏观数据库的指标有:国民经济核算,人口,就业人员和职工工资,固定资产投资,对外经济贸易,能源,财政,价格指数,人民生活,城市概况,资源与环境,农业,工业,建筑业,运输和邮电,国内贸易——批发、零售、住宿、餐饮和旅游,金融,教育和科技,文化体育和卫生,社会管理、社会服务、社会保障及其他共计20个大类,所有指标共计19997个,其中这些指标有名称重复,专业术语不常被提及讨论等问题,因此,本方案以20个大类为基准框架,对每个类别下的指标进行人为清洗,清洗原则为该词语在某舆情网站可被搜索到至少1条文本,则该词语可被选为宏观舆情指标。

宏观舆情数据库的指标可以根据宏观指标框架进行整理,舆情本身的统计指标需要根据舆情舆情文本来源的自身特征进行设计。目前对大型网络社交平台的研究可以发现,网络社交平台的基本功能都离不开原创,转发,点赞,评论等功能。因此,根据社交平台的基础功能,将舆情指标设计为:原创新闻次数(正面),原创新闻次数(负面),原创新闻次数(中性),转发次数,参与人数,评论人数,正面热词,正面热词词频,负面热词,负面热词词频,中性热词,中性热词词频。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术分类

06120115931699