掌桥专利:专业的专利平台
掌桥专利
首页

一种文物数字云展全网普及度分析系统

文献发布时间:2024-04-18 19:58:30


一种文物数字云展全网普及度分析系统

技术领域

本发明涉及普及度分析技术领域,特别涉及一种文物数字云展全网普及度分析系统。

背景技术

近年来,随着科技的发展,人们了解文物的途径不仅仅再局限于实地查看、新闻图片了解与相关人士讲述,也有数字云展作为展示平台将文物进行数字化,然后在线展示,方便人们查看的同时也有利于文物背后蕴含的文化进行无损、细致且真实的传播,但是由于网络数字平台繁多,受众同样有很大变化,存在被教育使用,同样也存在被用于广告宣传,也就是文物是否被大众所知,还存在一定的未知,所以,为了了解大众对文物的了解情况,需要进行普及分析。

因此,本发明提供一种文物数字云展全网普及度分析系统。

发明内容

本发明提供一种文物数字云展全网普及度分析系统,用以通过获取网络社交平台提取与文物数字云展相关有效数据,再通过词汇搜索引擎对文物数字云展的关键词集进行扩展,同时扩展对应有效数据,根据获取的有效数据于关键词集的并处理结果于相关处理结果,得出文物数字云展相关领域的最大普及度与最小普及度,确定全网中文物数字云展的普及度,实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

本发明提供一种文物数字云展全网普及度分析系统,包括:

数据筛选模块:基于网络社交平台提取与文物数字云展相关的所有数据,并按照有效浏览筛查规则,对所有数据进行数据筛选获取有效数据;

相关词确定模块:基于词汇搜索引擎从资源数据库中搜索与文物数字云展相关的词汇来扩展关键词集,并对所述关键词集进行领域拆解,确定相关领域的当下词集;

普及度分析模块:对所述有效数据以及相关领域的当下词集进行并处理以及相关处理,并基于并处理结果获取最大普及度以及基于相关处理结果获取最小普及度;

基于每个相关领域的最大普及度以及最小普及度,确定基于全网的普及度。

本发明提供一种文物数字云展全网普及度分析系统,其特征在于,数据筛选模块,包括:

数据获取单元:以文物数字云展以及对应同义词为第一关键词集基于社交网络平台进行初级相关数据获取;

预处理单元:对所有初级相关数据进行预处理得到第一相关数据;

有效数据筛查单元:根据第一相关数据的数据种类以及每种数据类型的有效筛查条件,对相应数据种类的第一相关数据进行有效筛选,得出对应数据种类的有效数据。

本发明提供一种文物数字云展全网普及度分析系统,有效数据筛查单元,包括:

出现频次块:统计第一关键词集中每个第一关键词在所有初级相关数据中的出现频次,判断是否大于或等于对应第一关键词的出现阈值;

判断块:若对应第一关键词的出现频次大于或等于出现阈值,则对相应第一关键词在所有初级相关数据中所处位置的重要性进行判断,得出对应第一关键词在不同数据类型下的初级有效性,同时,对相应第一关键词进行标记;

文章筛选块:从所有初级相关数据中筛选不存在任何标记的所有第一文章,并获取满足过滤条件且属于不同数据类型的第二文章,得到同个数据类型下的文章有效性,其中,所述过滤条件与真实浏览数量相关;

条件确定块:根据同个数据类型下涉及到的所有第一关键词的初级有效性以及文章有效性,确定相应数据类型的有效筛查条件。

本发明提供一种文物数字云展全网普及度分析系统,相关词确定模块,包括:

相关词汇匹配单元:控制词汇搜索引擎按照文物和/或数字云展在资源数据库中搜索相关词汇,其中,相关词汇包括:上位词、下位词与同义词;

分类单元:根据相关词汇扩展第一关键词集得出第二关键词集,对第二关键词集进行领域分类,得出相关领域的初始词集;

数据获取单元:根据相关领域的初始词集从网络社交平台中获取相关领域的第二相关数据;

量化处理单元:对所有种类的有效数据进行量化处理,得出每种数据类型的数据量化值,同时,对所有第二相关数据进行处理,得到相关领域下第二相关数据的扩展量化值;

判断单元:根据与相关领域匹配的数据类型所对应有效数据的数据量化值与第二相关数据的扩展量化值,判断相关领域下的初始词集是否扩展成功;

若扩展成功,则将相关领域的初始词集视为当下词集;

若扩展未成功,则将相关领域的初始词集中出现权重靠前的前N1个词汇构建得到当下词集。

本发明提供一种文物数字云展全网普及度分析系统,所述量化处理单元,包括:

指标确定块:确定每种数据类型基于所述网络社交平台的通道来源,并确定每个通道来源的初始量化指标;

指标搜索块:根据每个通道来源的初始量化指标搜索剩余通道来源的匹配量化指标;

矩阵构建块:构建得到每个通道来源的指标向量,并根据所述指标向量中每个指标元素的数据配置情况,构建得到相应数据类型的数据矩阵;

矩阵比较块:将同种数据类型下的数据矩阵与所有有效数据构建得到的数据矩阵进行比较,得到差矩阵;

期望计算块:对所述差矩阵进行期望计算,获取得到期望值;

当所述期望值达到期望要求时,将对应通道来源的指标向量保留;

方式匹配块:基于所有保留向量中的所有量化指标,从指标-量化映射表中匹配得到量化方式,对相应数据类型下的有效数据进行量化处理。

本发明提供一种文物数字云展全网普及度分析系统,所述判断单元,包括:

其中,g1

当P1大于0时,判定扩展成功;

否则,判定扩展失败。

本发明提供一种文物数字云展全网普及度分析系统,普及度分析模块,包括:

走向确定单元:将同个相关领域下的当下词集及有效数据进行并处理,获取得到若干第二关键词,分别统计每个第二关键词在不同历史时间段的浏览数量,并构建得到历史浏览走向;

最大计算单元:根据每个第二关键词的历史浏览走向中的最大浏览值以及最大浏览值的持续时长,得到相关领域下的最大普及度;

最小计算单元:将同个相关领域下的当下词集及有效数据进行相关处理,获取得到若干第三关键词,并根据每个第三关键词的历史浏览走向中大于预设浏览值的浏览时间段以及浏览总量,得到相关领域下的最小普及度;

综合计算单元:基于每个相关领域的最大普及度以及最小普及度,确定基于全网的普及度。

本发明提供一种文物数字云展全网普及度分析系统,所述综合计算单元,包括:

其中,W

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例中一种文物数字云展全网普及度分析系统的结构图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

实施例1:

本发明实施例提供一种文物数字云展全网普及度分析系统,如图1所示,包括:

数据筛选模块:基于网络社交平台提取与文物数字云展相关的所有数据,并按照有效浏览筛查规则,对所有数据进行数据筛选获取有效数据;

相关词确定模块:基于词汇搜索引擎从资源数据库中搜索与文物数字云展相关的词汇来扩展关键词集,并对所述关键词集进行领域拆解,确定相关领域的当下词集;

普及度分析模块:对所述有效数据以及相关领域的当下词集进行并处理以及相关处理,并基于并处理结果获取最大普及度以及基于相关处理结果获取最小普及度;

基于每个相关领域的最大普及度以及最小普及度,确定基于全网的普及度。

该实施例中,网络社交平台包括Facebook、Twitter、Instagram、YouTube、Wechet等各种不同的平台。

该实施例中,文物数字云展是利用数字技术和虚拟展示平台来展示和传播文化遗产的创新方式。

该实施例中,有效浏览筛查规则根据不同种类的第一关键词设定对应初级相关数据的出现频次、初级有效性与文章有效性。

该实施例中,词汇搜索引擎包括在线词典、同义词和反义词搜索引擎、翻译搜索引擎、语言学习应用与词汇学习工具。

该实施例中,扩展关键词集的过程是根据词汇搜索引擎搜索文物与数字云展的相关词汇,将相关词汇加入第一关键词集得出第二关键词集,对第二关键词集进行领域分类,再根据第二关键词集进行第二相关数据的采集,对第一相关数据的有效数据与第二相关数据的有效数据进行量化处理,根据量化处理结果对扩展结果进行判断。

该实施例中,有效数据是根据第一关键词的出现频次与出现阈值的关系进行初步筛选,再通过文章有效性与初级有效性设定对应数据类型的有效筛查条件,以此对初级相关数据进行筛选得来的。

该实施例中,领域拆解是将第二关键词集进行领域划分,比如文物所属领域为历史文化。

该实施例中,当下词集中含有的关键词是同一领域的相关词汇。

该实施例中,并处理是有效数据与相关领域进行合并、整理和分析的过程。

该实施例中,相关处理是有效数据与相关领域的当下词集进行关联和整合,建立有效数据与当下词集之间的联系,例如将有效数据中文物描述与当下词集的特定术语关联,或将文物图像与特定风格或时期相关联。

上述技术方案的工作原理及有益效果是:通过获取网络社交平台提取与文物数字云展相关有效数据,再通过词汇搜索引擎对文物数字云展的关键词集进行扩展,同时扩展对应有效数据,根据获取的有效数据于关键词集的并处理结果于相关处理结果,得出文物数字云展相关领域的最大普及度与最小普及度,确定全网中文物数字云展的普及度,实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

实施例2:

本发明实施例提供一种文物数字云展全网普及度分析系统,数据筛选模块,包括:

数据获取单元:以文物数字云展以及对应同义词为第一关键词集基于网络社交平台进行初级相关数据获取;

预处理单元:对所有初级相关数据进行预处理得到第一相关数据;

有效数据筛查单元:根据第一相关数据的数据种类以及每种数据类型的有效筛查条件,对相应数据种类的第一相关数据进行有效筛选,得出对应数据种类的第一有效数据。

该实施例中,初级相关数据包括数据对应文章的浏览量与发行时间、第一关键词集在搜索词条中所处位置与浏览时间分布、各个网络社交平台的搜索量。

该实施例中,预处理包括对初级相关数据进行文本清洗、分词、停用词去除与高频词去除。

该实施例中,第一关键词集是文物数字云展及其关键词的集合,比如数字文物云展。

该实施例中,第一相关数据是每个关键词进行检索之后对应的初级相关数据。

该实施例中,数据种类涉及自然语言文本、日志文件、电子书、新闻稿、评论和反馈、文档数据等种类。

该实施例中,有效筛查条件包括对第一关键词在对应初级相关数据的出现频次、初级有效性与文章有效性。

该实施例中,第一有效数据是符合有效筛查条件的第一相关数据。

上述技术方案的工作原理及有益效果是:通过对第一关键词集相关数据的获取,对获得的初级相关数据进行预处理之后,将根据数据种类不同而设定的不同的有效筛查条件对第一相关数据进行筛选,最终得出对应数据种类的有效数据,实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

实施例3:

本发明实施例提供一种文物数字云展全网普及度分析系统,有效数据筛查单元,包括:

出现频次块:统计第一关键词集中每个第一关键词在所有初级相关数据中的出现频次,判断是否大于或等于对应第一关键词的出现阈值;

判断块:若对应第一关键词的出现频次大于或等于出现阈值,则对相应第一关键词在所有初级相关数据中所处位置的重要性进行判断,得出对应第一关键词在不同数据类型下的初级有效性,同时,对相应第一关键词进行标记;

文章筛选块:从所有初级相关数据中筛选不存在任何标记的所有第一文章,并获取满足过滤条件且属于不同数据类型的第二文章,得到同个数据类型下的文章有效性,其中,所述过滤条件与真实浏览数量相关;

条件确定块:根据同个数据类型下涉及到的所有第一关键词的初级有效性以及文章有效性,确定相应数据类型的有效筛查条件。

该实施例中,出现频次是基于每个关键词对应的文章数据确定的。

该实施例中,出现阈值根据第一关键词对应文章的文章类型确定。

该实施例中,位置的重要性是关键词对应语句在整篇文章中所处位置,所处位置包括主语、宾语、表语与补足语等,重要性依次降低。

该实施例中,初级有效性是根据所有第一关键词对应语句在文章中所处位置的判断结果,第一关键词在同数据类型下的初级有效性=第一关键词在同数据类型下所有位置的重要性的平均值。

该实施例中,文章有效性是对获取的第一关键词的相关文章的有效程度的判断,比如1990年的灯外形文章到2020年时有效程度趋近于0,也就是真是浏览程度越高,对应的文章有效性越高。

上述技术方案的工作原理及有益效果是:根据第一关键词的出现频次与出现阈值的关系进行初步筛选,再通过文章有效性与初级有效性设定对应数据类型的有效筛查条件,实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

实施例4:

本发明实施例提供一种文物数字云展全网普及度分析系统,相关词确定模块,包括:

相关词汇匹配单元:控制词汇搜索引擎按照文物和/或数字云展在资源数据库中搜索相关词汇,其中,相关词汇包括:上位词、下位词与同义词;

分类单元:根据相关词汇扩展第一关键词集得出第二关键词集,对第二关键词集进行领域分类,得出相关领域的初始词集;

数据获取单元:根据相关领域的初始词集从网络社交平台中获取相关领域的第二相关数据;

量化处理单元:对所有种类的有效数据进行量化处理,得出每种数据类型的数据量化值,同时,对所有第二相关数据进行处理,得到相关领域下第二相关数据的扩展量化值;

判断单元:根据与相关领域匹配的数据类型所对应有效数据的数据量化值与第二相关数据的扩展量化值,判断相关领域下的初始词集是否扩展成功;

若扩展成功,则将相关领域的初始词集视为当下词集;

若扩展未成功,则将相关领域的初始词集中出现权重靠前的前N1个词汇构建得到当下词集。

该实施例中,词汇搜索引擎是对关键词的含义与定义进行拆析之后,匹配关键词对应的相关词汇,比如文物的上位词是文化遗产、历史物品、文化物品、考古遗物与历史遗产,下位词是古代文物、艺术品、文物收藏品与文物展品,同义词是古物与遗产物品。

该实施例中,文物和/或数字云展是指文物和数字云展各自的相关词汇以及文物与数字云展同时存在的相关词汇,比如文物数字云展的上位词为文物数字化,下位词为数字文化遗产,同义词为数字文物展示。

该实施例中,资源数据库是相关词汇以及相关词汇不同组合的数据库,是预先确定好的。

该实施例中,初始词集是对第二关键词集的不同领域划分之后的词集,其中相关领域包括文化遗产管理、文化遗产管理、博物馆学、信息科学、计算机科学、艺术史、文化人类学、数字人文学、教育与文化旅游。

该实施例中,第二相关数据是第二关键词集在网络社交平台收集的处于对应领域下的数据。

该实施例中,量化处理是根据数据类型的通道来源确定初始量化指标,并搜索匹配量化指标,根据获取的指标构建每个通道的指标向量,得出对应数据类型的数据矩阵。

该实施例中,基于词汇1与词汇2构建得到第一关键词集,此时,存在词汇3(相关词汇),就需要得到与词汇3相关的扩展词对第一关键词集扩充,得到第二关键词集。

上述技术方案的工作原理及有益效果是:根据词汇搜索引擎搜索文物与数字云展的相关词汇,将相关词汇加入第一关键词集得出第二关键词集,对第二关键词集进行领域分类,再根据第二关键词集进行第二相关数据的采集,对第一相关数据的有效数据与第二相关数据的有效数据进行量化处理,根据量化处理结果判断第二关键词集是否成功建立,实现对文物数字云台及其可能涉及领域的所有关键词以及数据的获取与分析,对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

实施例5:

本发明实施例提供一种文物数字云展全网普及度分析系统,所述量化处理单元,包括:

指标确定块:确定每种数据类型基于所述网络社交平台的通道来源,并确定每个通道来源的初始量化指标;

指标搜索块:根据每个通道来源的初始量化指标搜索剩余通道来源的匹配量化指标;

矩阵构建块:构建得到每个通道来源的指标向量,并根据所述指标向量中每个指标元素的数据配置情况,构建得到相应数据类型的数据矩阵;

矩阵比较块:将同种数据类型下的数据矩阵与所有有效数据构建得到的数据矩阵进行比较,得到差矩阵;

期望计算块:对所述差矩阵进行期望计算,获取得到期望值;

当所述期望值达到期望要求时,将对应通道来源的指标向量保留;

方式匹配块:基于所有保留向量中的所有量化指标,从指标-量化映射表中匹配得到量化方式,对相应数据类型下的有效数据进行量化处理。

该实施例中,网络社交平台的通道来源包括搜索引擎、直接访问、推荐链接、社交媒体分享、移动应用程序、电子邮件邀请、广告和推广、搜索和浏览功能与社交联接,也就是不同数据类型的来源是不一样的,比如数据类型1的来源为:来源1、来源2,数据类型的来源为:来源a1、来源a2。

该实施例中,初始量化指标是每个通道本身就赋予的,是针对来源的词汇效果指标、词汇存储槽位指标、词汇类型指标、用户参与指标等。

该实施例中,数据配置情况是收集具体数据想的情况,包括系统运行、用户活动等相关数据。

该实施例中,指标向量=[匹配量化指标1匹配量化指标2...];

其中,当数据矩阵的某个位置不存在数据时,用0代替,数据配置情况即为与对应元素相关的各种词汇数据。

该实施例中,同种数据类型下的数据矩阵与有效数据构建的数据矩阵的行列数时相等的,两个矩阵在相减之后得到差矩阵。

该实施例中,

其中,Q11表示期望值;H2表示差矩阵的列数;H1表示差矩阵的行;H10

该实施例中,期望要求的取值为小于0.6。

该实施例中,指标-量化映射表是将系统指标与试剂量化数据之间建立关联的工具,包含各种指标以及与每个指标相关的量化方法、数据来源、计算公式、时间范围等信息,且量化方式的目的是为了对不同指标下的数据进行数值标准化处理。

上述技术方案的工作原理及有益效果是:根据每种数据类型的通道来源确定对应初始量化指标与匹配量化指标,生成指标向量与数据矩阵,对数据矩阵进行运算得出保留指标向量,根据保留的指标向量对所有有效数据的量化方式,以此实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

实施例6:

本发明实施例提供一种文物数字云展全网普及度分析系统,所述判断单元,包括:

其中,g1

当P1大于0时,判定扩展成功;

否则,判定扩展失败。

上述技术方案的工作原理及有益效果是:根据相关领域的有效数据的数据量化值与第二相关数据的扩展量化值,确定最终判断结果,实现对有效数据的量化,根据量化结果判断关键词集扩展是否成功,以此实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

实施例7:

本发明实施例提供一种文物数字云展全网普及度分析系统,普及度分析模块,包括:

走向确定单元:将同个相关领域下的当下词集及有效数据进行并处理,获取得到若干第二关键词,分别统计每个第二关键词在不同历史时间段的浏览数量,并构建得到历史浏览走向;

最大计算单元:根据每个第二关键词的历史浏览走向中的最大浏览值以及最大浏览值的持续时长,得到相关领域下的最大普及度;

最小计算单元:将同个相关领域下的当下词集及有效数据进行相关处理,获取得到若干第三关键词,并根据每个第三关键词的历史浏览走向中大于预设浏览值的浏览时间段以及浏览总量,得到相关领域下的最小普及度;

综合计算单元:基于每个相关领域的最大普及度以及最小普及度,确定基于全网的普及度。

该实施例中,历史浏览走向是在对应文字信息的有效期限内不同网络社交平台的浏览数量构成的浏览曲线,根据曲线可以分析得到是被更多人看到,还是被更少人看到。

该实施例中,最大普及度是基于最大浏览量与最大浏览量的持续时长计算得到的,P

该实施例中,最小普及度是基于历史浏览走向中大于预设浏览值的浏览时间段以及浏览总量计算得到的,

该实施例中,确定全网普及度是将相关领域的最大普及度与最小普及度进行函数相关运算之后得出的。

上述技术方案的工作原理及有益效果是:根据当下词集与有效数据的并处理结果得出第二关键词,确定历史浏览走向,根据历史浏览走向确定最大普及度,根据当下词集与有效数据的相关处理结果得出第三关键词,确定相关领域的最小普及度,得出全网普及度,以此实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

实施例8:

本发明实施例提供根据权利要求7所述的一种文物数字云展全网普及度分析系统,所述综合计算单元,包括:

其中,W

上述技术方案的工作原理及有益效果是:根据相关领域对应的普及权重与相关普及度确定文物数字云盘的全网普及度,以此实现对所有使用网络社交平台的人们对文物数字云展了解情况的分析。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

相关技术
  • 一种基于增强现实技术的文物云识别与交互系统及方法
  • 一种用于展前现场快速评估的馆藏铜质文物出展风险评估方法
  • 一种文物保护知识普及宣传装置
技术分类

06120116505017