掌桥专利:专业的专利平台
掌桥专利
首页

数据分析处理方法及装置

文献发布时间:2023-06-19 11:02:01


数据分析处理方法及装置

技术领域

本发明涉及一种数据分析处理方法及装置,具体的说,是涉及将数据信息显示于三维地理信息模型上的数据分析处理方法及装置。

背景技术

目前,在云计算、物联网、移动互联网以及新媒体社交工具软件(微信、微博等)的推动下,数据信息量发生了爆炸式的增长,呈显著指数级的升高。对于出现的海量的数据如何去分析,并将分析的结果以直观的、可视化的形式进行呈现,使用户能够从海量的数据信息中直观、快速地获取到有用数据,是当前计算机IT界和学术界等研究的热点问题。为此,如何利用数据分析工具和数据可视化工具对数据进行数据分析与可视化展示成为当前数据展示领域的热点话题。

数据可视化起源于1960年计算机图形学,那时候人们使用计算机创建图形图表,可视化提取出来的数据,可以将数据的各个属性和变量呈现出来。数据可视化技术可以将所有数据的特性通过图的方式呈现出来,数据的图形化呈现可以帮助我们更有效地了解和深入理解数据,传统的柱形图、折线图、饼状图、条形图、面积图和散点图是一些比较原始的统计图表,仅仅能呈现一些简单的信息,对于复杂的或是较大规模的非结构化数据,则不能完美呈现出来,尤其是现今时代,传统的数据表现形式已经不能满足向广大用户展示数据信息,并使用户快速了解、掌握信息的需要。

通过借助计算机图形学、图像处理技术则可以将复杂的或较大规模的非结构化数据以生动形象的图表、图形、地图、仪表、标签云图等方式对数据信息进行高效、直观、动态地演示且多为立体地呈现给用户,并可实时了解数据的变化情况。

但是,对于海量数据,进一步提高数据对于用户的展示、理解效率,仍然是需要当前计算机IT界和学术界等进一步探索的热点问题。

发明内容

本发明有鉴于上述问题提出一种新的数据分析处理方法,包括:对数据信息进行识别,清除数据信息中的冗余数据的预处理步骤;提取数据信息中包括空间字段在内的关键字段,并根据所提取的关键字段对数据信息进行整理的提取步骤;对于数据信息根据规定表现形式展示规定字段的样式生成步骤;根据空间字段将规定表现形式的数据信息定位于空间信息模型的空间定位步骤。

根据本发明,能够根据空间区域的地理特性向用户展示数据。使得用户能够更直观地了解、掌握数据的空间区域分布特性,提高所展示数据被用户接受的效率。

另外,本发明优选在所述提取步骤中还提取数据信息中的时间字段,并根据时间字段对数据信息进行整理。

通过对数据信息中时间字段进行提取和整理,能够结合数据的时间特性和空间区域分布特性,向用户展示数据,进一步提高所展示数据被用户接受的效率。

而且,本发明优选在所述提取步骤中,根据时间字段和空间字段,生成将时间信息和空间信息规格化后的统一时空数据。

由此,可快速、高效、连续地结合数据的时间特性和空间区域分布特性向用户进行展示。

另外,本发明还优选在所述空间定位步骤中,根据用户选择的与时间字段相关的时间信息,从所述统一时空数据中抽取与用户选择的时间信息相应的时间字段的数据信息,并将该数据信息定位于空间信息模型空间。

由此,根据数据时间特性,可由用户任意地对时间信息进行选择,极大地方便了用户掌握空间区域分布上的数据信息在时间特性上的变化情况。

并且,本发明还优选所述规定的表现形式包括:二维柱状图、二维饼状图、二维折线图、二维散点图、三维柱状图、三维堆积图、三维热力图、三维散点图、tif影像、矢量图、模型图中的任一种以上。

由此,可根据各种数据信息本身的特性,以最优化的方式向用户进行展示,提高用户了解、掌握数据信息时间变化和空间分布变化的效率。

此外,本发明还提供一种数据分析处理装置,其包括:预处理单元,其接收数据信息,清除数据信息中的冗余数据;提取单元,其提取数据信息中包括空间字段在内的关键字段,并根据所提取的关键字段对数据信息进行整理;数据库,其存储经所述分析部处理后的数据信息;和图像处理单元,其对于数据信息根据规定表现形式展示规定字段,并根据空间字段将规定表现形式的数据信息定位于空间信息模型。

根据本发明,能够利用数据分析处理装置,根据空间区域的地理特性向用户展示数据。使得用户能够更直观地了解、掌握数据的空间区域分布特性,提高所展示数据被用户接受的效率。

另外,本发明还优选,在所述提取单元中,还提取数据信息中的时间字段,并根据时间字段对数据信息进行整理。

通过对数据信息中时间字段进行提取和整理,能够结合数据的时间特性和空间区域分布特性,向用户展示数据,进一步提高所展示数据被用户接受的效率。

本发明还优选在所述提取单元中,根据时间字段和空间字段,生成将时间信息和空间信息规格化后的统一时空数据。

由此,可快速、高效、连续地结合数据的时间特性和空间区域分布特性向用户进行展示。

另外,本发明还优选还具有接收用户选择的与时间字段相关的时间信息的输入部,在所述图像处理单元中,根据用户选择的时间信息,从所述统一时空数据中抽取与用户选择的时间信息相应的时间字段的数据信息,并将该数据信息定位于空间信息模型空间。

由此,根据数据时间特性,可由用户任意地对时间信息进行选择,极大地方便了用户掌握空间区域分布上的数据信息在时间特性上的变化情况。

附图说明

图1是本发明一个实施方式的数据分析处理装置的框图。

图2是本发明一个实施方式的处理流程图。

图3是生成用于展示数据信息的样式的示意图。

图4是表示本发明一个实施方式中将二维柱状图定位于三维地理信息模型的图。

具体实施方式

下面,结合附图对本发明的优选实施方式进行详细说明。

图1是本发明一个实施方式的数据分析处理装置的框图。

如图1所示,作为本发明的一个优选实施方式的数据分析处理装置1中包括:数据处理部100、数据库200和图像处理部300。数据处理部100从外部或本地存储器读取原始数据信息,并对读取信息进行处理,保存到数据库200中,并由图像处理部300从数据库200读取经过处理后的数据,结合外部发送来的三维地理数据模型生成向用户进行展示的图像。

在本实施方式中,数据处理部100包括预处理单元110和提取单元120。预处理单元110对数据信息进行预处理,识别数据信息并清除其中的冗余数据。通过清除冗余数据能够有效减小数据信息体积,并容易在后述的处理中使数据信息规格化。提取单元120对预处理单元110处理后的数据信息提取其中的关键字段,并根据该关键字段将数据信息存储到数据库200中。在本实施方式中,关键字段包括空间字段和时间字段。也可以根据需要只提取空间字段或者还提取其他有用的关键字段。

图像处理部300包括展示信息生成单元310和定位单元320。展示信息生成单元310从数据库200中读取数据并生成规定展示形式的数据信息,其中,二维样式生成模块311根据从数据库200读取的数据信息,生成用于进行以二维维表现形式进行展示的样式,而三维样式生成模块312根据从数据库200读取的数据信息,生成用于以三维表现形式进行展示的样式。

定位单元320,根据空间字段的信息,将由展示信息生成单元310生成用于展示的数据信息的样式,定位于空间信息模型,从而可从空间信息模型上,直观的展示出数据信息的内容。

下面详细说明数据分析处理装置1的处理的过程。图2是本发明一个实施方式的处理流程图。

如图2所示,在步骤S1中,数据分析处理装置1的预处理单元110从外部或本地存储器读取原始的数据信息。在本步骤中,可以通过有线或无线的网络远程的服务器或工作组节点,也可以从本地硬盘或数据库,还可以从网络云服务读取原始的数据信息。

接着,在步骤S2中,预处理单元110对读取的原始数据信息进行清洗,识别并清除数据信息中的冗余数据。可以采用任意的方式来识别冗余数据。例如可以根据预先设定的字段,识别数据信息中的有用数据,并去除其它冗余数据。由此可以有效地对原始数据信息进行清洗,减小数据处理量,节省本地数据库200的存储空间。

在步骤S3中,提取单元120从数据信息中提取空间字段和时间字段,并根据所提取的空间字段和时间字段,将数据信息与其空间字段的信息和时间字段的信息相关联地对数据信息进行整理,并存储于数据库200。在本实施方式中,由于同时提取了空间字段和时间字段,因此优选对空间字段、时间字段以及数据信息本身进行规格化,从而生成统一时空数据。所谓统一时空数据,即将数据信息同时关联时间字段和空间字段进行存储,从而可根据时间字段和空间字段高速地对数据信息进行读取访问。

接着,在步骤S4中,图像处理部300的展示信息生成单元310从数据库读取存储在数据库200中的数据信息,以规定的表现形式生成用于展示该数据信息的样式。图3是图像处理部300表示生成用于展示数据信息的样式的示意图。如图3所示,在展示信息生成单元310中,基于选定的空间字段和时间字段的信息对存储于数据库200中的数据信息进行处理,二维样式生成模块311根据数据信息的格式生成二维柱状图、二维饼状图、二维折线图、二维散点图;另一方面,三维样式生产模块321根据数据信息的格式生成三维柱状图、三维堆积图、三维热力图、三维散点图等。在展示信息生成单元310中还可以利用其他数据信息的处理模块,根据数据信息的格式生成矢量图、模型图等,也可以直接调取图像格式的数据信息如tif图像等,对图像格式的数据信息进行适当的缩放处理。

在步骤S5中,图像处理部300的定位单元320根据数据信息的空间字段,将由展示信息生成单元310的该数据信息的样式定位于空间信息模型中。

图4是将由展示信息生成单元310生成的二维柱状图定位于作为空间信息模型的三维地理信息模型的图。如图4所示,通过将二维柱状图定位于三维地理信息模型,可以直观的使用户了解在作为空间字段的地理信息上,数据的分布状况,从而能够容易地掌握各项数据在地理分布上的特性。

以往,对于与地理信息相关的信息展示多采用表格方式,虽然能够使用户得知各地数据状况,但对于数据地理分布特性并不能够做到直观呈现。然而,基于本实施方式,通过将数据信息定位于三维地理信息模型,对于各个产业来说,都能够做到直接呈现地理分布状况信息,对于企业乃至国家策略制定、成果展示具有重要的意义。

另外,在本实施方式中,除了在提取单元120提取空间字段,以将用于展示数据的样式定位于作为空间信息模型的三维地理信息模型,还提取时间字段。通过提取数据信息中的时间字段,基于时间字段对数据信息进行整理并存储,可由用户通过输入部输入时间信息,从而能够将数据的时间特性和空间特性相结合地呈现给用户。还可以方便地实现数据信息在空间分布上的时间变化特性的展示,从而使随着时间轴变化的具有空间分布特性的庞大数据信息量,能够以一种简单容易理解的方式展示给用户,并且,这种动态展示方式,更容易被用户记忆,具有广阔的应用空间和重大的社会意义。

以上,对本发明的优选实施方式进行了详细说明,但以上说明并不构成对本发明范围的限定。本领域技术人员能够在本发明的基础上进行各种修改、改进和变更。这些修改、改进和变更均包含在本发明权利要求及其等同的范围内。

相关技术
  • 一种基于高校数据的数据分析处理方法及就业趋势数据的数据分析处理方法
  • 数据分析处理方法、装置、网络数据分析功能及介质
技术分类

06120112774350