掌桥专利:专业的专利平台
掌桥专利
首页

暗信息的构成方法以及基于暗信息的数据压缩方法

文献发布时间:2023-06-19 09:52:39


暗信息的构成方法以及基于暗信息的数据压缩方法

技术领域

本发明涉及信息、电子和粒子物理技术领域,具体是一种暗信息的构成方法以及基于暗信息的数据压缩方法。

背景技术

1948年C.E.Shannon发表了他的划时代文章,即《通信的数学理论》,宣告了一门崭新的学科──信息论的诞生。在Shannon的信息论中,给出了信息模型的定义,建立了信源和信道编码定理,同时也给出了信道上进行无差错传输的最大传输速率,这一理论也被称为是香农极限定理。Shannon的信息论主要基于信息传输,因此常被称为“狭义”信息论或经典信息论。

七十多年后的今天,通信、计算机和半导体技术的发展已将人类社会推进到一个崭新的信息时代。随着大数据、人工智能等产业的快速崛起,需要处理、存储和传输的数据量越来越大。目前在数字处理领域,主要采用二进制的方式进行数据的处理、存储和传输。对于二进制信息,它的数值表示范围是既定的,例如8位二进制信息,它的数值表示范围0-255。因此在大数据时代二进制的表示需要非常多的信息位,这必然会提高数据处理、存储和传输的时间成本和物理成本。因此,如何提高数据表示的信息量,实现有限信息位的大数表示,是具有重要意义的一项工作。同时,人们不仅对数据量的需求越来越大,对数据通信的效率要求也越来越高,而根据经典信息中香农极限定理,在信道中传输速率是受到限制的,如何打破香农极限,进一步提高信息传输的速率也已成为一个需要解决的问题。

科技的飞速发展也催生了很多信息论的分支,其中量子信息可说是最为深刻和最具发展前景的新方向。基于量子信息论,人们提出了量子计算机(quantum computer)。量子计算机是一种全新的基于量子理论的计算机,遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。量子计算机应用的是量子比特,可以同时处在多个状态,而不像传统计算机那样只能处于0或1的二进制状态。量子比特序列不但可以处于各种正交态的叠加态上,而且还可以处于纠缠态上。这些特殊的量子态,不仅提供了量子并行计算的可能,而且还将带来许多奇妙的性质。但是,迄今为止,世界上还没有真正意义上的量子计算机。虽然为了实现量子计算,目前已经提出了利用原子和光腔相互作用、冷阱束缚离子、电子或核自旋共振、量子点操纵、超导量子干涉等不少方案,但现实的问题是在实验上实现对微观量子态的操纵确实太困难了。

发明内容

发明目的:针对上述问题,本发明的目的是提供一种暗信息的构成方法,通过该方法可生成暗信息,这种暗信息是粒子物理和信息科学结合产生的信息,具有类似于量子信息的叠加、相关和不确定性等特点,解决现有技术中对微观量子态操纵困难的问题。

本发明的另一目的是提供一种基于暗信息的数据压缩方法。

技术方案:根据本发明的第一方面,一种暗信息的构成方法,包括以下步骤:

将二进制信息进行跨界变换,得到虚拟准粒子,每个虚拟准粒子对应一个跨界变换后的二进制数;

将虚拟准粒子与多维类正交伪随机扩展矩阵进行多体仿真变换,得到新的虚拟准粒子,每个新的准虚拟粒子对应一个多体仿真变换后的二进制数,1表示正粒子,0表示负粒子;

将新的虚拟准粒子送入粒子参数盒中,通过对新虚拟准粒子数目进行计数得到码长,通过对新虚拟准粒子中的正粒子数目进行计数得到权重,通过对新虚拟准粒子进行谱分析得到群号,通过获取新虚拟准粒子之间的偏移量得到分布号,并基于权重、群号和分布号得到新虚拟准粒子的序号和能量;

将所得码长、权重、群号、分布号、序号和能量参数进行组合得到相应的暗信息。

进一步地,所述暗信息的表示形式为:

(D)

式中D表示暗信息,B表示可视化编码后的暗信息也采用二进制进行表示,L代表一种跨界多体仿真关系,S表示暗信息的序号,M代表粒子信息的权重,K表示群号,T表示分布号,Ex表示粒子扩展,N表示粒子信息的长度。

进一步地,所述将二进制信息进行跨界变换包括:对输入的二进制信息进行倍乘,并将相乘结果与预设补码相加,将“0”“1”信息变成粒子形式的信息,得到虚拟准粒子。

进一步地,所述将虚拟准粒子与多维类正交伪随机扩展矩阵进行多体仿真变换包括:将虚拟准粒子与预先生成的多维类正交伪随机扩展矩阵中的列信息进行对应位相乘,并对相乘结果进行模2加法运算,得到新的虚拟准粒子。

进一步地,所述通过谱分析得到群号包括:对权重相同的虚拟准粒子信息按照其中“1”的分布情况进行比较,将具有相同或相似分布的虚拟准粒子信息作为同群信息,得到群号。

进一步地,所述通过获取新虚拟准粒子之间的偏移量得到分布号包括:对同群的虚拟准粒子信息中“1”的排列方式进行比较,得到群中虚拟准粒子信息的平移量,并将平移量作为该虚拟准粒子信息的分布号。

进一步地,所述基于权重、群号和分布号得到新虚拟准粒子的序号包括:

获取权重信息,如果权重是1,则不做处理;如果权重不是1,则进行累乘运算,得到权重累乘结果;

获取群号信息,将群号与1进行相减、再与8进行相乘运算,得到群号运算结果;

对权重累乘结果、群号运算结果和分布号进行加法运算,得到新虚拟准粒子信息的序号。。

根据本发明的第二方面,一种基于暗信息的数据压缩方法,包括以下步骤:

根据本发明第一方面所述的暗信息构成方法产生暗信息;

获取待压缩数据串,对每个数值,根据不同的位数选择不同群的暗信息表示;

将除0以外的数值进行编码,编码时按照暗信息的方式表示;

对于除0以外的数位,相同的数值用错位替换法进行合并;

将数据中的“0”直接去掉,不做编码;

将编码后的数据进行存储和/或传输。

有益效果:本发明提出了一种暗信息的构成方法。暗信息是不同于二进制信息的一种具有粒子物理特征的、全新的数据表示方法,因此它可以代替ASCII码等传统二进制信息表示的场合,进行数据表示和数据传输等。输入一组二进制明信息,本发明的方法可以得到相应的暗信息,暗信息是二进制信息的影子,因此在传输的过程中,暗信息不占时隙,无需能量,但扩大了传输信息的信息量,因此暗信息也扩大了传输时的信息量,提高了信息传输的效率。本方法构成的暗信息具有暗特性、叠加、相关和多样性的特点,因此可以用于文字、图片和音视频等通信传输,同时其多样性也使得其随机特性,可以将它应用于保密通信进行数据加密。相比于现有技术中为实现量子态而采用的复杂技术手段相比,本发明极大了降低了实现难度,具有广泛的应用前景。

附图说明

图1是现有技术中X射线衍射光学原理图;

图2是本发明的暗信息的产生过程示意图;

图3是本发明的暗信息结构分布示意图;

图4是本发明的二进制信息和暗信息关系图;

图5是明信息和暗信息相乘的数据表示范围示意图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

在近代物理实验中,当使用一定波长的X射线照射到结晶性物质时,X射线因在结晶内遇到原子或离子而发生散射,散射的X射线在某个方向上相位得到加强,从而产生与结晶内部原子结构相对应的衍射现象,并将衍射结果在X光衍射谱中反映出来,X射线衍射原理如图1所示。由此可见,结晶性物质通过X光的照射,可以得到其原子的内部结构。除此之外,在自然界,当光线通过不透明物质时就会产生影子,并且当采用不同类型的光源通过同一个物质时,会产生不同的影子。例如,太阳光通过人的手掌,可以在地面上形成手掌的影子。在医学上,当使用X光照射人的手掌时,可以在X光片上呈现出手掌的骨骼和肌理。当使用一定波长的X射线照射到结晶性物质时,通过X射线的衍射成像,可以探测物质的内部原子结构。由此可见,对于同一个事物,采用不同的光源进行照射时,可以“挖掘”出同一事物不同层次的“影子”信息。

二进制信息以“0”和“1”作为信息单元,根据概率统计的相关原理,二进制信息中“0”和“1”相互独立,不能混淆。根据发明人对粒子物理、量子力学以及多体系统的研究发现,可以利用跨界多体仿真的方式,实现二进制和粒子物理的跨界变换。跨界变换后根据粒子参数盒的控制,可以得到具有多参数的暗信息。在本发明中跨界变换的方式是使用多维类正交伪随机扩展矩阵对二进制进行“照射”,产生二进制信息在粒子物理域中的“影子”信息,这个“影子”信息就是暗信息。暗信息的产生过程如图2所示。

参照图2,本发明暗信息的构成方法具体步骤如下:

首先将二进制信息与多维类正交伪随机扩展矩阵进行跨界多体仿真变换。对于二进制信息而言,由于它只有“0”和“1”两种表示形式,因此在计算机在数值表示方面,它遵循以2为基数,并且“逢二进一”的规则。二进制信息是计算机能够识别和处理的信息,计算机中所有的字母、符号亦都要用二进制编码来表示。为了得到暗信息,首先将二进制信息通过跨界变换得到准粒子,准粒子准粒子信息也用“1”和“0”表示,只是“1”表示带正电荷的准粒子,“0”表示带负电荷的准粒子。通过跨界变换,将二进制的波形信息(“1”和“0”表示)转换为了物理中的准粒子信息。

然后将准粒子与多维类正交伪随机扩展矩阵进行多体仿真变换。再将变换后的粒子通过由粒子参数盒控制的“变换体”。在“变换体”中,通过粒子计数器计算粒子的长度,通过正粒子计数器计算所有粒子中正粒子的个数(即权重),通过粒子的谱分析,得到粒子信息在整个信息群中的位置得到群号,通过粒子在整个粒子信息群中的位置分布情况得到分布号。通过粒子在整个粒子群中的位置得到相应的序号。通过数学方式,分别对权重、群号和分布号求导后,可以得到它们的扩展参数等。将准粒子的长度、权重、群号,分布号、序号和导数等扩展参数共同构成了描述粒子物理特征的暗信息。

暗信息是具有粒子物理特征的信息,暗信息中的“1”表示带正电的粒子,“0”表示带负电的粒子。当暗信息中带正电的粒子的个数不同时,暗信息的权重也不同,不同的权重将形成不同的轨道。在每一层轨道上,分布着不同的粒子群,这些粒子群之间存在着一定的关联。每一个粒子群都以正群和负群的方式成对存在,每一个正群都有一个与它相对应的负群,正确和负群中仅表示符号位的粒子不同,其余完全相同。在每个群中,又可以按照粒子分布的不同,分为上半群和下半群。下半群中的粒子信息是上半群中粒子信息按照一定的偏移量偏移后得到的,每个群中粒子信息的偏移量称为分布号。暗信息的群关联特性,使得暗信息具有与粒子物理类似的结构分布特征,暗信息的结构分布如图3所示。

具体而言,在本发明的实施例中,跨界变换是将二进制信息中的“1”和“0”跨界比象为虚拟准粒子(正粒子和负粒子)。例如,可以对输入的二进制信息与2进行乘法运算,并将相乘结果与预设补码如-1的补码相加,将“0”“1”信息变成粒子形式的信息,得到虚拟准粒子。

将虚拟准粒子与多维类正交伪随机扩展矩阵进行多体仿真变换包括:将虚拟准粒子与预先生成的多维类正交伪随机扩展矩阵中的列信息进行对应位相乘,并对相乘结果进行模2加法运算,得到新的虚拟准粒子。其中的多维类正交伪随机矩阵可根据输入的二进制信息x来构造。先选择若干个BCH码本原多项式组合产生多项式f(x),f(x)经过群变换和数值变换之后,得到类正交伪随机矩阵(MSP矩阵)M。再将多维类正交伪随机矩阵通过阈值筛选和扩展之后,得到多维类正交伪随机扩展矩(MPN矩阵)。因此概括而言,该矩阵是由若干个BCH码组合后得到的多项式f(x)经过群变换和数值转换之后得到的多维类正交伪随机矩阵,再经过筛选和直积扩展之后得到的。具体多维类正交伪随机扩展矩阵的构成方法和构成装置参见专利“多维类正交伪随机扩展矩阵的构成方法”(专利号-ZL200910264376.2),“多维类正交伪随机扩展矩阵的构成装置”(专利号-ZL200910264377.7)。由于多维类正交伪随机矩阵需要和经典信息域的信息进行多体仿真变换,因此多维类正交伪随机矩阵的大小必须与二进制信息的长度相匹配,即必须要选择合适的BCH码本原多项式,使得经过群变换等步骤之后,可以得到与输入的二进制信息相匹配的多维类正交伪随机扩展矩阵。

通过谱分析得到群号包括:对权重相同的虚拟准粒子信息按照其中“1”的分布情况进行比较,将具有相同或相似分布的虚拟准粒子信息作为同群信息,得到群号。

分布号通过获取新虚拟准粒子之间的偏移量得到,包括:对同群的虚拟准粒子信息中“1”的排列方式进行比较,得到群中虚拟准粒子信息的平移量,并将平移量作为该虚拟准粒子信息的分布号。

基于权重、群号和分布号的虚拟准粒子序号包括:权重如果是1,则不做处理;如果不是1,则进行累乘运算,得到权重累乘结果;将群号与1进行相减、再与8进行相乘运算,得到群号运算结果;最后对权重运算结果、群号运算结果和分布号进行加法运算,得到虚拟准粒子信息的序号,加法运算公式如下:

其中S表示序号,M是权重累乘结果,K是群号运算结果,T为分布号,C为如下的数学运算关系:

由于暗信息是二进制信息的“影子”,如同用X光照射物体所产生的影子一样,并不是肉眼可以直接看见的,需要通过某些媒介才能看到投射的影子。所以,对于暗信息,也必须要通过特殊的方式,将不可见的暗信息通过可视化处理,得到可见,可处理的信息。

可视化后的暗信息的表达式是:

(D)

上式中D表示暗信息,B表示可视化编码后的暗信息也可以采用二进制进行表示。L代表一种跨界多体仿真关系,不仅仅是一个函数关系,而是一个状态、符号集,其中包含四种物理特征的暗信息。括号中的六参数,代表四种物理相关参数,分别是:第一种暗信息的序号(标量),用S表示,N表示粒子信息的长度。M代表粒子信息的权重(Weight),K表示群号,T表示分布号,这些表示的是粒子信息的物理参数,这些量主要构成了暗信息。第二种物理参数是粒子空间位置(矢量)参数M、K、T,暗信息的三参数相当于三维空间X、Y、Z三参数,有XY平面的相位角度值,Z轴和会XY平面相位角度值,还有一个模量。第三个物理参数是粒子扩展Ex(标量),这可以表示信息在经典域消耗功率投影到粒子物理实验平台上的功率,代表的是系统中给“粒子”的能量参数,按能量大小按系统和层次、群粒子、矢量粒子分出大小不同的能量值。Ex还可以按照物理参数表示粒子旋转R(矢量),旋转角度和方向,利用粒子之间相互关系,从而计算出粒子运动轨迹。本发明中所述的四种物理关系指的是:M、K、T代表的空间关系;序号代表的关系;能量代表的物理关系;旋转代表的关系。

暗信息是由二进制信息变换而来的,与暗信息对应,将二进制信息称为明信息。暗信息会随着明信息改变而重新确定各种物理参数,是受束缚的变量或称半变量参数,并是周期函数。对于粒子信息的权重、群号和分布号,可以进一步求它们的扩展参数,得到的参数也可以作为暗信息的构成部分之一。

二进制信息与暗信息的关系在图4中示出。图4中分成2个区域,宏观经典域和微观粒子域。中间信息是一个椭圆形状信息圈(拓扑信息圈),它也分成二部分,明信息和暗信息2个区域。椭圆形状说明二种信息之间的相互转化,明/暗、暗/明为一体型。椭圆形状上有5个信息珠,只要得到一个信息珠,其它四个信息珠也就能得到,它们之间的互换性强、信息关联性优。图4中最下面的灰色带放入了四个物理参数,每个物理参数可以再细分,说明暗信息下面还有一层暗信息部分,暗信息是双层、三层结构。用S举例,若SL=1011 0100=(180),SM=41,Tj=2,出现3层次数值。得到明信息后,可以得到它所对应的第一层暗信息、第二层暗信息、第三层暗信息的内容。从应用角度上,任一个SL数值的获得后,在全校排名,全年级排名,全班的排名这三个不同层次的数值全部得到。即用一条明信息(矢量信息)能导出12个参数(有标量和矢量、角度)的暗信息。

因此在一个明信息后面“隐藏”着很多暗信息,将明信息和暗信息进行拼接,由此可以产生很大的数值表示范围。例如,利用暗信息表达式(D)

根据本发明的另一实施例,提供一种基于暗信息的数据压缩方法。

由于暗信息之间的关联特性,以及暗信息与二进制信息的对应关系,可以对数据进行压缩。例如,将电话号码中的每一位十进制数所对应的二进制数,经过跨界多体变换后,产生对应的暗信息。这种暗信息的产生过程中,利用了暗信息表达式(D)

在本实例中通过暗信息之间的关联特性,以及暗信息与二进制的对应关系,对于城市邮编实现压缩。该数据压缩方法可藉由特定的数据压缩装置来执行。数据压缩装置可包括输入输出单元、处理器和存储器。首先,输入输出单元获得用户输入的待压缩数据串;接着,处理器设定对应条件,基于上述暗信息的构成方法产生的暗信息与二进制的对应关系,对于产生的数值进行编码;最后将编码结果存储在存储器中和/或借由输入输出单元传输至外部设备。具体而言,处理器执行编码的过程包括以下步骤:

第一步,接收待压缩的数据串,对每个数值,根据不同的位数,选择不同群的暗信息表示。

例如:对于左起第一位的数值用权重=1,群号=1的暗信息表示;左起第二位的数值用权重=2,群号=1的暗信息表示;左起第三位的数值用权重=2,群号=2的暗信息表示;左起第四位的数值用权重=2,群号=3的暗信息表示;左起第五位的数值用权重=2,群号=4的暗信息表示;左起第六位的数值用权重=3,群号=1的暗信息表示;左起第七位的数值用权重=3,群号=2的暗信息表示;左起第八位的数值用权重=3,群号=3的暗信息表示;左起第九位的数值用权重=3,群号=4的暗信息表示;左起第十位的数值用权重=4,群号=1的暗信息表示。

第二步,将城市邮编中除0以外的数值进行编码,编码时按照暗信息的方式表示。

例如0510214000,左起第二位的数值“5”用权重=2,群号=1,分布号=5的暗信息表示,它经过可视化编码后对应的二进制信息00100010;左起第三位的数值“1”用权重=2,群号=2,分布号=1的暗信息表示,它经过可视化编码后对应的二进制信息10100000;左起第五位的数值“2”用权重=2,群号=4,分布号=2的暗信息表示,它经过可视化编码后对应的二进制信息01000100;左起第六位的数值“1”用权重=3,群号=1,分布号=1的暗信息表示,它经过可视化编码后对应的二进制信息11100000;左起第七位的数值“4”用权重=3,群号=2,分布号=4的暗信息表示,它经过可视化编码后对应的二进制信息10000101;

第三步,对于邮编中除0以外的,相同的数值用错位替换法进行合并。

例如0510214000通过错位替换法合并后的数值是0500214000。在错位合并的过程中,如果没有相同的数值,则用其暗信息可视化后的编码表示;如果有相同的数值,则某一位用其另一位数值表示,例如左起第三位的1和左起第六位的1相同,此时第六位1用第三位的1的暗信息可视化编码10100000表示,第三位的1变为0。

第四步,隐“0”。根据准粒子碰撞的方式,将城市邮编中的“0”隐藏,不做编码。

例如0500214000将0隐藏后得到5214的对应的暗信息可视化编码。并可以将5214的对应的暗信息可视化编码进行存储和传输。

由于此时的5是由暗信息可视化后的编码表示,这个编码表示的是左起第二位数值“5”,因此对于这个5来说,它在传输的时候,不一定要第1个传输或最后一个传输,它可以是任意次序传输。例如数据传输的顺序可以实2514,此时5虽然是第2个传输的,但是它的编码仍是00100010,它仍旧表示左起第二位数值“5”。因此通过这种方法,在压缩数据的同时,还是实现数据的乱序传输,从而达到加密的效果。

在解码时,可以通过暗信息的特征,恢复出原信息。同样地,解码方法可特定的数据压缩装置来执行。数据压缩装置包括输入输出单元、处理器和存储器。首先,输入输出单元获得暗信息表示的可视化编码数据;接着,处理器基于基于暗信息与二进制的对应关系进行解码恢复原信息;最后将恢复结果存储在存储器中和/或借由输入输出单元传输至外部设备。具体而言,处理器执行解码的过程如下:

第一步,根据接收到的暗信息可视化好编码所对应的权重群号顺序,确定各位数值在原信息中的位置。

例如接收到的信息10000101,它对应的权重=3,群号=2,所以它的数值为4,它在原信息中的位置是第七位,即它表示原信息中第七位数值是4。通过同样的方法,可以知晓5,2,1在原信息中的位置。

第二步,错位补数。在将接收到的信息解码恢复原信息的过程中,会发生某个接收到的数值所对应的原信息的位置与其相邻两个数值所对应的原信息的位置之间顺序有错位,此时一方面保留该位置的数值以外,在其错位的位置补上相同的数值。

例如接收到的信息01000100,它解码后对应的原信息是左起第五位的数值2,10100000解码后对应的是原信息中左起第3位的1,10000101对应的是原信息中左起第7位的4。还原后发现2、1、4的位置顺序为5、3、7,顺序发生了错位,因此一方面保留原位置的数值,即在2和4之间的1保留,同时在另一个位置3补上数值1。

第三步,再现“0”。在某些没有确定数值的位置将隐藏的0重现。

例如,在左起第二位是5,第三位是1,第五位是2,第六位是1,等七位是4,其余位都是0。

如果所有的邮编都采用该方法进行存储和传输,将大大减少存储空间和数据传输时间,提高存储和传输的效率。部分数据压缩如下表1所示。

表1江苏省城市邮编

应当理解,上述以邮编压缩描述的基于暗信息的数据压缩方法仅是举例的作用,而不是限制该压缩方法仅能应用于邮编的压缩,在其他应用场景下,可以基于上述方法的步骤进行其他数据的压缩。

此外,暗信息的构造方法完全不同于二进制信息,由于暗信息具有的可叠加性、相关性和不确定性,即在其不确定多维类正交伪随机矩阵,以及粒子参数盒中的参数情况时,对于一组二进制信息,它是无法确定其对应的暗信息的。因此,如果将暗信息应用于数据报密,则无法通过穷举法完成信息的破译,因此可以将这种特殊的信息构造方法应用于保密数据通信。

相关技术
  • 暗信息的构成方法以及基于暗信息的数据压缩方法
  • 一种暗光状态下的信息显示方法、移动终端及存储介质
技术分类

06120112330448