内容提要:本文首先分析了对称性与熵、序的关系,指出统计熵的概念主要是针对复杂系统而言的,相比之下,对称性和序的概念则宽泛得多,因此熵与对称性及序的对应关系是很复杂的。其次,本文从分析申农实用信息定义的不足入手,提出了根据不变量来定义信息的新思路。以上述讨论为基础,作者试图以对称性、不变量为突破口,梳理熵与信息之间的关系,以利于人们对信息概念的深入理解。
关键词:对称性, 熵,信息,序,不变量
1、
对称性、熵与序关系新解
众所周知,熵是克劳修斯(R.Clausius)在热力学研究中为了完成热力学第二定律的定量化而引入的,其数学表达式最初为S=S0+∫dQ/T ,从中很难看出熵与对称性有什么关系。统计力学建立后,玻尔兹曼提出了著名的公式S=klnW, 其中W为热力学概率,k为常数,由此熵才与热力学概率联系在一起。又由于统计力学引入了以热力学系统微观组成的全同性即对称性为基础的等概率假说,人们在比较热力学系统宏观态的可能性大小时,就在熵与热力学系统微观态分布的对称性之间建立起了联系。可见,玻尔兹曼的这种统计熵与对称性的关系只适用于由大量粒子等组成的带有随机不定特性的复杂系统。 但是,从对称性的本意来讲,它是指某种变换操作中的不变性,所以从概念的内涵来看,熵与对称性两者并无直接的联系。例如,我们往往认为一个几何图形圆的对称性是最高的,可这种对称性与熵概念并没有什么联系。而对对称性的系统的数学刻画,首先是从对晶体的研究开始,并最终由群论来完成的。所以,熵与对称性的关系,只涉及到一部分有复杂构成的系统的对称现象,而没有涵盖对称性的全部情况。如果笼统地将熵与对称性联系在一起,就容易使人产生某种误解。事实上,虽然在统计物理中,熵与热力学概率、与对称性的关系是清楚的,但长期以来,人们在对熵、对称性关系的认识方面,尤其是在相关问题的泛化方面出现过许多模糊和混乱,这些问题突出地表现在熵、对称性和序的关系上。 所谓序或有序,是指事物内部的要素和事物之间有规则的联系,其表现是事物按照一定的客观秩序进行有规则的排列、组合和运动,反之则称为无序。但在很多情况下,要想定量或半定量地比较两个事物之间的有序或无序程度是很困难的。例如对于下面两个图形:
易见,图形a具有绕中心旋转180 0的对称性,图形b具有沿中心竖直轴翻转的镜像对称性,它们之间不能通过某种对称破缺从一个状态变为另一状态,因此也很难比较两者之间的有序程度(魏宏森等,第226页)。 一般说来,处于有序状态的事物,我们比较容易考察其因果关系;对于无序的结构和状态,则难以把握它们所满足的规律,这样,有序的概念就同可认识性和规则性联系在一起了,但困难的是,这些概念之间有时也很难协调在一起。例如在热力学系统中,当系统处于平衡态时, 内部分子的分布具有最完美的对称性,当然它同时也被当作是完全混乱无序的状态;而随着这种对称性的破缺,系统的有序程度或组织程度却被认为是增加了。可从有序就是满足一定的规则性的角度讲,对称性本身也是一种规则,如果说对称的就是无序的,这是否意味着对称性不是一种规则或秩序?那么,规则或秩序的定义又应该是什么呢?由于存在这样那样的诘难,“长期以来,这个简单的问题一直使物理学家感到尴尬!”(哈肯,第12页) 其实,产生上述混乱的原因首先是由于在讨论这一问题时,人们下意识地把日常生活中对序等概念的一些宽泛甚至是模糊的理解带入到科学讨论中了,比如根本没有注意到熵的统计特征,而将熵、对称性和序不恰当地联系在一起等。其次,有些混乱则是由于人们对熵和序的层次性不够理解而产生的。我们在一篇专文中曾指出,热力学系统处于平衡态时,它所满足的对称性性其实是针对系统整体的,属于宏观层次;而此时我们说系统的熵最大因而包含的微观态度数目最多并且最混乱,主要是指微观层次上分子运动的无规则性,微观分子运动的这种混乱与系统整体的规则性有一定联系,但它们处于两个层次,故两者并不构成直接的对立。可见,正确理解熵及其相关概念的层次性,对于把握熵概念的本质,澄清与熵概念有关的各种混乱和模糊认识,具有重要的方法论意义(董春雨、姜璐,第23-26页)。 无论存在多少困难,熵概念如今早已推广到自然科学和社会科学的许多领域,而其中最重要的扩展,是熵与信息间关系的建立。
2、信息与不变量
在当代科学中,熵与信息之间的联系是人们所熟知的,流行的说法是“信息即负熵”,其根据之一是,两者的数学表达只相差一个负号,之二是,熵意味着混乱,而信息意味着无序程度的减少,可见它们有着深刻的内在联系。但根据我们最近对信息概念的分析,人们普遍接受的申农(C.Shannon) 的信息定义有很大不足。
申农信息定义的核心,是将信息定义为在信息传递过程中,人们对系统认识的不确定性的减少,所消除的不确定性的大小即为信息量的多少,所以他后来进一步得出,在通讯过程中,人们得到的信息就等于系统的信息熵。这样的信息定义有两个突出特点,一是将信息的作用限于去掉认识中的不确定性,也正是这一定义方式的实用特征,使我们对信息的研究走到了侧重于信息作用的方向上,而忽略了对信息的其他特征的分析。特别是当人们深入研究比较复杂的信息时,发现信息的作用是多种多样的,由此所带来的信息的多值性,不可避免地给人们造成了许多困难。二是这样的信息定义极大地依赖于通讯的过程和信息的接收者的知识状况,甚至使信息可能染上主观主义的色彩。因此,有人对以申农为代表的这种实用信息定义提出了批评:正如粮食的定义不能是“消除了的饥饿状态”一样,信息的定义也不能是“消除了的不确定性”(邬焜、李琦,第8页)。为了避免信息与过程和人的主观认识联系过于紧密的缺陷,人们相继提出了其他的信息定义。目前有文献可查的信息定义已经超过200个(胡文耕,第207页),它们从不同侧面说明了信息的某个特点,但也各有各的困难。
出路在那里?维纳(N.Wiener)说:“信息就是信息,不是物质也不是能量。不承认这一点的唯物论,在今天就不能存在下去。”(维纳,第133页)这一论断强调了信息与物质、能量的区别,但谁都无法否认,离开了物质和能量,信息将无所附着。所以,我们对信息定义的讨论,将与物质、质量、能量联系起来考虑。
首先简单回顾一下人类对物质、质量与能量的认识过程。列宁说:“物质是标志客观实在的哲学范畴,这种客观存在是人通过感觉感知的,它不依赖于我们的感觉而存在,为我们的感觉所复写、摄影、反映。”(《列宁选集》(第2卷),第128页)关于物质的这一定义,是从哲学的角度对宇宙间变化着的万事万物所蕴涵的不变性的高度概括,我们称之为客观性。可以这样说,客观性作为物质存在的标志,是最高层次的不变性,它将体现在许多不同的方面,其中质量和能量的性质,就是最重要的表现。那么,人们是如何认识物质范畴之下的质量和能量的呢?
质量在经典力学中首先是作为物质多少的量度提出来的,它是物质惯性大小的量度,并且与物质的引力也有关系。对质量认识最重要的进步,是物质不灭定律的发现:即物质是不生不灭的,只能从一种形式转变成另一种形式,且在这一过程中其总量保持不变。
能量作为物质运动的一种量度,更是直接在物质的不同运动形式的联系和转化中才被认识的,或者说能量的意义只有在能量守恒与转化定律发现后才被认清。可见,自然科学研究问题的办法之一就是寻找守恒律即不变性,比如爱因斯坦后来发现的质能关系E=mc2,不仅揭示了质量和能量之间的联系,而且它实际上还意味着更高层次的守恒性或不变性。
应该说信息同质量、能量一样,也是物质世界的主要属性之一,但申农信息论中的信息定义却依赖于一个过程,特别是依赖于人的主观知识,使信息与质量、能量之间出现了明显的不对称性。考虑到信息与质量、能量均可作为物质某种性质的物理量,模仿质量是惯性的量度、能量是运动的量度,我们提出:信息可以定义为人们对物质认识的一种量度。即物质无时不在运动变化,认识事物就是对其运动过程中不变化的规律性的把握。所以从本体论层次来看,在物质运动变化过程中,不发生改变的那些性质,都可以被称为信息,信息就是对这一类性质的最高概括或总称,如物质概念之于不同物体或水果之于苹果、香蕉等一样。例如,在刑侦工作中,人的不变的染色体、指纹等都可以被当作识别个体的一种信息。当然,最常见的信息形式是语言,下面我们以语言为例,分析一下其中的不变性的意义。
在声音(声波)的传播过程中,其频率是不变的,所以,通常声音的频率将代表一个声音中的具体信息。但需要注意的是,这里将频率当作信息并不涉及信息的内容或意义,信息的内容和意义实际上涉及到信息的编码和译码的问题,这些不属定义要讨论的范围。
无论如何,声音频率虽然是我们理解语言这种现在最常见的信息的基础,但它的形式却是千变万化的,如不同地域、民族表达相同的信息内容时,使用着不同的语言即频率。与此相适应,作为最常见的信息形式之一的各种语言的书写符号也各不相同。所以,这里必须澄清的一点是,作为信息的不变量往往具有不同的形式。如何理解这种“一”与“多”之间的关系呢?我们说,虽然信息不能脱离直接、具体的物质存在形式,但它并不等同于直接、具体的物质存在形式。信息不仅区别于具体的消息内容,也区别于信息的载体即信号。例如,一个信息,可以凭借不同的物质载体如光波、书等传递因而具有不同的表现形式,可它并不将自身等同于表达它的物质载体本身;而且,尽管一个信息的具体表达形式是多种多样的,但它们在本质上总是以间接的甚至抽象的形式表达同一样东西——即本文所强调的不变量。一个不变量被表达为不同的形式,实际上可以被理解为不同的编码-译码方式——虽然各种码的形式不同,但它们满足的关系是相同的,即满足同构关系。或者反过来说,由于这种同构关系的存在,信息的表达及其传递才可能具有多样的形式,有人将“同样内容的信息可用不同性质的载体来载负”这一事实概括为信息“载体的可替换性”(邬焜,第27页)。总之,象恩格斯指出的那样:“物质无非是各种实物的总和,而这个概念就是从这一总和中抽象出来的”(《马克思恩格斯选集》(第3卷),第556页),即实物必须有它的直接存在的种种方式和状态,但物质的客观实在性又不能仅仅停留在“各种实物的总和”上。与此类似,信息概念也总是要超越它的具体内容、具体表达形式及其载体的。
其次,从不变量的角度考察申农的信息论可以发现,他的信息论也离不开不变量。在无线电传输过程中,电码作为信息,在传输过程中将不改变,只不过申农把注意力全集中在电码对人的作用方面了,而没有进一步挖掘在传输过程中用电码的不变性来定义信息,即只把编码、译码作为通讯模型中的两个环节来看待了。其实,通讯的本质总是意味着在这一过程中会保持消息意义和内容的不变性,申农的公式恰恰是对这种不变性传递程度的刻画;而从另一个流传甚广的信息的定义即“信息是负熵”、“是系统有序程度的量度”的角度来看,它与我们的定义也是一致的。因为我们还可以继续追问:什么是有序呢?对有序的一种基本的理解就是,序意味着规律即不变性。可见,现在从不变量的角度来定义信息,是抓住了信息更深层的本质,并把过去人们长期没有意识到的东西进一步明确了。
3、信息的度量与熵及对称性
如果我们根据实际需要确定了一个“通信过程”中的某个不变量进行考察,那么这一信息又如何被定量表达呢?而这种定量表达,正是实现我们这种定义方式的核心问题。
从能量的定量表达来看,对热能的认识有着特殊的意义。人们通过对传递热量、作功与过程的关系的分析,一是找到了仅与系统状态有关的能量,使能量从具体过程中脱离出来,成为描述对象客观状态的一个变量,二是找出了能量、作功、传热三者之间的关系,定量地确立了能量守恒与转化定律。有了这些进步,能量作为运动的量度的本性才被真正认识。
我们关于信息度量的讨论能否从上面得到启发呢?
如上所述,过去申农是从去掉人的知识的不确定性的角度来度量信息大小的,由于信息作用很多,这就给信息的客观化及其度量带来很大困难。但我们强调,信息的作用不是信息的性质,要认识信息必须使信息成为事物客观状态的表征。不变量的客观性是没有问题的,一个不变量不管是否被认识到或被认识多少,它都存在着。可作为客观的不变量的定量化问题怎样解决呢?
让我们考虑申农的通信模型。在这种典型的通讯过程中,显然密码的具体编码和译码形式有很多,但它们再变,都离不开一种固定的变换关系;或者说通讯的本质是不变量的传递。例如在日常生活中,一个特定的含义,不仅可以用汉语、英语等完全不同的语音和书写形式表达,而且这些语言之间可以互译,互译的深层基础即不变性的存在。所以,不变性的本质是一种特定的关系或结构,同一关系的不同表达间可以相互变换,用数学的语言讲,它们之间是一种同构关系,并可以通过群论的数学工具来描述这种变换过程和关系。
那么,我们又将如何来定量表达这些不变的属性、关系、组织或结构呢?
从本文对信息的定义看,既然信息是信源与信宿之间传递的不变量,最直接的想法就是用信宿对信源的再现程度或输入与输出的差异程度来刻画信息的传递过程,但再现程度只能是对信息传递过程是否成功的一种描述,它并不能反映信息本身的情况——显然,不同的不变量的复杂程度是不同的,如一个字母与一部书,从传递的角度来讲,成功的信息交流都可达到100%,但两个过程传递的内容却完全不同。可见,对不变量本身的刻画必须考虑到它的复杂性。如同运动的度量离不开对它的反面即静止的度量一样,对不变量的定量描述同样必须借助于其反面即从变化的角度来达到, 而概率的本性恰恰是对不确定性的一种刻画。所以,对复杂程度各不相同的不变量的刻画,可以考虑使用类似于已有的信息熵的概念。这样,基于概率的概念,在我们的定义与申农已建立起来的较有效的和相对成熟的定量化描述之间,就可能架起一座沟通的桥梁。特别是前面已经看出,信息新的定义与申农等原有的定义并不完全对立,期间存在许多深层的联系和一致性。如果真是这样,我们就可以借鉴申农成熟的定量化成果为我所用。但无论如何,在寻求信息新的定量表达时,对信息、不变量和对称性的关系的重新理解应建立在本文上面分析的基础上,并应注意以下几个问题:
1、既然信息的本质是不变量,信息过程的本质是不变量的传递,而不变量与对称性是一一对应的,这样,对信息的表达,应该考虑借鉴对对称性的表达来达到。以前人们用信息熵的概念使两者达到了一定程度的沟通,但我们的分析已经表明,原有的信息熵与不变量或对称性的对应关系是不完全的,理由是:按照过去的看法,现有的信息熵与热力学统计熵只差一个负号,两者一一对应。但一是本文已经谈到,我们现在无法将有序与无序的概念直接建立在对称性的基础之上,热力学统计熵也不能包括所有的对称性;二是按照我们的观点,信息应该与对称性一一对应,因此,用现有的信息熵来表达新的信息定义一定是不完全的,如何克服以上不足,首先需要进一步澄清信息熵的含义,包括它与热力学统计熵的联系与区别;其次,如果原来的信息熵不能涵盖所有的不变量,那么我们还有其他的途径弥补吗?这需要从对称性的描述入手做进一步深入的探索。
2、与描述对称性直接相关的数学工具有两个:群论和概率,但这两种数学理论在描述对称性时的出发点与落脚点是不同的:首先群论是直接以对称性为研究对象的,并且相关的研究与序这样一个容易产生误解的概念无关,而概率(熵)则是以对称性为根据或基础的,并且与序纠缠在一起。其次,群论主要着眼于讨论变换中的不变性,即着眼于变换关系本身,对信息而言,这种变换关系应该是指不同信息形式或载体之间的关系,因此,群论对于讨论不同形式的信息间的关系肯定是有益的。但是,如何利用群论来深化对对称性、不变量的认识从而加深人们对信息本质的认识,也许是我们应该努力的方向之一。如果可能,由于群论本身是与人的主观知识状态完全无关的一种知识,它是否可能成为对信息概念进行更为深入刻画的一种理论基础而使信息概念摆脱以往的困境呢?
总之,如何以不变量和对称性为突破口,不断加深人们对信息概念的理解,并进一步理清对称性、熵、序和信息之间深刻的内在联系,是目前学术研究应该关注的重要问题,我们这里只是提出了解决此问题的一个方向。我们期待着,经过学术界同仁的共同努力,人们能够对对称性、熵、序、信息的意义及其关系有一种崭新的理解,特别是企盼着能把对称性、熵、序、信息四者的关系用定量或半定量的方式加以统一,无疑,这将有助于人们对世界的统一理解。 |