熵[shāng]
1物理学上指热能除以温度所得的商,标志热量转化为功的程度
2科学技术上泛指某些物质系统状态的一种量(liàng)度,某些物质系统状态可能出现的程度亦被社会科学用以借喻人类社会某些状态的程度
熵(shāng),热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量。
克劳修斯(TClausius) 于1854年提出熵(entropie)的概念,我国物理学家胡刚复教授于1923年根据热温商之意首次把entropie译为“熵”。AEinstein曾把熵理论在科学中的地位概述为“熵理论对于整个科学来说是第一法则”。
查尔斯·珀西·斯诺(CPSnow)在其《两种文化与科学革命》一书中写道: “一位对热力学一无所知的人文学者和一位对莎士比亚一无所知的科学家同样糟糕”熵定律确立不久,麦克斯韦(JCMaxwell)就对此提出一个有名的悖论试图证明一个隔离系统会自动由热平衡状态变为不平衡。
实际上该系统通过麦克斯韦妖的工作将能量和信息输入到所谓的“隔离系统”中去了。这种系统实际是一种“自组织系统”。
以熵原理为核心的热力学第二定律,历史上曾被视为堕落的渊薮。美国历史学家亚当斯HAdams(1850-1901)说:“这条原理只意味着废墟的体积不断增大”。
有人甚至认为这条定律表明人种将从坏变得更坏,最终都要灭绝。热力学第二定律是当时社会声誊最坏的定律。社会实质上不同于热力学上的隔离系统,而应是一种“自组织系统”。
熵的历史
热力学第一定律阐述的是“能量”以及“能量守恒”的概念,但是第一定律无法定量解释摩擦和耗散的影响
法国数学家拉扎尔·卡诺的分析和贡献最终导致了“熵”这个概念的诞生。
1803年,拉扎尔·卡诺发表了一篇文章“运动和平衡的基本原理”,提出在任何一个机器的运动部分的加速和冲击意味着动量(momentum)的损失,换句话说,在任何自然过程中,总是存在着“有用”的能量逐渐耗散这一固有的趋势。
基于上述研究,1824年拉扎尔·卡诺的儿子尼科拉斯·莱奥纳德·萨迪·卡诺发表了“关于火的原动力”,提出所有的热机的工作都需要存在温度差,当热量从热机热的部分向热机冷的部分转移时,热机获得了原动力。这是对热力学第二定律的最初洞见。
卡诺提出的可逆热机只存在于理想情况。19世纪50年代和60年代,德国物理学家克劳修斯在对实际热机的研究中进一步指出,任何热机都不是可逆的,不可能毫无“改变”,并进一步对这个“改变”进行了定量研究。
克劳修斯认为,实际热机在使用过程中会产生“无法使用”的热量(比如热机的活塞和热机壁摩擦产生的热量。在此基础上,克劳修斯提出了熵的概念,将熵描述为能量的耗散。
以上内容参考 百度百科-熵
什么是熵
数据压缩不仅起源于 40 年代由 Claude Shannon 首创的信息论,而且其基本原理即信息究竟能被压缩到多小,至今依然遵循信息论中的一条定理,这条定理借用了热力学中的名词“熵”( Entropy )来表示一条信息中真正需要编码的信息量:
考虑用 0 和 1 组成的二进制数码为含有 n 个符号的某条信息编码,假设符号 Fn 在整条信息中重复出现的概率为 Pn,则该符号的熵也即表示该符号所需的位数位为:
En = - log2( Pn )
整条信息的熵也即表示整条信息所需的位数为:E = ∑En
举个例子,对下面这条只出现了 a b c 三个字符的字符串:
aabbaccbaa
字符串长度为 10,字符 a b c 分别出现了 5 3 2 次,则 a b c 在信息中出现的概率分别为 05 03 02,他们的熵分别为:
Ea = -log2(05) = 1
Eb = -log2(03) = 1737
Ec = -log2(02) = 2322
整条信息的熵也即表达整个字符串需要的位数为:
E = Ea 5 + Eb 3 + Ec 2 = 14855 位
回想一下如果用计算机中常用的 ASCII 编码,表示上面的字符串我们需要整整 80 位呢!现在知道信息为什么能被压缩而不丢失原有的信息内容了吧。简单地讲,用较少的位数表示较频繁出现的符号,这就是数据压缩的基本准则。
细心的读者马上会想到,我们该怎样用 0 1 这样的二进制数码表示零点几个二进制位呢?确实很困难,但不是没有办法。一旦我们找到了准确表示零点几个二进制位的方法,我们就有权利向无损压缩的极限挑战了。不要着急,看到第四章就明白了。
模型
从上面的描述,我们明白,要压缩一条信息,首先要分析清楚信息中每个符号出现的概率。不同的压缩程序通过不同的方法确定符号的出现概率,对符号的概率计算得越准确,也就越容易得到好的压缩效果。在压缩程序中,用来处理输入信息,计算符号的概率并决定输出哪个或哪些代码的模块叫做模型。
难道对信息中字符的出现概率这么难以估计以至于有各种不同的压缩模型吗?对上面的字符串我们不是很容易就知道每个字符的概率了吗?是的是的,不过上面的字符串仅有 10 个字符长呀,那只是例子而已。考虑我们现实中要压缩的文件,大多数可是有几十 K 甚至几百 K 长,几 M 字节的文件不是也屡见不鲜吗?
是的,我们可以预先扫描文件中的所有字符,统计出每个字符出现的概率,这种方法在压缩术语里叫做“静态统计模型”。但是,不同的文件中,字符有不同的分布概率,我们要么先花上大量的时间统计我们要压缩的所有文件中的字符概率,要么为每一个单独的文件保存一份概率表以备解压缩时需要。糟糕的是,不但扫描文件要消耗大量时间,而且保存一份概率表也使压缩后的文件增大了不少。所以,在实际应用中,“静态统计模型”应用的很少。
真正的压缩程序中使用的大多是一种叫“自适应模型”的东西。自适应模型可以说是一台具有学习功能的自动机。他在信息被输入之前对信息内容一无所知并假定每个字符的出现概率均等,随着字符不断被输入和编码,他统计并纪录已经出现过的字符的概率并将这些概率应用于对后续字符的编码。也就是说,自适应模型在压缩开始时压缩效果并不理想,但随着压缩的进行,他会越来越接近字符概率的准确值,并达到理想的压缩效果。自适应模型还可以适应输入信息中字符分布的突然变化,可以适应不同的文件中的字符分布而不需要保存概率表。
上面提到的模型可以统称为“统计模型”,因为他们都是基于对每个字符出现次数的统计得到字符概率的。另一大类模型叫做“字典模型”。实际上,当我们在生活中提到“工行”这个词的时候,我们都知道其意思是指“中国工商银行”,类似的例子还有不少,但共同的前提是我们心中都有一本约定俗成的缩写字典。字典模型也是如此,他并不直接计算字符出现的概率,而是使用一本字典,随着输入信息的读入,模型找出输入信息在字典中匹配的最长的字符串,然后输出该字符串在字典中的索引信息。匹配越长,压缩效果越好。事实上,字典模型本质上仍然是基于对字符概率的计算的,只不过,字典模型使用整个字符串的匹配代替了对某一字符重复次数的统计。可以证明,字典模型得到的压缩效果仍然无法突破熵的极限。
当然,对通用的压缩程序来说,保存一本大字典所需的空间仍然是无法让人忍受的,况且,任何一本预先定义的字典都无法适应不同文件中数据的变化情况。对了,字典模型也有相应的“自适应”方案。我们可以随着信息的不断输入,从已经输入的信息中建立合
熵(拼音:shāng)泛指某些物质系统状态的一种量度,某些物质系统状态可能出现的程度。哈哈,多年前听物理老师讲起过,到现在已经是全部归还给老师了,应该是原原本本的还回去了,再一次接触到这个词,不得不去找一下度娘。
熵的概念是由德国物理学家克劳修斯于1865年所提出。最初是用来描述“能量退化”的物质状态参数之一,在热力学中有广泛的应用,亦被社会科学用以借喻人类社会某些状态的程度,熵的本质是一个系统“内在的混乱程度”。
最近看了《下一个倒下的会不会是华为》的这本书,且看看华为人是怎么理解熵这个词的,来自于高管层对企业经营和热力学第二定律关系的理解。所谓热力学第二定律,说的是,任何一个系统,如果是一个孤立的封闭系统,就只会在系统内部发生能量交换,从高温向低温转移,最终温差会消失,这时候,就不再会有能量交换。物理学把没有能量交换的状态称为“熵死”,把系统内从有序到无序的转变过程叫做“熵增”,把非封闭的开放系统叫做“耗散结构”。在“耗散结构”里,系统通过不断和外界进行能量交换,在耗散过程中产生“负熵”,从原来的无序状态变成有序状态。
在华为的发展过程中,除了积累了资源和能力,创造了经济和社会财富外,还累积了大量的“熵”。也就是说,企业从原来的有序变成无序,得了“大企业病”,得了“组织疲劳症”。2008年,任正非在《从泥坑里爬出来的人就是圣人》一文中指出,华为20多年的经验证明,自我批判对公司的发展有多么重要。没有自我批判,华为就不会认真听取客户的需求,就不会密切关注并学习同行的优点,就不能深刻自我反省,就会故步自封,不能虚心吸收外来的先进东西,不能保持内敛务实的作风,就不能剔除组织中的无效成分,建立一个优质的管理体系。
公司的管理结构就应该是一种耗散结构,我们有能量,一定要把它耗散掉,通过耗散,使公司获得新生。这就好比你每天去锻炼身体,把身体里多余的能量耗散掉,变成肌肉。为了把华为发展过程中积累的“熵”给耗散掉,华为一直在内部提倡自我批判的精神。
熵的定义如下。
假设在不改变宏观物质的表现的情况下,微观分子的可能排列的总数为W
则熵S=lgW
譬如,一个很乱的书架,共有3层,上面随机放着十本书。那么,
W=10^3,S=lgW=3
实际上熵是一个表明系统混沌程度的 状态 量
系统经绝热过程由一状态达到另一状态熵值不减少——熵增原理(the principle of the increase of entropy)
对绝热过程,ΔQ = 0 ,有ΔS(绝热)>= 0(大于时候不可逆,等于时候可逆) 或 dS(绝热)>= 0 (>0不可逆;=0可逆)
熵增原理表明,在绝热条件下,只可能发生dS>=0 的过程,其中dS = 0 表示可逆过程;dS> 0表示不可逆过程,dS<0 过程是不可能发生的。但可逆过程毕竟是一个理想过程。因此,在绝热条件下,一切可能发生的实际过程都使系统的熵增大,直到达到平衡态。
(参照:多媒体CAI物理化学第四版:大连理工大学出版社)
熵增原理是一条与能量守恒有同等地位的物理学原理。
熵增原理是适合热力学孤立体系的,能量守恒定律是描述自然界普遍适用的定律。 熵增定律仅适合于孤立体系,这是问题的关键。实际上,绝对的联系和相对的孤立的综合,才是事物运动的本质。虽然从处理方法上讲,假定自然界存在孤立过程是可以的。但是从本质上讲,把某一事物从自然界中孤立出来是带有主观色彩的。当系统不再人为地被孤立的时候,它就不再是只有熵增,而是既有熵增,又有熵减了。于是可以看到能量守恒定律仍然有效。
熵总是联系着大量子系统,而人类社会正是这样一个复杂的体系。在人类社会中不仅有熵增,而且有熵减,这就使关于人类的科学与整个自然科学产生分歧,出现自然科学与人文科学的矛盾。
我们知道,在科学中有三个基本定律,即质量守恒定律,能量守恒定律和熵增定律。质量、能量守恒定律在微观领域又被推广为质、能相关定律。质量守恒定律,能量守恒定律和质能相关定律在数学上表示为等式。而熵增定律则是不等式 , 即在孤立系中 , 熵增总是大于或等于零 ( △ S ≥ 0) 。在这种等式与不等式的差别中,隐含着深刻的意义。
从系统三象性的基点来看,问题是这样的:任何系统状态 ( 点 ) 上物质性、能量性、信息性不可分离地共存着,但物质 ( 质量 ) 和能量是守恒的,而信息却 ( 信息是负熵 ) 不守恒。
由于在孤立系中熵总是增加的,而熵是混乱度。那么,系统在孤立情况下总是自动地趋向于混乱与无序,这就与生物的有序化发展产生矛盾,出现克劳胥斯与达尔文的分裂。
由于熵总是增加的,因而过程就出现单一的时间之矢,从而是不可逆的,这就与牛顿力学的可逆时间产生矛盾,出现牛顿、爱因斯坦与普里戈金、哈肯的分裂。
熵总是联系着大量子系统,而人类社会正是这样一个复杂的体系。在人类社会中不仅有熵增,而且有熵减,这就使关于人类的科学与整个自然科学产生分歧,出现自然科学与人文科学的矛盾。
质量守恒定律和能量守恒定律是自然界的普适定律,而熵增定律则适合于热力学孤立体系。任一质点或任一质点系都适合于质量守恒定律和能量守恒定律,但一个质点就谈不上熵增,非孤立体系的熵也不一定增加。
以上就是关于熵,这个字是什么意思全部的内容,包括:熵,这个字是什么意思、熵是什么意思、熵是什么意思等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!