在现代数学中,有一个词很容易被外行人误解:信号。

数学家们在谈论“一个信号”的时候,想到的不是红绿灯的闪光灯,也不是手机屏幕顶部的天线图案,而是一条可以具体数字化的信息,可以是声音、图像,也可以是遥感测量数据。

简单来说就是一个函数,定义在通常的一维或多维空之上。比如声音是一维空定义的函数,自变量是时间,因变量是声强,图像是二维空定义的函数,自变量是横轴纵轴坐标,因变量是图像像素的颜色和明暗等等。

数学上,关于一个信号最基本的问题是如何表达和描述它。

按照上面提到的方法,把一个信号理解为在时间或空上定义的函数是一种自然的表示,但往往不足以理解这个信号的内容。

例如,一个声音,如果简单地用一个在时间上定义的函数来表达,它是这样画的:

这通常被称为波形图。毫无疑问,它包含了关于这个声音的所有信息。

但毫无疑问,这个信息很难从上面的“功能”中直接看到。事实上,这只是巴赫第三首无伴奏小提琴序曲的前几小节

以下是巴赫的手稿,从某种意义上说,它也构成了对上述声音的“描述”:

这两种描述有什么关系?第一个描述描述了具体的信号值,第二个描述描述了声级。

直到19世纪,人们才逐渐意识到这两种描述之间其实存在着双重关系,这一点并不明显。

1807年,法国数学家j .傅立叶在提交给巴黎科学院的一篇革命性论文《固体中挑战性传播的莫尔》中提出了一个全新的观点:任何函数都可以表示为一系列不同频率的简谐振动的叠加。

有趣的是,这个结论是他对热传导研究的副产品。

本文经拉格朗日、拉普拉斯、勒让德等审阅后被驳回。,因为他的思想太粗糙,极其不严谨。

1811年,傅立叶提交了修改后的论文,获得了科学院奖,但由于缺乏严谨性,仍然拒绝在《科学院报告》中发表。

傅立叶对此很担心,直到1824年他成为科学院的秘书,他才能够在《报告》中完整地发表他1811年的论文。

用今天的语言来说,傅立叶的发现实际上是在说:

任何信号都可以用两种方式表示,一种是通常意义上的表达,自变量是时间或空之间的坐标,因变量是那里信号的强度,另一种是将一个信号“展开”成不同频率的简单三角函数的叠加,所以等价于把它当作在所有频率定义的/[/k0/来处理

这两个函数,一个定义在时域,另一个定义在频域,通常看起来完全不同,但描述同一信号的方式却完全不同。

它们就像是两种不同的语言,乍一看完全不相关,但实际上可以准确地互相翻译。从数学上讲,这个翻译过程叫做傅里叶变换。

傅立叶变换是数学中一个极其美丽的对象:

它是完全可逆的,任何能量有限的时域或空域信号都存在唯一的频域表达,反之亦然。它完全不损伤信号的内在结构:任何两个信号之间有多少相关程度(即内积),它们的频域表达之间也一定有同样多的相关程度。它不改变信号之间的关联性:一组信号收敛到一个特定的极限,它们的频域表达也一定收敛到那个极限函数的频域表达。

傅里叶变换就像是在信号被完全打乱后,以最不可识别的方式重复信号,所有的信息依然原封不动的存在。如果科幻作家知道这一点,他们本可以制作出更有趣的材料。

在傅里叶变换的所有这些数学性质中,最不寻常的一个是,一个在时域或空域看起来很复杂的信号,通常在频域简单地表示出来。

这里的“简单”是指作为频域中的函数,只集中在很小的区域,大量的值接近于零。

比如下图是一张人脸及其对应的傅里叶变换。可以看出,所有的频域信号几乎都分布在中心周围,周围大部分区域是黑色的。

这是一个很有意义的事实,说明一个似乎占据了空域中所有空的信号,很可能只占据了频域中很小的一个区域,大部分频率都被浪费了。

这就得出了一个非常有用的结论:一个看似拥有大量信息的信号实际上可以用更少的数据来描述。只要先进行傅里叶变换,那么就只能记录不接近零的频域信息,这样就可以大大减少数据量。

基本上,这是当今大多数数据压缩方法的基本思想。互联网时代,需要在尽可能节省带宽和时间的前提下传输大量的多媒体信息,因此数据压缩一直是核心问题之一。

今天,几乎所有流行的数据压缩格式,无论是mp3格式的声音还是jpg格式的图像,都是由傅里叶变换发明的。

从这个意义上说,几乎所有的现代信息社会都是以傅立叶理论为基础的。

这当然是傅立叶本人始料未及的。

傅里叶变换的这种双重关系的本质是以一种完全打乱的方式来叙述一条信息。

如前所述,一个信号可能在空域内容丰富,但在频域重新表达时,在大多数区域往往接近于零。

另一方面,这种关系是对称的:在空域中大多数区域接近于零的信号通常占据频域中的大多数频率。

有没有在空域和频域广泛分布的信号?

是的,最简单的例子就是噪声信号。纯白噪声的傅里叶变换仍然是噪声,因此它广泛分布在空域和频域。如果用信号处理的语言,就意味着“噪声本身是不可压缩的”。

这并不违背直觉,因为信号压缩的本质是通过挖掘信息的结构和规律来更简洁地描述信息,而噪声顾名思义是没有结构和规律的信号,所以不能自然压缩。

另一方面,有没有一个信号在空域和频域的分布很简单?

换句话说,是否存在这样一个函数,它只分布在空之间的几个区域,只占据频域的几个频率?

答案是不存在。这就是所谓的测不准原理。

这个事实有着极其重要的内涵,但它的重要性却不容易马上被注意到。甚至不是很直观:大自然必须限制一个信号在空之间的分布,频率分布不能集中在一起,这似乎不合理。

这个原理可以直观的解释为:所谓的频率本质上反映的是一个长期的全球趋势,所以任何一个单一的频率都必须对应一个在时间上广泛存在的信号空。另一方面,任何只存在于几个区块空的信号都有很多不同的长期发展可能性,因此无法准确推断其频率。

还是以音乐为例吧。声音可以被限制在一个很小的时间间隔内,例如,一个声音只持续一瞬间。声音也可以只有单一频率,比如音叉发出的声音。

但测不准原理告诉我们,这两样东西不能同时成立,一个声音不可能占据很短的时间,拥有非常纯净的音响。当声音的音程短到一定程度,频率就变得不确定,而纯频率的声音音程在时间上不能太短。

所以说“某时刻某音高的声音”是没有意义的。

这看似是一个技术难点,但实际上反映了一个本质的自然规律:任何信息的时间空分辨率和频率分辨率不可能同时无限提高。我们在频率上识别的波越精确,它在空中的位置就越模糊,反之亦然。

这个规律是任何熟悉现代多媒体技术的人都熟悉的,因为它为信号处理建立了牢不可破的边界,在一定程度上指明了它的发展方向。

由于时间空分辨率和频率分辨率不能同时无限小,人们总是可以研究那些时间空分布和频率分布尽可能集中的信号。它们在一定意义上构成了信号的“原子”,并且具有测不准原理所允许的最佳分辨率,而其他所有信号在时间空和频率上都可以分解成这些原子。

这个想法是由D. Gabor在20世纪40年代提出的,成为现代数字信号处理的基本思想,一直影响到今天。

但众所周知,测不准原理本身并不是数学家发明的,而是来自于量子物理学家的洞察力。同一个数学结论能对两个完全不相关的学科产生历史性影响,大概是个罕见的例子。

其实测不准原理不是一个单一的定理,而是一组定理的统称。

基本上,任何描述一个信号不能同时在时间空域和频率域过于集中的命题,都可以称为测不准原理。因为这里的“集中”这个性质,可以用不同的数学来描述,所以对应不同的数学定理。

然而,在所有被称为“测不准原理”的定理中,最著名的是w·海森堡在1927年提出的版本,它深刻地影响了物理学的发展。它的精确数学描述是:

假设一个信号的总能量为1,这个信号的方差与其傅里叶变换能量的乘积不小于1/16 π。

换句话说,他们各自的能量可能集中,但不能同时集中。如果时间空域的能量方差很小,频域的能量方差就不会太小,反之亦然。

详细讨论这个定理在量子物理中的意义超出了本文的范围,该领域有很多相关的工作。然而,以下是一些相关历史事实的简要清单:

海森堡在 1927 年的那篇文章标题为 Ueber den anschaulichen Inhalt der quantentheoretischen Kinematik und Mechanik(《量子理论运动学和力学的直观内容》)。这篇文章很大程度上是对薛定谔 在 1926 年所提出的薛定谔波动方程的回应。相较于海森堡的矩阵力学而言,薛定谔的方程很快由于它物理上的直观明晰而吸引了越来越多物理学家的赞赏。海森堡对此极为失落。在 1926 年 6 月 8 日海森堡写给泡利 的信中他说:「我对薛定谔的理论想得越多我就越觉得恶心。」因此,他迫切需要给他自己的理论配上一幅更直观的图象。 海森堡的这篇文章提出了后来被人们所熟悉的关于为什么无法同时测量一个电子的位置和动量的解释,但是并未给出任何严格的数学证明。他把他的结论笼统地表达为 Δx Δp ≥ ħ,其中 x 是位置,p 是动量,ħ 是普朗克常数。但他并没有详细说明 Δx 和 Δp 的严格意思,只针对若干具体情形做了一些直观的讨论。 第一个从数学上证明不确定性原理的物理学家是 E. Kennard。他在 1927 年证明了文章开头所描述的定理,指出 Δx 和 Δp 的数学意义其实是方差。这种解释很快就成了海森堡不确定性原理的标准数学表达,海森堡本人 1930 年在芝加哥所做的演讲中也使用了这种数学推导来佐证他的立论。需要说明的是,海森堡尽管很快接收了这一数学解释,但是后来人们发现在他本人原先的论文里所举的那些例子中,有很多被他用 Δx 和 Δp 笼统概括的含混概念其实是无法被解释成方差的。在他心目中,不确定性原理首先是一个经验事实,其次才是一个数学定理。 海森堡并未将他的发现命名为不确定性「原理」,而只是称之为一种「关系」。爱丁顿 在 1928 年似乎第一个使用了原理一词,将之称为 principle of indeterminacy,后来 uncertainty principle 这种说法才渐渐流行起来。海森堡本人始终称之为 ungenauigkeitsrelationen / unbestimmtheitsrelationen(相当于英语的 inaccuracy / indeterminacy relations),直到五十年代才第一次接受了 principle 这种叫法。

海森堡

有趣的是,就连很多信号处理或者量子力学的专家都不知道,他们平时讨论的测不准原理其实和对方的是一样的。

两者的关系真的不明显,一个注重信号的时间空和频域分布,一个注重粒子的运动和能量。它们之间的相关性只从数学公式上看起来很明显。

在海森堡的时代,当然没有“信号处理”这个学科,数学家只把测不准原理当作纯数学的结论。不清楚他们第一次注意到这个是什么时候。

据记载,n .维纳1925年在哥廷根的一次演讲中提到了类似的结论,但那次演讲没有纸质材料。

H.韦尔在1928年出版的《群论与量子力学》一书中证明了这一原理,但他将其归因于泡利的发现。

直到1946年,D. Gabor的经典论文《通信理论》才真正使这个定理以今天信号处理领域的专家所熟悉的方式传播开来。

左:Weyl;右:加博尔

如前所述,在数学中,测不准原理不仅仅是海森堡的一个版本,实际上是一组定理的统称。

比如g .哈代在1933年证明了一个类似海森堡原理的定理,今天一般称之为哈代测不准原理。

海森堡定理和哈代定理只是限制了信号在时间空域和频率域的近似分布,并不限制它们同时集中在一个有限的区域内。

M.Benedicks最早证明了信号不可能同时集中在时间空域和频率域的有限区域,这已经是1974年的事了。

到20世纪末,人们对“信号”一词的理解发生了微妙的变化。如果在20世纪上半叶提到一个信号,人们往往会把它理解为一个连续函数。

到今年下半年,信号越来越多地对应于一个离散的阵列。毫无疑问,这是计算机革命的后果。

在这种情况下,“不确定性原则”呈现出新的形式。在连续性的情况下,我们可以讨论一个信号是否集中在某个区域。然而,在离散的情况下,重要的问题变成了信号是否集中在一些离散的位置,而在其他位置为零。数学家给出了这样一个有趣的定理:

长度为n的离散信号有一个非零值,其傅里叶变换有b个非零值,那么a+b ≥ 2 √ n。

也就是说,信号及其傅里叶变换中的非零元素不能太少。毫无疑问,这也是“测不准原理”的一种新形式。

在上面的定理中,如果已知n是素数,那么我们甚至有一个强得多的结论:

一个长度为N的离散信号有一个非零值,它的傅里叶变换有b个非零值,那么a+b >: N .

可惜这里需要“素数”这个条件。对于非质数,第二个命题很容易找到反例,第一个命题已经是可以达到的最好结果。

这些定理有什么用?如果只能用来表明某件事做不到,如其字面意思所反映的,那么它的用处当然是相对有限的。

但是——这无疑是辩证法的一个很好的例子——这样一系列声称“不确定性”的定理,实际上可以用来推导一些“确定性”的事实。

设想这样一种情况:假设我们知道一个信号的总长度为n,我们知道很大一部分值为零,但不知道是哪一部分。同时,我们测量了这个信号在频域中的k个频率值空,但是k

根据传统的信号处理理论,这是不可能的,因为如前所述,频域空中的信息量与原始时域空中的信息量相同,所以要还原所有的信号,就必须知道频域中的所有信息,就像需要多少个方程才能解多少个未知数一样。如果你只知道一部分频域信息,就像只知道k个方程,却要解n个未知数。任何学过初等代数的人都知道,从k

但是借助测不准原理,完全可以做到!

原因是,我们对原始信号有一个假设,即许多位置为零。然后,如果两个不同的信号碰巧具有相同的k个频率值,则这两个信号之间的差的傅立叶变换在这k个频率位置为零。

另一方面,因为两个不同的信号在原始的时间空域中有许多零,所以它们的差在时间空域中也必须包含许多零。测不准原理告诉我们这是不可能的。所以,原来的信号其实是唯一确定的!

这当然是一个非常违反直觉的结论。说明在一定情况下,我们可以用更少的方程求解更多的未知数。这个事情在应用中极其重要。

一个简单的例子就是医用核磁共振技术。MRI本质上是采集人体图像的频域信息,还原空之间的信息。因为采集成本高,所以MRI非常昂贵,消耗资源。

但以上推理表明,其实核磁共振只能采集到很小一部分的频域信息,可以完全还原所有的身体图像,这在医学上是无价的。

今天,类似的想法已经被应用到许多不同的领域,从医学核磁共振和x光断层扫描到石油勘探和卫星遥感。简而言之:不确定性可以使测量成本更低,效果更好,虽然听起来很矛盾。

更糟糕的是,本文开头描述的不确定性定理不够强,频域测量的节约程度不够大。但是从数学上来说是无法改进的。这个僵局是在本世纪初打破的。

E.坎迪斯和陶哲轩证明了一系列新的不确定性原理,这些原理以随机性为代价极大地提高了不等式的强度。他们的定理可以大致描述为:

长度为N的离散信号有一个非零值,其傅里叶变换有b个非零值,所以a+b乘以一个最大概率不小于N/√的常数。

这里的“最大概率”不是一个生命术语,而是对具体概率的精确数学描述。换句话说,尽管在最坏的情况下,不确定性可能相对较小,但这种情况很少发生。总的来说,不确定性总是很大的。因此,它可以在测量方面带来巨大的节约。

当然,这也是一个“不确定性原理”,从某种意义上说,它比原定理更“不确定”,因为它引入了随机性。在他们工作的基础上,近五六年来,一种叫做“压缩传感”的技术如火如荼地发展起来,成为覆盖信号处理、信息提取、医学成像等诸多工程领域的最重要的新兴工程技术之一。

但是这些后续的发展估计远远超出了海森堡的初衷。

本文由超级数学建模编辑整理

数据来自木瑶

1.《不确定性原理 不确定性原理的前世今生 · 数学篇》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《不确定性原理 不确定性原理的前世今生 · 数学篇》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/1752334.html