光子的理论
光子的概念是阿尔伯特爱因斯坦在1905年至1917年间提出的,当时被普遍接受的关于光是电磁波的经典电磁理论无法解释光电效应等实验现象。相对于当时的其他半经典理论在麦克斯韦方程的框架下将物质吸收和发射光的能量量子化,爱因斯坦首先提出光本身就是量子化的,这种光量子(英语:light quantum,德语:das Lichtquant)被称作光子。这一概念的形成带动了实验和理论物理学在多个领域的巨大进展,例如激光、玻色-爱因斯坦凝聚、量子场论、量子力学的统计诠释、量子光学和量子计算等。根据粒子物理的标准模型,光子是所有电场和磁场的产生原因,而它们本身的存在,则是满足物理定律在时空内每一点具有特定对称性要求的结果。光子的内秉属性,例如质量、电荷、自旋等,则是由规范对称性所决定的。
1905年,年轻的科学家爱因斯坦发展了普朗克的量子说。他认为,电磁辐射在本质上就是一份一份不连续的,无论是在原子发射和吸收它们的时候,还是在传播过程中都是这样。爱因斯坦称它们为“光量子”,简称“光子”,并用光量子说解释了光电效应,这成为爱因斯坦获得1921年诺贝尔物理学奖的主要理由。其后,康普顿散射进一步证实了光的粒子性。它表明,不仅在吸收和发射时,而且在弹性碰撞时光也具有粒子性,是既有能量又有动量的粒子。如此,光就既具有波动性(电磁波),也具有粒子性(光子),即具有波粒二象性。后来,德布罗意又将波粒二象性推广到了所有的理论微观粒子。
光子具有能量ε=hν和动量p=hν/c,是自旋为1的玻色子。它是电磁场的量子,是传递电磁相互作用的传播子。原子中的电子在发生能级跃迁时,会发射或吸收能量等于其能级差的光子。正反粒子相遇时将发生湮灭,转化成为几个光子。光子本身不带电,它的反粒子就是它自己。光子的静止质量为零,在真空中永远以光速c运动,而与观察者的运动状态无关。由于光速不变的特殊重要性,成为建立狭义相对论的两个基本原理之一。
与其他量子一样,光子具有波粒二象性:光子能够表现出经典波的折射、干涉、衍射等性质(关于光子的波动性是经典电磁理论描述的电磁波的波动还是量子力学描述的几率波的波动这一问题请参考下文波粒二象性和不确定性原理);而光子的粒子性则表现为和物质相互作用时不像经典的波那样可以传递任意值的能量,光子只能传递量子化的能量。对可见光而言,单个光子携带的能量约为4×10-19J(焦耳),这样大小的能量足以激发起眼睛上感光细胞的一个分子,从而引起视觉。除能量以外,光子还具有动量和偏振态,不过由于有量子力学定律的制约,单个光子没有确定的动量或偏振态,而只存在测量其位置、动量或偏振时得到对应本征值的几率 。
光子的概念也应用到物理学外的其他领域当中,如光化学、双光子激发显微技术,以及分子间距的测量等。在当代相关研究中,光子是研究量子计算机的基本元素,也在复杂的光通信技术,例如量子密码学等领域有重要的研究价值。 到十八世纪为止的大多数理论中,光被描述成由无数微小粒子组成的物质。由于微粒说不能较为容易地解释光的折射、衍射和双折射等现象,笛卡尔(1637年) 、胡克(1665年)和惠更斯(1678年)等人提出了光的(机械)波动理论;但在当时由于牛顿的权威影响力,光的微粒说仍然占有主导地位。十九世纪初,托马斯·杨和菲涅尔的实验清晰地证实了光的干涉和衍射特性,到1850年左右,光的波动理论已经完全被学界接受。1865年,麦克斯韦的理论预言光是一种电磁波,证实电磁波存在的实验由赫兹在1888年完成,这似乎标志着光的微粒说的彻底终结。
然而,麦克斯韦理论下的光的电磁说并不能解释光的所有性质。例如在经典电磁理论中,光波的能量只与波场的能量密度(光强)有关,与光波的频率无关;但很多相关实验,例如光电效应实验,都表明光的能量与光强无关,而仅与频率有关。类似的例子还有在光化学的某些反应中,只有当光照频率超过某一阈值时反应才会发生,而在阈值以下无论如何提高光强反应都不会发生。
与此同时,由众多物理学家进行的对于黑体辐射长达四十多年(1860-1900)的研究因普朗克建立的假说而得到终结,普朗克提出任何系统发射或吸收频率为ν的电磁波的能量总是E = hν(能量=普朗克常数×频率)的整数倍。爱因斯坦由此提出的光量子假说则能够成功对光电效应作出解释,爱因斯坦因此获得1921年的诺贝尔物理学奖。爱因斯坦的理论先进性在于,在麦克斯韦的经典电磁理论中电磁场的能量是连续的,能够具有任意大小的值,而由于物质发射或吸收电磁波的能量是量子化的,这使得很多物理学家试图去寻找是怎样一种存在于物质中的约束限制了电磁波的能量只能为量子化的值;而爱因斯坦则开创性地提出电磁场的能量本身就是量子化的 。爱因斯坦并没有质疑麦克斯韦理论的正确性,但他也指出如果将麦克斯韦理论中的经典光波场的能量集中到一个个运动互不影响的光量子上,很多类似于光电效应的实验能够被很好地解释。在1909年和1916年,爱因斯坦指出如果普朗克的黑体辐射定律成立,则电磁波的量子必须具有p=h/λ(动量=普朗克常数/波长)的动量,以赋予它们完美的粒子性。光子的动量在1926年由康普顿在实验中观测到 ,康普顿也因此获得1927年的诺贝尔奖。
爱因斯坦等人的工作证明了光子的存在,随之而来的问题是:如何将麦克斯韦关于光的电磁理论和光量子理论统一起来呢?爱因斯坦始终未能找到统一两者的理论,但如今这个问题的解答已经被包含在量子电动力学(量子场论)和其后续理论——标准模型中。(即:电磁场的量子化) 早在1900年,M.普朗克解释黑体辐射能量分布时作出量子假设,物质振子与辐射之间的能量交换是不连续的,一份一份的,每一份的能量为ε=hν;1905年阿尔伯特·爱因斯坦进一步提出光波本身就不是连续的而具有粒子性,爱因斯坦称之为光量子;1923年A.H.康普顿成功地用光量子概念解释了X射线被物质散射时波长变化的康普顿效应,从而光量子概念被广泛接受和应用,1926年正式命名为光子。
根据计算:
中子的质量:1.674927211(84)×10-27kg(千克);中子的半径:1.11337557(48)fm(费米);
质子的质量:1.672621637(83)×10-27kg;质子的半径:1.11286448(48)fm;
电子的质量:9.10938215(45)×10-31kg;电子的半径:0.090880914(40)fm;
临界光子的质量:9.347543(38)×10-36kg;临界光子的半径:0.0031349374(29)fm。
临界光子的能量:4.200577(17)×10-19J(焦耳),2.621794(11)eV(电子伏特);
临界光子的频率:6.339470(26)×1014Hz(赫兹);
临界光子的波长:472.8983(20)nm(纳米),正好位于太阳光谱能量辐射的峰值位置。
当光的质量大于临界质量时,很容易被电子所吸收或散射;当光的质量小于临界质量时,不太容易被电子所吸收,即很容易被电子很快发射掉;而处于临界质量附近的光子较容易被电子吸收,并向不同方向发射,由此而形成靑蓝色的天空 。 爱因斯坦在1905年提出的光量子理论在二十世纪的前二十年中多次由不同的实验方法得到证实,这一点在罗伯特·密立根的诺贝尔演讲中有叙述[32]。然而在康普顿实验证明光子具有和其频率成正比的动量之前[30],大多数物理学家都不愿意相信电磁辐射也有粒子性的一面(参见维恩[27]、普朗克[29]、密立根[32]的诺贝尔演讲)。考虑到麦克斯韦理论的高度完备性和正确性,这种质疑是可以理解的,基于这种质疑,很多物理学家都从物质结构中寻找这种吸收或辐射量子化能量的未知原因。玻尔和索末菲等人建立了带有量子化轨道的原子模型,从而能够定性地解释原子谱线和物质吸收或发射光的能量量子化问题;这种原子模型和实际的氢原子符合得相当好,但不适用于其他任何原子。只有当康普顿做了光子被自由电子散射的实验后,光本身即是量子的理论才被广泛接受(由于电子没有内在结构,因此不存在光子在其中不同能级间跃迁的可能)。
即使是在康普顿实验之后,玻尔、克莱默和约翰·斯莱特仍然提出了所谓BKS (Bohr-Kramers-Slater)模型[33],意图在于在麦克斯韦理论的框架下为解释光量子问题做最后的尝试。这个模型的建立是基于两个相当偏激的假设:
物质与电磁辐射的相互作用中,动量和能量的守恒定律只有在取平均时才成立,而在吸收或发射的微小元过程中守恒律不成立;这个假设避免了讨论能级跃迁时出现的能量不连续性,而将其理解为连续释放能量的渐变行为。
因果律被抛弃,例如自发辐射的过程只是一种“虚拟的”电磁场导致的辐射。
尽管如此,在改进的康普顿散射实验中人们得知光子的动量和能量守恒即使是在微小的元过程中也符合得极其好;而在康普顿散射过程中,从电子的震动到新光子的产生,观测到的因果律满足时间达到了10ps(皮秒)。这使得玻尔和他的同行为他们的模型举行了“尽可能光荣的葬礼”[31];不过,BKS模型启发了海森堡的灵感,帮助发展了他的量子力学[34]。
还有少数物理学家曾一直致力于建立电磁场并非量子化的[35],而物质遵守量子力学的半经典模型。尽管到了二十世纪七十年代支持光子说的物理和化学实验依据已经相当丰富,证据可能还是不能被认为绝对确凿;因为这些实验都依赖于光与物质的相互作用,而一个足够复杂的关于物质的量子力学理论则仍然有可能去解释这些实验现象。无论如何,七八十年代进行的光子相关性实验已经完美地否定了所有半经典理论的正确性。这些实验的结果无法用任何经典光学理论解释,因为这些结果涉及到了量子测量过程的抗相关性(anticorrelation)。1974年,约翰·克劳泽(Clauser)首先完成了此类实验[36],他在结果中发现了违反经典的柯西-施瓦茨不等式的情况。1977年,金贝尔(Kimble)等人证实了光子与光分束器作用时类似的抗聚束效应[37],其后格兰杰尔(Grangier)等人在1986年的光子抗相关实验中简化了金贝尔等人的实验方法并消除了实验误差源[38],J. 索恩(J. J. Thorn)等人在2004年将此实验进一步简化[39]。由此,爱因斯坦关于光量子化的假说已经完全得到证实 。
3.光子在引力场中的运动
星光在通过太阳附近时会受到太阳引力的作用而发生弯曲,说明光子也会受到引力的作用。其实光子也有质量,当然会受到引力作用了。通常我们认为:引力场中物质的加速度仅与引力场的强弱有关,而与物质的质量无关。如在地球表面不管是1吨的物体还是1千克的物体,其每秒获得的速度增量都是9.8米/秒。但引力场中光子的加速度与其质量有关:质量越小的光子加速度越大,质量越大的光子加速度越小。既然光子也受引力作用,那么很自然,光子在离开引力场时必然会被减速,在进入引力场时必然会被加速,在垂直于引力方向(或其它方向)运动时受引力影响其运动轨迹也会发生变化。既然光子在离开引力场时会被减速,而且质量越小的光子速度衰减量也越大,那么星体发出的不同频率的光子就有不同的速度。一般而言,星体引力越强,其发出的光速度也越小;当星体引力足够强时甚至可能使一部分光子摆脱不了星体引力的束缚,产生黑洞现象。对同一星体而言,在它发出的光中,质量大的光子速度大,到达地球的时间也越早;质量小的光子速度小,到达地球的时间也越晚。我们通常认为不同频率的光同时到达地球,这其实是错误的。关于这一点我们可以用实验来证实。当星体发生爆发或其它异常时,总是能量较大的X射线或γ射线先被我们观测到,其次才是可见光,然后才是红外线。虽然理论上如此,但在实际观测中总有这样或那样的因素及别的解释使大部分人不相信这一点。如果条件允许的话,我们可以用一个实验来证实我们的观点。在离我们很远的宇宙飞船上以两种不同能量的光子同时发出一种信号,这两种光子的能量差异越大它们到达地球的时间差异也越大。实际上考虑到不同能量的光子在同一介质中的传播速度不同,我们应该想到不同频率的光子在真空中的传播速度也不相同。由于光子在穿越宇宙空间时速度逐渐减小,并且质量小的光子速度衰减得快,可以想象,在经过一段相当长的距离以后,质量小的光子速度已经衰减到零而质量大的光子速度不为零,这样我们就只能观测到质量大的光子。若星体离我们更远一些,则我们只能观测到质量更大的光子……,随着空间距离的增大,最终我们将看不到远处星体发出的光,这个距离就是我们现在认为的宇宙极限--150亿光年。人们在观测宇宙时总有一个错误想法:由于真空中光速不变,所以不管离我们多远的星系,只要足够亮就可以被我们发现。事实上宇宙空间并非真空,光子在其中穿行时速度会逐渐减小,所以任何星系发出的光只能传播一定的距离,也正因为如此,不管我们在宇宙中任何地方,始终只能看到有限的宇宙空间。