现代量子力学笔记8:相对论量子力学
这是樱井纯《现代量子力学》的第八章(相对论量子力学)的课程学习笔记,个人能力有限,如有错误,欢迎指正
通往相对论相对论量子力学之路
这里我们选用自然单位制 $\hbar=c=1$,以及爱因斯坦求和规则
对于相对论量子力学,我们需要结合量子力学基本原理与狭义相对论(或者说洛伦兹对称性)。
而对于我们之前所研究的非相对论量子动力学有:$i\partial_t\left|\psi(t)\right>=H\left|\psi(t)\right>$,如果直接把相对论自由粒子的能量$E_p=\sqrt{\textbf {p}^2+m^2}$ 代入非相对论量子力学的哈密顿量,则有: $$H=m\left[1+\frac{\textbf{p}^2}{m^2}\right]^{\frac{1}{2}}=m+\frac{\textbf{p}^2}{2m}-\frac{\textbf{p}^4}{8m^3}+\cdots$$ 再把该哈密顿量代入薛定谔方程,则: $$i\partial_t\left<\textbf{x}|\psi(t)\right>=\left<\textbf{x}|H|\psi(t)\right>=\left[m+\frac{\nabla^2}{2m}-\frac{\nabla^4}{8m^3}+\cdots\right]\left<\textbf{x}|\psi(t)\right>$$ 观察上式可发现,由于没有平等对待时间与空间,所以出现了无穷阶的空间导数,这破坏了局域性与因果性,也不符合狭义相对论的要求。
Klein-Gordon方程
为了解决这个问题,就要把烦人的根号去掉。所以不妨对时间求两次导数,这样就能得到Klein-Gordon方程: $$-\partial_t^2\left|\psi(t)\right>=i\partial_tH\left|\psi(t)\right>=H^2\left|\psi(t)\right>$$ 即:
$$\left[\partial_t^2-\nabla^2+m^2\right]\psi(\textbf{x},t)=[\partial_\mu\partial^\mu+m^2]\psi(\textbf{x},t)=0$$
其中$\psi(\textbf{x},t)=\left<\textbf{x}|\psi(t)\right>$
可以发现: 若 $x^\mu\longrightarrow\tilde{x}^\mu=\Lambda^\mu_{\upsilon}x^\upsilon$ , 则 $\partial_\mu\partial^\mu+m^2\longrightarrow\tilde{\partial_\mu}\tilde{\partial}^\mu+m^2=\partial_\mu\partial^\mu+m^2$ ,从而可知 $\psi(\textbf{x},t)\longrightarrow\tilde{\psi}(\tilde{\textbf{x}},\tilde{t})=\psi(\textbf{x},t)$ 而这样的方程满足洛伦兹协变性,从而能满足相对论的要求。
洛伦兹协变性(协变就是一起变):即四矢量 $x^\mu$ 做洛伦兹变换,方程也改变(它们一起变),以至于最后方程的形式不变
但是人们很快就发现了三个问题:
-
负能量解:
这里以最简单的平面波解$\psi(\textbf{x},t)=Ne^{-ip^\mu x_\mu}$为例,代入KG方程(Klein-Gordon方程),可得 $$-p^\mu p_\mu+m^2=-E^2+\textbf{p}^2+m^2=0$$ 具有正能解 $E=+\sqrt{\textbf{p}^2+m^2}$ 和负能解 $E=-\sqrt{\textbf{p}^2+m^2}$
而这个负能解曾是一个巨大的问题,因为当$\textbf{p}\rightarrow \infty$时,负能解$E\rightarrow-\infty$,这会使体系没有稳定基态,从而真空不稳定。
-
氢原子能级 $\alpha ^4$ 项与实验不符:
若引入电磁相互作用,KG方程将变为: $$\left[(i\partial_t-e\Phi )^2-(i\nabla+e\textbf{A})^2-m^2\right]\psi(\textbf{x},t)=0$$ 应用于氢原子中的电子 $\textbf{A}=0,e\Phi=-\frac{e^2}{r}$ ,可得: $$ E= m[1-\frac{\alpha ^2}{2n ^2}-\frac{\alpha ^4}{2n ^4}(\frac{n}{l+\frac{1}{2}}-\frac{3}{4})+ \cdots] $$ 而$\alpha ^4$ 项与实验不符合。
实际上KG方程是以无自旋粒子情况进行构建的,也就是说KG方程不能描述有自旋的粒子,如电子。
-
概率不守恒或概率非正定:
因为KG方程 $-\partial_t^2\left|\psi(t)\right>=H^2\left|\psi(t)\right>$ 为时间的二阶微分方程,那么右矢$\left|\psi(t)\right>$并不能完全确定,还需要$\partial_t\left|\psi(t)\right>$,而这与五大公设之一的薛定谔方程公设$i\partial_t\left|\psi(t)\right>=H\left|\psi(t)\right>$所要求初值情况并不一样,多了一个自由度,这会导致要么概率不守恒,要么出现非正定的概率密度。
-
概率不守恒:
如果我们类比非相对论力学定义概率密度为:$\rho(\textbf{x},t)=\psi^* \psi$ (这样的概率密度一定是正定的),而概率流密度定义为: $\textbf{j}=\frac{1}{m}Im(\psi^*\nabla\psi)$ 。 这样依照KG方程,我们并不能得到概率守恒: $\partial_t\rho+\nabla\cdot \textbf{j}=0$
-
非正定概率密度:
为了解决概率不守恒的问题,我们不妨改变概率密度的定义,使其与概率流密度构成一个四矢量,这样概率守恒公式也会变得协变,即令
$$j^\mu=\frac{i}{2m}[\psi^* \partial^\mu\psi-(\partial^\mu\psi)^*\psi]$$
则 $\rho(\textbf{x},t)=j^0(\textbf{x},t)=\frac{i}{2m}[\psi^* \partial_t\psi-(\partial_t\psi)^* \psi]$,但是这样定义虽然满足了概率守恒,但概率密度却变成了非正定的,也就是说在某些位置粒子出现的概率可能是负数。
-
总体而言,KG方程满足了相对论,但不满足量子力学。
为了行文流畅,这里略去书中对Klein-Gordon方程的修正,而直接转到Dirac方程。
Dirac方程
为了解决KG方程的种种问题(尤其是负概率),Dirac提出了另一种解决办法,将二阶微分的KG方程变为一阶。 首先波动方程必须是对时间一阶微分方程,而相对论也要求它是对空间的一阶微分方程,那么不妨假定,对固有质量为$m$的自由粒子有:
$$i\partial_t\psi(\textbf{x},t)=(-i\boldsymbol{\alpha}\cdot\nabla+\beta m)\psi(\textbf{x},t)$$
即令$H=\boldsymbol{\alpha\cdot p}+\beta m$
注意:这里的常系数 $\boldsymbol{\alpha}$ 和 $\beta$ 均不是普通的矢量和数,否则方程不能满足协变性。
$\boldsymbol{\alpha}$的分量和$\beta$均为$N\times N$矩阵,且为了保证$H$的厄米性,它们都是厄米矩阵。而波函数可看作多分量的旋量$\psi(\textbf{x},t)= \begin{pmatrix} \psi_1 \\ \psi_2\\ \vdots\\ \psi_N \end{pmatrix} $
为了让上方程能回到KG方程,我们做下面尝试: $$(i\partial_t)^2\psi(\textbf{x},t)=(-i\boldsymbol{\alpha}\cdot\nabla+\beta m)^2\psi(\textbf{x},t)$$ 即 $$-\partial_t^2\psi(\textbf{x},t)=[-\frac{1}{2}(\alpha^i\alpha^j+\alpha^j\alpha^i)-im(\alpha^i\beta+\beta\alpha^i)\partial_i+m^2\beta^2]\psi(\textbf{x},t)$$
这里采用了爱因斯坦求和规则
为了使上式子能与KG方程$[\partial_\mu\partial^\mu+m^2]\psi(\textbf{x},t)=0$一致,那么就要满足: $$\alpha^i\alpha^j+\alpha^j\alpha^i=2\delta_{ij}\textbf{1}\ ,\alpha^i\beta+\beta\alpha^i=0\ ,\beta^2=\textbf{1}$$ 以及$(\alpha^i)^2=\textbf{1}$,还有由厄米性所要求的$(\alpha^i)^\dagger=\alpha^i\ ,\beta^\dagger=\beta$
Dirac $\gamma$矩阵
为了将上式子的协变性体现得更明显,不妨定义Dirac $\gamma$矩阵:令 $\gamma^0=\beta,\gamma^i=\beta\alpha^i=\gamma^0\alpha^i$
那么原方程$i\partial_t\psi(\textbf{x},t)=(-i\boldsymbol{\alpha}\cdot\nabla+\beta m)\psi(\textbf{x},t)$,将变为Dirac方程: $$(i\gamma^\mu\partial_\mu-m\textbf{1})\psi(\textbf{x},t)=0$$ 其中$\gamma^\mu,\mu=0,1,2,3$,是四个$N\times N$的常数矩阵,且满足Clifford代数,即: $$\frac{1}{2}(\gamma^\mu\gamma^\upsilon+\gamma^\upsilon\gamma^\mu)\equiv\frac{1}{2}\{\gamma^\mu,\gamma^\upsilon\}=\eta^{\mu\upsilon}\textbf{1}$$
其中,$\eta ^{\mu \upsilon} = \begin{pmatrix} 1& & & \\ &-1& & \\ & &-1& \\ & & &-1 \end{pmatrix} $,为度规张量。
即$(\gamma^0)^2=-(\gamma^i)^2=\textbf{1}, \text{for}\ \mu\ne\upsilon\ ,\gamma^\mu\gamma^\upsilon=-\gamma^\upsilon\gamma^\mu$ 或者更直接点$\gamma^\mu ,\gamma ^\upsilon$有关系:$\gamma^\mu\gamma^\upsilon=2\eta^{\mu\upsilon}-\gamma^\upsilon\gamma^\mu$
并且由于 $\boldsymbol{\alpha},\beta$ 的厄米性,有 $(\gamma^0)^\dagger=\gamma^0,(\gamma^i)^\dagger=(\beta\alpha^i)^\dagger=\alpha^i\beta=-\beta\alpha^i=-\gamma^i$
-
$\gamma^\mu$矩阵的性质:
由$\gamma^0\gamma^1=-\gamma^1\gamma^0\Rightarrow\gamma^0\gamma^1\gamma^1=-\gamma^1\gamma^0\gamma^1\Rightarrow\gamma^0=\gamma^1\gamma^0\gamma^1$,而上标1换成2或3也成立,所以$\gamma^0=\frac{1}{3}\gamma^i\gamma^0\gamma^i$。那么$tr(\gamma^0)=\frac{1}{3}tr(\gamma^i\gamma^0\gamma^i)=\frac{1}{3}tr(\gamma^0\gamma^i\gamma^i)=-tr(\gamma^0)\Rightarrow tr(\gamma^0)=0$。
此外,$\gamma^0\gamma^i=-\gamma^i\gamma^0\Rightarrow\gamma^i=-\gamma^0\gamma^i\gamma^0\Rightarrow tr(\gamma^i)=-tr(\gamma^0\gamma^i\gamma^0)=-tr(\gamma^i\gamma^0\gamma^0)=-tr(\gamma^i)$,即 $tr(\gamma^i)=0$
即矩阵$\gamma^\mu$的迹为零
又 $ \text{for}\ \mu\ne\upsilon\ ,\gamma^\mu\gamma^\upsilon=-\gamma^\upsilon\gamma^\mu=(-\textbf{1})\gamma^\upsilon\gamma^\mu$,对该式求行列式值,则
$$det(\gamma ^\mu) \cdot det(\gamma ^\upsilon)=(-1) ^N det(\gamma ^\upsilon) \cdot det(\gamma ^\mu)$$
而等式成立则要求:$(-1) ^N =1$ 。所以$\gamma^0$和$\gamma^i$都是偶数维矩阵,即$N=$ 偶数。
但是因为独立的$2\times2$矩阵 $\textbf{1},\sigma_1,\sigma_2,\sigma_3$ 只有三对是互相反对易(即不满足Clifford代数),所以$N\ne2$。因此$N=4$是最小的能实现Clifford代数的维数,而Dirac最早构建时所采用的自旋$\frac{1}{2}$粒子的$\gamma^\mu$矩阵正好是4维的,所以简单起见,以下的讨论均取$N=4$
-
Dirac $\gamma ^\mu$ 矩阵的4维表示:
满足上面 $\gamma ^\mu$ 矩阵性质的4维矩阵表示不止一种,这里不妨选取 Dirac 表示,即以 $\gamma ^0$ 为对角阵的表示。所以 $\gamma ^0$ 可表示为: $$ \gamma ^0= \begin{pmatrix} \lambda _1 \\ & \lambda _2\\ & & \lambda _3\\ & & & \lambda _4 \end{pmatrix} $$
而考虑到: $$ (\gamma ^0) ^2 = \begin{pmatrix} (\lambda _1) ^2 \\ & (\lambda _2) ^2\\ & & (\lambda _3) ^2\\ & & & (\lambda _4) ^2 \end{pmatrix}= \textbf{1} $$
所以 $\gamma ^0$ 的本征值只能取 $\pm 1$,且其迹为零,所以不妨令 $ \gamma ^ 0$ 矩阵为: $$ \gamma ^0= \begin{pmatrix} I & 0 \\ 0 & - I \end{pmatrix} $$
而其他的 $\gamma ^\mu$ 矩阵由其性质,则可得
$$ \boldsymbol{\gamma}= \begin{pmatrix} 0 & \boldsymbol{\sigma} \\ -\boldsymbol{\sigma} & 0 \end{pmatrix} $$
所以 Dirac 表示下有 $\beta=\begin{pmatrix}I&0 \\ 0&-I\end{pmatrix}$,而 $\boldsymbol{\alpha}=\begin{pmatrix}0 & \boldsymbol{\sigma} \\ \boldsymbol{\sigma}&0\end{pmatrix}$
其中 $I= \begin{pmatrix} 1 & 0 \\ 0 & 1\end{pmatrix}$ 为 $2 \times 2$ 的单位矩阵,$0= \begin{pmatrix} 0 & 0 \\ 0 & 0\end{pmatrix}$ 为 $2 \times 2$ 的零矩阵,
而 $\boldsymbol{\sigma}=(\sigma _1,\sigma _2, \sigma _3)$ ,其中 $\sigma _i , , , i=1,2,3$ 为泡利矩阵。
此外,还要定义 $$\gamma ^5 \equiv i \gamma ^0 \gamma ^1 \gamma ^2 \gamma ^3 = \begin{pmatrix} 0 & I \\ I & 0 \end{pmatrix} $$
这里定义$\gamma ^5$而不是$\gamma ^4$ ,据说是因为以时间为虚数的那一套度规之中,没有$\gamma ^0$,取而代之的是$\gamma ^4$。因此为了防止与此混淆,所以只能定义$\gamma ^5$。
负概率的解决
我们来看Dirac方程解决的第一个问题:负概率
定义 $\bar{\psi} \equiv \psi ^\dagger \gamma ^0$,则 $(i\gamma^ \mu\partial_\mu-m)\psi(x^\mu)=0\Rightarrow i \bar{\psi} \gamma ^\mu \partial _\mu \psi - m \bar{\psi} \psi = 0$
若取共轭,则变为 $-i(\partial _\mu \psi^\dagger) (\gamma^ \mu)^\dagger -m\psi^\dagger=0\Rightarrow-i(\partial _\mu \psi ^\dagger)(\gamma^ \mu)^\dagger \gamma ^0 -m \bar{\psi}=0 \Rightarrow i(\partial _\mu \psi ^\dagger \gamma ^0)\gamma^ \mu +m \bar{\psi}=0$ ,再右乘 $\psi$ ,得 $i (\partial _\mu \bar{\psi}) \gamma ^\mu \psi + m \bar{\psi} \psi = 0$
上面用到了$(\gamma^ \mu)^\dagger \gamma ^0 = \gamma ^0 \gamma^ \mu$
上面得到的两结果 $i \bar{\psi} \gamma ^\mu \partial _\mu \psi - m \bar{\psi} \psi = 0$ 和 $i (\partial _\mu \bar{\psi}) \gamma ^\mu \psi + m \bar{\psi} \psi = 0$ 相加,可得 $ \partial _\mu (\bar{\psi}\gamma ^\mu \psi)=0$
这里我们定义四维概率流密度为 $j ^\mu = (\rho,\textbf{j})= \bar{\psi} \gamma ^\mu \psi$ ,那么概率守恒方程为:
$$ \partial _\mu j ^\mu =\partial _t \rho + \nabla \cdot \textbf{j}=0$$
概率流密度: $\textbf{j}= \bar{\psi} \boldsymbol{\gamma} \psi=\psi ^\dagger \gamma ^0 \gamma ^0 \boldsymbol{\alpha} \psi =\psi ^\dagger \boldsymbol{\alpha} \psi$
概率密度:$\rho = \bar{\psi} \gamma ^0 \psi= \psi ^\dagger \gamma ^0 \gamma ^0 \psi= \psi ^\dagger \psi > 0$ ,即正定
也就是说Dirac方程避免了KG方程所具有的负概率问题。
Dirac方程的洛伦兹协变性
洛伦兹协变性指方程在洛伦兹变换下保有原来的形式的性质,对于Dirac方程就是说:$(i\gamma^\mu\partial_\mu-m)\psi(\textbf{x},t)=0$,在洛伦兹变换$x^\mu\rightarrow\tilde{x}^\mu=\Lambda^\mu_\upsilon x^\upsilon$下,变为$(i\gamma^\mu \tilde{\partial}_\mu-m) \tilde{\psi}( \tilde{\textbf{x}},\tilde{t})=0$。
接下来来探究要使协变性成立 $\gamma^\mu$ 矩阵要满足什么:
首先 $\tilde{\partial} _ \mu=\frac{\partial}{\partial\tilde{x}^\mu} = (\Lambda^{-1}) ^{\upsilon} _ \mu \partial_ \upsilon \Rightarrow \partial _ \mu=\Lambda ^\upsilon _ \mu \tilde{\partial} _ \upsilon $;而常数矩阵 $\gamma^\mu$ 因为不含 $x^\mu$ 所以不随参考系变化;最后 $\tilde{\psi}(\tilde{x^\mu}) = D(\Lambda)\psi(x^\mu)$ 。
其中 $D(\Lambda)$ 是 $4 \times 4 $ 矩阵,为洛伦兹群的4维旋量表示,且由 $\psi(x^\mu)=D^{-1}(\Lambda)\tilde{\psi}(\tilde{x}^\mu)=D^{-1}(\Lambda)\tilde{\psi}(\Lambda^\mu_\upsilon x^\upsilon)$ 和 $\psi(x^\mu)=D(\Lambda^{-1})\tilde{\psi}(\Lambda^\mu_\upsilon x^\upsilon)$ ,可得$D(\Lambda^{-1})=D^{-1}(\Lambda)$
那么,把 $\psi(x^\mu)=D^{-1}(\Lambda)\tilde{\psi}(\tilde{x}^\mu)$ 代入 $(i\gamma^ \mu\partial_\mu-m)\psi(x^\mu)=0$,且令等式两边同乘 $D(\Lambda)$ ,可得:
$$ \begin{align*} &D(\Lambda)(i\gamma^\mu\partial_\mu-m)D^{-1}(\Lambda)\tilde{\psi}(\tilde{x}^\mu)=0\\ \Rightarrow &[iD(\Lambda)\gamma^\mu D^{-1}(\Lambda)\partial_\mu-m]\tilde{\psi}(\tilde{x}^\mu)=0 \end{align*} $$
上结果与 $(i\gamma^\mu\tilde{\partial}_\mu-m)\tilde{\psi}(\tilde{\textbf{x}},\tilde{t})=0$ 对比,可得:
$$D(\Lambda)\gamma^\mu D^{-1}(\Lambda)=(\Lambda^{-1})^\mu_\upsilon\gamma^\upsilon$$
Clifford代数 $\frac{1}{2}(\gamma^\mu\gamma^\upsilon+\gamma^\upsilon\gamma^\mu)\equiv\frac{1}{2}\{\gamma^\mu,\gamma^\upsilon\}=\eta^{\mu\upsilon}\textbf{1}$,在洛伦兹变换下不变。
Dirac方程与自旋
我们考虑洛伦兹变换下一个普通右矢的变化为:$\left|\alpha(t)\right> \rightarrow U(\Lambda) \left|\alpha(t)\right>$ ,接着来看$U(\Lambda)$ 与 $D(\Lambda)$ 的关系:
$$ \psi _a (x)= \left<\textbf{x},a|\alpha(t) \right> \rightarrow \left<\textbf{x},a|U(\Lambda)|\alpha(t) \right>=\tilde{\psi} _a(x)=[D(\Lambda)] _{ab} \psi _b (\Lambda ^{-1} x) $$
注意这里的爱因斯坦求和规则,且上面用到了 $\tilde{\psi}(\tilde{x})=D(\Lambda)\psi(x)=D(\Lambda)\psi(\Lambda ^{-1} \tilde{x}) \Rightarrow \tilde{\psi}(x)=D(\Lambda)\psi(\Lambda ^{-1}x)$
这里我们先考虑无穷小变换 $\Lambda ^\mu _\upsilon = \sigma ^\mu _\upsilon + \omega ^\mu _\upsilon$
由 $\eta _{\rho \sigma} \Lambda ^\rho _\mu \Lambda ^\sigma _\upsilon = \eta _{\mu \upsilon}$,可定义 $\omega _{\mu \upsilon} \equiv \eta _{\mu \alpha} \omega ^\alpha _\upsilon = - \omega _{\upsilon \mu}$
那么 $D(\Lambda = \textbf{1} + \omega)=\textbf{1}-\frac{i}{2}\omega _{\alpha \beta} S ^{\alpha \beta}$
其中 $S ^{\alpha \beta}$ 是 $D(\Lambda)$ 的生成元,且$S ^{\alpha \beta}=-S ^{\beta \alpha}$
将上式代入 $D(\Lambda)\gamma^\mu D^{-1}(\Lambda)=(\Lambda^{-1})^\mu_\upsilon\gamma^\upsilon$ ,则可得
$$ [\gamma ^\mu,S ^{\alpha \beta}] = i(\eta ^{\mu \alpha} \gamma ^\beta - \eta ^{\mu \rho} \gamma ^\alpha) $$
再考虑Clifford代数以及归一化 $det|D(\Lambda)|=1$ ,最终可得生成元为: $$ S ^{\alpha \beta}= \frac{i}{4}[\gamma ^\alpha ,\gamma ^ \beta] $$
再回到波函数在无穷小洛伦兹变换下的情形,那么,
$$ \begin{align*} \tilde{\psi}(x ^\mu) &=(\textbf{1}-\frac{i}{2} \omega _{\alpha \beta}S ^{\alpha \beta})\psi (x ^\mu - \omega ^\mu _\upsilon x ^\upsilon) \\ &= (\textbf{1}-\frac{i}{2}\omega _{\alpha \beta}S ^{\alpha \beta}-\omega _{\alpha \beta}x ^ \beta \partial ^\alpha)\psi (x ^\mu) \end{align*} $$
接下来,我们想得到洛伦兹变换下的总角动量,所以只考虑空间转动就行,即令洛伦兹 boost 参数为 $\omega _{0i}=0$。而转动参数不妨令为:$\omega _{ij}=\epsilon ^{ijk} n ^k d\phi$,令 $\hat{\textbf{n}}=(n ^1,n ^2,n^3)$ 。
而同时可发现,若令 $S ^k \equiv \frac{1}{2}\epsilon ^{ijk} S ^{ij}$ ,则转动生成元 $ S ^{ij} = \epsilon ^{ijk} S^k$ ,而生成元 $ S ^{ij} $ 只有三个独立分量,即 $S ^1=S ^{23},S ^2=S ^{31},S ^3=S ^{12}$ ,不妨用这三个独立分量定义一个矢量 $\textbf{S}=(S ^{23},S ^{31},S ^{12})$
若考虑其在4维Dirac表示下的矩阵,那么由 $[\sigma ^i ,\sigma ^j]=2i \epsilon ^{ijk}\sigma ^k$ ,可得:
$$ \textbf{S}= \frac{1}{2} \boldsymbol{\Sigma}=\frac{1}{2} \begin{pmatrix} \boldsymbol{\sigma} & 0 \\ 0 & \boldsymbol{\sigma} \end{pmatrix} $$
把该矢量代入波函数在无穷小洛伦兹空间转动的情形,则可得:
$$ \tilde{\psi}(x)=[\textbf{1}-i\textbf{S}\cdot \hat{\textbf{n}} d\phi -(\textbf{x}\times \nabla) \cdot \hat{\textbf{n}} d\phi] \psi(x) $$
那么有限洛伦兹空间转动则为:
$$ \tilde{\psi}(x)=e ^{-i[\textbf{x}\times (-i\nabla) + \textbf{S}]\cdot \hat{\textbf{n}} d\phi}\psi(x) \equiv e ^{-i\textbf{J} \cdot \hat{\textbf{n}} d\phi}\psi(x) $$
最终可推得,总角动量为:
$$ \textbf{J} = \textbf{x}\times (-i\nabla) + \frac{1}{2} \boldsymbol{\Sigma}= \textbf{L}+\textbf{S} $$
正如实验中所显示的,电子存在着内禀的自旋 $\textbf{S}$。
也就是可以从Dirac方程出发,以理论的角度推出自旋的存在,且自旋是一种相对论效应。
Dirac方程的自由粒子解
虽然我们在之前定义了 $4 \times 4$ 的矩阵以及旋量,但是它们具体的物理意义似乎还是不够明显,所以这里以自由粒子为例,给出$H$的本征值及本征态。
自由粒子的色散关系(能量与动量关系)为:$E ^2=\textbf{p} ^2+m ^2=E ^2 _p \Rightarrow E = \pm E _p$
这里令 $\textbf{p}=p \hat{\textbf{z}}$,那么$H= \gamma ^0 \gamma ^3 p +\gamma ^0 m$
再定义螺旋度算符:
$$\textbf{S} \cdot \textbf{p}=\frac{p}{2}\Sigma _z=\frac{p}{2} \begin{pmatrix} \sigma _3 & 0 \\ 0 & \sigma _3 \end{pmatrix}$$
则在动量表象的能量本征方程 $H\psi=E\psi$ 为:
$$ \begin{pmatrix} m & 0 & p & 0\\ 0 & m & 0 & -p\\ p & 0 & -m & 0\\ 0 & -p& 0 & -m \end{pmatrix} \begin{pmatrix} u _1\\ u _2\\ u _3\\ u _4 \end{pmatrix} = E \begin{pmatrix} u _1\\ u _2\\ u _3\\ u _4 \end{pmatrix} $$
可解得本征态有:
-
正能解 $E = + E _p$:
$$u ^{(+)} _R (p)=\begin{pmatrix} 1\\ 0\\ \frac{p}{E _p +m}\\ 0\end{pmatrix},u ^{(+)} _L (p)=\begin{pmatrix} 0\\ 1\\ 0\\ \frac{-p}{E _p +m}\end{pmatrix}$$
且有 $\textbf{S}\cdot \textbf{p} u ^{(+)} _R (p)=+u ^{(+)} _R (p) \ ,\textbf{S}\cdot \textbf{p} u ^{(+)} _L (p)=-u ^{(+)} _L (p)$
$u ^{(\pm)} _{R,L} (p)$ 的上标 $(\pm)$ 表示正或负能解,下标 $R,L$ 表示右手或左手性(或者说,正或负螺旋度)。
-
负能解 $E = - E _p$:
$$u ^{(-)} _R (p)=\begin{pmatrix} \frac{-p}{E _p +m}\\ 0\\ 1\\ 0\end{pmatrix},u ^{(-)} _L (p)=\begin{pmatrix} 0\\ \frac{p}{E _p +m}\\ 0\\ 1\end{pmatrix}$$
且有 $\textbf{S}\cdot \textbf{p} u ^{(-)} _R (p)=+u ^{(-)} _R (p) \ ,\textbf{S}\cdot \textbf{p} u ^{(-)} _L (p)=-u ^{(-)} _L (p)$
在 $\textbf{p}=p \hat{\textbf{z}}$ 的情况下,$ u _R$ 与 $u _L$ 分别也是 $S _z=\textbf{S}\cdot \hat{\textbf{p}}$ 所对应不同本征值的本征态。也就是说在正负能解的情况下,自旋也提供了一个自由度,使自旋 $\frac{1}{2}$ 的自由粒子在动量表象下呈现为4维。
可见负能解释构成解完备性的一部分,不可或缺。
-
负能态的解释:
为消除负能态引发的真空不稳定性,Dirac 提出如下的解释:
- 所有负能态都被填满,形成“负能海”,Pauli不相容原理阻止正能电子向负能态跃迁。
- “负能海”的无穷能量与无穷电荷背景不能被人们观测到。
- 高能粒子(比如 $\gamma$ 光子)可能从海中激发出⼀个正能电子,留下一个空穴,相当于⼀个具有相同质量与自旋,但相反电荷的粒子,即正电子。
- 电子向负能态跃迁,填满空穴,释放出高能光子,看作是正负电子湮灭成光子。
-
氢原子能级 $\alpha ^4$ 项:
引入电磁相互作用,$\partial _\mu \rightarrow D _\mu=\partial _\mu+ieA _\mu , A _\mu=(\Phi,-\textbf{A})$。
则带电的Dirac方程为:
$$(i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m)\psi=0$$
应用于氢原子 $\textbf{A}=0,e\Phi=-\frac{e ^2}{r} $ , 可解出氢原子展开至 $\alpha ^4$项的能级为:
$$E= m[1-\frac{\alpha ^2}{2n ^2}-\frac{\alpha ^4}{2n ^4}(\frac{n}{j+\frac{1}{2}}-\frac{3}{4})+ \cdots]$$
此结果的 $\alpha ^4$项与实验结果一致。若要进一步解除关于 $l$ 的简并,就要考虑兰姆位移的辐射修正。
Dirac 方程的对称性
空间转动
自由粒子的Dirac方程满足洛伦兹对称性,包含了空间转动对称性,因此角动量守恒,即 $[H,\textbf{J}]=0$
宇称
宇称变换对应的广义洛伦兹变换矩阵为: $$ \Lambda ^\mu _\upsilon= \begin{pmatrix} 1 & 0 & 0 & 0\\ 0 & -1 & 0 & 0\\ 0 & 0 & -1 & 0\\ 0 & 0& 0 & -1 \end{pmatrix} \equiv \mathscr P ^\mu _\upsilon $$
协变的Dirac方程在宇称变换下不变,则反射态可看作由特殊的洛伦兹变换所得,有:
$$ \psi _P (t,\textbf{x}) =D(\mathscr{P})\psi (t,-\textbf{x})=D(\mathscr{P})\pi \psi(t,\textbf{x}) =\mathbb P \psi (t,\textbf{x}) $$
也就是说 $\mathscr{P}$ 属于洛伦兹变换,且 $\psi _P (t,\textbf{x})\equiv \left<\textbf{x}|U(\mathscr P ) |\alpha (t)\right>=\mathbb P \psi (t,\textbf{x})$
又由$D ^{-1}(\mathscr{P})\gamma ^\mu D(\mathscr{P})=\mathscr{P} ^\mu _\upsilon \gamma ^\upsilon$,且 $D ^2(\mathscr{P})=\textbf{1}$
最终可得,$D(\mathscr{P})=\gamma ^0 \ ,\mathbb{P}=\gamma ^0 \pi$
电荷共轭
这里我们定义电荷共轭变换:粒子$\rightarrow$反粒子,质量不变,电荷$q\rightarrow -q$。
接下来我们寻找一个电荷共轭算符,它可以使粒子的波函数变为反粒子的波函数。
由Dirac方程求其共轭: $$ (i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m)\psi(t,\textbf{x})=0\\ \Downarrow \\ (-i(\gamma ^\mu) ^* \partial _\mu -e(\gamma ^\mu)^* A _\mu-m)\psi ^*(t,\textbf{x})=0 $$
接下来定义一个矩阵$\tilde{C}$ ,它满足 $\tilde{C}(\gamma ^\mu) ^\mu \tilde{C} ^{-1}=-\gamma ^\mu$,将它作用于Dirac的共轭方程:
$$ \tilde{C} (-i (\gamma ^\mu) ^ * \partial _ \mu -e(\gamma ^\mu) ^ * A _\mu-m) \tilde{C} ^{-1} \tilde{C} \psi ^ * (t,\textbf{x})=0\\ \Downarrow \\ (i \gamma ^\mu \partial _\mu +e \gamma ^\mu A _\mu-m) \tilde{C} \psi ^ * (t,\textbf{x})=0$$
所以 $\tilde{C} \psi ^ * (t,\textbf{x})$ 就是反粒子的波函数,且不难发现$\tilde{C}=i \gamma ^2 \ , \tilde{C}\psi ^ * =i\gamma ^2 (\bar{\psi} \gamma ^0)^T=i\gamma ^2 \gamma ^0 (\bar{\psi}) ^T$
注意:这里的 $\gamma ^2$ 不是 $\gamma$ 平方
因此可以定义电荷共轭算符 $\mathbb{C}=i \gamma ^2 K$ ,所以电荷共轭变换有: $$ \psi \rightarrow \psi _C \equiv \mathbb{C} \psi =i \gamma ^2 \psi ^* =i \gamma ^2 \gamma ^0 (\bar{\psi}) ^T $$
其中 $K$ 为复共轭算符:$K\psi=\psi ^*$
时间反演
时间反演对应的广义洛伦兹变换矩阵为:
$$ \Lambda ^\mu _\upsilon= \begin{pmatrix} -1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0& 0 & 1 \end{pmatrix} \equiv \mathscr T ^\mu _\upsilon $$
-
对自由Dirac方程:
自由的Dirac方程 $(i\gamma ^\mu \partial _\mu-m)\psi(t,\textbf{x})=0$ 在时间反演变换下不变,则此时时间反演后的波函数可看作特殊的洛伦兹变换所得,即: $$ \tilde{\psi}(t,\textbf{x})=D(\mathscr{T}) \psi (-t,\textbf{x}) =\mathbf{T} \psi(t,\textbf{x}) $$
又由$D ^{-1}(\mathscr{T})\gamma ^\mu D(\mathscr{T})=\mathscr{T} ^\mu _\upsilon \gamma ^\upsilon$,且 $D ^2(\mathscr{T})=\textbf{1}$,所以:
$$D(\mathscr{T})=-i \gamma ^1 \gamma ^2 \gamma ^3 \ ,\mathbf{T}=-i \gamma ^1 \gamma ^2 \gamma ^3 T^0$$
其中 $ T ^0 \psi (t,\textbf{x})=\psi (-t,\textbf{x})$
-
对带电Dirac方程:
但是若考虑带电的Dirac方程 $(i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m)\psi(t,\textbf{x})=0$,它在时间反演下,若取反演后的波函数为 $\tilde{\psi}$ ,则并不协变。
因为若 $t \rightarrow -t$ ,则 $i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m \rightarrow -i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A}$ ,而 $(-i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A})\tilde{\psi} \ne 0$
则我们需要构建一个时间反演算符 $\mathbb{T}$,或一个时间反演态 $\psi _T(t,\textbf{x})$,使下面成立: $$ \psi _T(t,\textbf{x})=\mathbb{T} \psi (t,\textbf{x}) ,(-i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A})\psi _T = 0 $$
而这里我们可以发现若取电荷共轭的公式: $$ (i \gamma ^\mu \partial _\mu +e \gamma ^\mu A _\mu-m) \psi _C(t,\textbf{x})=0 $$
再将 $\mathbf{T}$ 作用于其上,则: $$ \mathbf{T}(i \gamma ^\mu \partial _\mu +e \gamma ^\mu A _\mu-m)\mathbf{T} ^{-1} \mathbf{T} \psi _C(t,\textbf{x})=0\\ \Downarrow\\ (-i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A})\mathbf{T} \psi _C(t,\textbf{x}) = 0 $$ 所以可以定义时间反演态为: $$ \psi _T (t,\textbf{x}) =D(\mathscr{T})\psi _C (-t,\textbf{x})=D(\mathscr{T}) \mathbb{C} T ^0 \psi(t,\textbf{x}) \equiv \mathbb{T}\psi(t,\textbf{x}) $$
最终可得,$\mathbb{T}=\gamma ^1 \gamma ^3 K T ^0$
电荷共轭-宇称-时间反演(CPT)联合对称性
若Dirac方程具有CPT对称性,则经过CPT变化后, $$ \psi(t,\textbf{x}) \rightarrow \psi _{CPT}(t,\textbf{x})=\mathbb{CPT}\psi(t,\textbf{x})\equiv \gamma ^5 \psi(-t,-\textbf{x}) $$
局限性与新的理论
-
Dirac理论的局限性:
- 关于单个粒子的运动方程,结果却要依靠多粒子背景(即填满的负能海)来回避负能态的问题。
- 其出发点(对正概率密度的分析)排除了任何自旋为0的粒子,但是 $\pi ^-$原子实验结果却与KG方程一致。
- 玻色子不遵循Pauli不相容原理,无法保持其稳定性,也无法用空穴理论描述其反粒子。
所以Dirac理论作为关于单粒子对相对论量子力学基本理论是不成功的,但可以作为费米子在低能标下的近似。
-
相对论性波动方程的局限性:
此外,相对论性波动方程(即KG方程与Dirac方程)都存在因果关的系破坏,这也不得不使我们放弃相对论性波动方程,从而寻找其他理论。
虽然KG方程与Dirac方程两者都并不能完美的解释相对论量子力学,但它们在构建真正适用的理论过程中起着重要作用。
-
量子力学中的空间与时间不对等:
在找寻新理论前,我们不妨考虑一下为什么建立相对论量子力学如此复杂。
在量子力学中,空间坐标 $\textbf{x}$ ,为厄米算符或者算符的本征值,但时间 $t$ 只是参数或标记。也就是在量子力学中,空间与时间不对等。但狭义相对论却要求空间坐标与时间对等处理。
-
结合量子力学与狭义相对论的途径:
为了结合量子力学与狭义相对论,我们就要使空间与时间对等,目前有两种思路:
- 提升时间为厄米算符,这是一种非主流的方式。
- 降坐标 $\textbf{x}$ 为参数或标记,用来标记算符$\hat{\psi}(\textbf{x},t)$ $\rightarrow$ 量子场论。
参考书籍
- 樱井纯《现代量子力学》第二版中译
- 曾谨言《量子力学》卷二第五版