现代量子力学笔记8：相对论量子力学

2024-01-26 2024-09-11 约 7997 字预计阅读 16 分钟次阅读

这是樱井纯《现代量子力学》的第八章（相对论量子力学）的课程学习笔记，个人能力有限，如有错误，欢迎指正

通往相对论相对论量子力学之路

这里我们选用自然单位制 $\hbar=c=1$，以及爱因斯坦求和规则

对于相对论量子力学，我们需要结合量子力学基本原理与狭义相对论（或者说洛伦兹对称性）。

而对于我们之前所研究的非相对论量子动力学有：$i\partial_t\left|\psi(t)\right>=H\left|\psi(t)\right>$，如果直接把相对论自由粒子的能量$E_p=\sqrt{\textbf {p}^2+m^2}$ 代入非相对论量子力学的哈密顿量，则有： $$H=m\left[1+\frac{\textbf{p}^2}{m^2}\right]^{\frac{1}{2}}=m+\frac{\textbf{p}^2}{2m}-\frac{\textbf{p}^4}{8m^3}+\cdots$$ 再把该哈密顿量代入薛定谔方程，则： $$i\partial_t\left<\textbf{x}|\psi(t)\right>=\left<\textbf{x}|H|\psi(t)\right>=\left[m+\frac{\nabla^2}{2m}-\frac{\nabla^4}{8m^3}+\cdots\right]\left<\textbf{x}|\psi(t)\right>$$ 观察上式可发现，由于没有平等对待时间与空间，所以出现了无穷阶的空间导数，这破坏了局域性与因果性，也不符合狭义相对论的要求。

Klein-Gordon方程

为了解决这个问题，就要把烦人的根号去掉。所以不妨对时间求两次导数，这样就能得到Klein-Gordon方程： $$-\partial_t^2\left|\psi(t)\right>=i\partial_tH\left|\psi(t)\right>=H^2\left|\psi(t)\right>$$ 即：

$$\left[\partial_t^2-\nabla^2+m^2\right]\psi(\textbf{x},t)=[\partial_\mu\partial^\mu+m^2]\psi(\textbf{x},t)=0$$

其中$\psi(\textbf{x},t)=\left<\textbf{x}|\psi(t)\right>$

可以发现：若 $x^\mu\longrightarrow\tilde{x}^\mu=\Lambda^\mu_{\upsilon}x^\upsilon$ ，则 $\partial_\mu\partial^\mu+m^2\longrightarrow\tilde{\partial_\mu}\tilde{\partial}^\mu+m^2=\partial_\mu\partial^\mu+m^2$ ，从而可知 $\psi(\textbf{x},t)\longrightarrow\tilde{\psi}(\tilde{\textbf{x}},\tilde{t})=\psi(\textbf{x},t)$ 而这样的方程满足洛伦兹协变性，从而能满足相对论的要求。

洛伦兹协变性（协变就是一起变）：即四矢量 $x^\mu$ 做洛伦兹变换，方程也改变（它们一起变），以至于最后方程的形式不变

但是人们很快就发现了三个问题：

负能量解：

这里以最简单的平面波解$\psi(\textbf{x},t)=Ne^{-ip^\mu x_\mu}$为例，代入KG方程（Klein-Gordon方程），可得 $$-p^\mu p_\mu+m^2=-E^2+\textbf{p}^2+m^2=0$$ 具有正能解 $E=+\sqrt{\textbf{p}^2+m^2}$ 和负能解 $E=-\sqrt{\textbf{p}^2+m^2}$

而这个负能解曾是一个巨大的问题，因为当$\textbf{p}\rightarrow \infty$时，负能解$E\rightarrow-\infty$，这会使体系没有稳定基态，从而真空不稳定。

氢原子能级 $\alpha ^4$ 项与实验不符：

若引入电磁相互作用，KG方程将变为： $$\left[(i\partial_t-e\Phi )^2-(i\nabla+e\textbf{A})^2-m^2\right]\psi(\textbf{x},t)=0$$ 应用于氢原子中的电子 $\textbf{A}=0,e\Phi=-\frac{e^2}{r}$ ，可得： $$ E= m[1-\frac{\alpha ^2}{2n ^2}-\frac{\alpha ^4}{2n ^4}(\frac{n}{l+\frac{1}{2}}-\frac{3}{4})+ \cdots] $$ 而$\alpha ^4$ 项与实验不符合。

实际上KG方程是以无自旋粒子情况进行构建的，也就是说KG方程不能描述有自旋的粒子，如电子。

概率不守恒或概率非正定：

因为KG方程 $-\partial_t^2\left|\psi(t)\right>=H^2\left|\psi(t)\right>$ 为时间的二阶微分方程，那么右矢$\left|\psi(t)\right>$并不能完全确定，还需要$\partial_t\left|\psi(t)\right>$，而这与五大公设之一的薛定谔方程公设$i\partial_t\left|\psi(t)\right>=H\left|\psi(t)\right>$所要求初值情况并不一样，多了一个自由度，这会导致要么概率不守恒，要么出现非正定的概率密度。
- 概率不守恒：
  
  如果我们类比非相对论力学定义概率密度为：$\rho(\textbf{x},t)=\psi^* \psi$ （这样的概率密度一定是正定的），而概率流密度定义为： $\textbf{j}=\frac{1}{m}Im(\psi^*\nabla\psi)$ 。这样依照KG方程，我们并不能得到概率守恒： $\partial_t\rho+\nabla\cdot \textbf{j}=0$
- 非正定概率密度：
  
  为了解决概率不守恒的问题，我们不妨改变概率密度的定义，使其与概率流密度构成一个四矢量，这样概率守恒公式也会变得协变，即令
  
  $$j^\mu=\frac{i}{2m}[\psi^* \partial^\mu\psi-(\partial^\mu\psi)^*\psi]$$
  
  则 $\rho(\textbf{x},t)=j^0(\textbf{x},t)=\frac{i}{2m}[\psi^* \partial_t\psi-(\partial_t\psi)^* \psi]$，但是这样定义虽然满足了概率守恒，但概率密度却变成了非正定的，也就是说在某些位置粒子出现的概率可能是负数。

总体而言，KG方程满足了相对论，但不满足量子力学。

为了行文流畅，这里略去书中对Klein-Gordon方程的修正，而直接转到Dirac方程。

Dirac方程

为了解决KG方程的种种问题（尤其是负概率），Dirac提出了另一种解决办法，将二阶微分的KG方程变为一阶。首先波动方程必须是对时间一阶微分方程，而相对论也要求它是对空间的一阶微分方程，那么不妨假定，对固有质量为$m$的自由粒子有：

$$i\partial_t\psi(\textbf{x},t)=(-i\boldsymbol{\alpha}\cdot\nabla+\beta m)\psi(\textbf{x},t)$$

即令$H=\boldsymbol{\alpha\cdot p}+\beta m$

注意：这里的常系数 $\boldsymbol{\alpha}$ 和 $\beta$ 均不是普通的矢量和数，否则方程不能满足协变性。

$\boldsymbol{\alpha}$的分量和$\beta$均为$N\times N$矩阵，且为了保证$H$的厄米性，它们都是厄米矩阵。而波函数可看作多分量的旋量$\psi(\textbf{x},t)= \begin{pmatrix} \psi_1 \\ \psi_2\\ \vdots\\ \psi_N \end{pmatrix} $

为了让上方程能回到KG方程，我们做下面尝试： $$(i\partial_t)^2\psi(\textbf{x},t)=(-i\boldsymbol{\alpha}\cdot\nabla+\beta m)^2\psi(\textbf{x},t)$$ 即 $$-\partial_t^2\psi(\textbf{x},t)=[-\frac{1}{2}(\alpha^i\alpha^j+\alpha^j\alpha^i)-im(\alpha^i\beta+\beta\alpha^i)\partial_i+m^2\beta^2]\psi(\textbf{x},t)$$

这里采用了爱因斯坦求和规则

为了使上式子能与KG方程$[\partial_\mu\partial^\mu+m^2]\psi(\textbf{x},t)=0$一致，那么就要满足： $$\alpha^i\alpha^j+\alpha^j\alpha^i=2\delta_{ij}\textbf{1}\ ,\alpha^i\beta+\beta\alpha^i=0\ ,\beta^2=\textbf{1}$$ 以及$(\alpha^i)^2=\textbf{1}$，还有由厄米性所要求的$(\alpha^i)^\dagger=\alpha^i\ ,\beta^\dagger=\beta$

Dirac $\gamma$矩阵

为了将上式子的协变性体现得更明显，不妨定义Dirac $\gamma$矩阵：令 $\gamma^0=\beta,\gamma^i=\beta\alpha^i=\gamma^0\alpha^i$

那么原方程$i\partial_t\psi(\textbf{x},t)=(-i\boldsymbol{\alpha}\cdot\nabla+\beta m)\psi(\textbf{x},t)$，将变为Dirac方程： $$(i\gamma^\mu\partial_\mu-m\textbf{1})\psi(\textbf{x},t)=0$$ 其中$\gamma^\mu,\mu=0,1,2,3$，是四个$N\times N$的常数矩阵，且满足Clifford代数，即： $$\frac{1}{2}(\gamma^\mu\gamma^\upsilon+\gamma^\upsilon\gamma^\mu)\equiv\frac{1}{2}\{\gamma^\mu,\gamma^\upsilon\}=\eta^{\mu\upsilon}\textbf{1}$$

其中，$\eta ^{\mu \upsilon} = \begin{pmatrix} 1& & & \\ &-1& & \\ & &-1& \\ & & &-1 \end{pmatrix} $，为度规张量。

即$(\gamma^0)^2=-(\gamma^i)^2=\textbf{1}, \text{for}\ \mu\ne\upsilon\ ,\gamma^\mu\gamma^\upsilon=-\gamma^\upsilon\gamma^\mu$ 或者更直接点$\gamma^\mu ,\gamma ^\upsilon$有关系：$\gamma^\mu\gamma^\upsilon=2\eta^{\mu\upsilon}-\gamma^\upsilon\gamma^\mu$

并且由于 $\boldsymbol{\alpha},\beta$ 的厄米性，有 $(\gamma^0)^\dagger=\gamma^0,(\gamma^i)^\dagger=(\beta\alpha^i)^\dagger=\alpha^i\beta=-\beta\alpha^i=-\gamma^i$

$\gamma^\mu$矩阵的性质：

由$\gamma^0\gamma^1=-\gamma^1\gamma^0\Rightarrow\gamma^0\gamma^1\gamma^1=-\gamma^1\gamma^0\gamma^1\Rightarrow\gamma^0=\gamma^1\gamma^0\gamma^1$，而上标1换成2或3也成立，所以$\gamma^0=\frac{1}{3}\gamma^i\gamma^0\gamma^i$。那么$tr(\gamma^0)=\frac{1}{3}tr(\gamma^i\gamma^0\gamma^i)=\frac{1}{3}tr(\gamma^0\gamma^i\gamma^i)=-tr(\gamma^0)\Rightarrow tr(\gamma^0)=0$。

此外，$\gamma^0\gamma^i=-\gamma^i\gamma^0\Rightarrow\gamma^i=-\gamma^0\gamma^i\gamma^0\Rightarrow tr(\gamma^i)=-tr(\gamma^0\gamma^i\gamma^0)=-tr(\gamma^i\gamma^0\gamma^0)=-tr(\gamma^i)$，即 $tr(\gamma^i)=0$

即矩阵$\gamma^\mu$的迹为零

又 $ \text{for}\ \mu\ne\upsilon\ ,\gamma^\mu\gamma^\upsilon=-\gamma^\upsilon\gamma^\mu=(-\textbf{1})\gamma^\upsilon\gamma^\mu$，对该式求行列式值，则

$$det(\gamma ^\mu) \cdot det(\gamma ^\upsilon)=(-1) ^N det(\gamma ^\upsilon) \cdot det(\gamma ^\mu)$$

而等式成立则要求：$(-1) ^N =1$ 。所以$\gamma^0$和$\gamma^i$都是偶数维矩阵，即$N=$ 偶数。

但是因为独立的$2\times2$矩阵 $\textbf{1},\sigma_1,\sigma_2,\sigma_3$ 只有三对是互相反对易（即不满足Clifford代数），所以$N\ne2$。因此$N=4$是最小的能实现Clifford代数的维数，而Dirac最早构建时所采用的自旋$\frac{1}{2}$粒子的$\gamma^\mu$矩阵正好是4维的，所以简单起见，以下的讨论均取$N=4$
Dirac $\gamma ^\mu$ 矩阵的4维表示：

满足上面 $\gamma ^\mu$ 矩阵性质的4维矩阵表示不止一种，这里不妨选取 Dirac 表示，即以 $\gamma ^0$ 为对角阵的表示。所以 $\gamma ^0$ 可表示为： $$ \gamma ^0= \begin{pmatrix} \lambda _1 \\ & \lambda _2\\ & & \lambda _3\\ & & & \lambda _4 \end{pmatrix} $$

而考虑到： $$ (\gamma ^0) ^2 = \begin{pmatrix} (\lambda _1) ^2 \\ & (\lambda _2) ^2\\ & & (\lambda _3) ^2\\ & & & (\lambda _4) ^2 \end{pmatrix}= \textbf{1} $$

所以 $\gamma ^0$ 的本征值只能取 $\pm 1$，且其迹为零，所以不妨令 $ \gamma ^ 0$ 矩阵为： $$ \gamma ^0= \begin{pmatrix} I & 0 \\ 0 & - I \end{pmatrix} $$

而其他的 $\gamma ^\mu$ 矩阵由其性质，则可得

$$ \boldsymbol{\gamma}= \begin{pmatrix} 0 & \boldsymbol{\sigma} \\ -\boldsymbol{\sigma} & 0 \end{pmatrix} $$

所以 Dirac 表示下有 $\beta=\begin{pmatrix}I&0 \\ 0&-I\end{pmatrix}$，而 $\boldsymbol{\alpha}=\begin{pmatrix}0 & \boldsymbol{\sigma} \\ \boldsymbol{\sigma}&0\end{pmatrix}$

其中 $I= \begin{pmatrix} 1 & 0 \\ 0 & 1\end{pmatrix}$ 为 $2 \times 2$ 的单位矩阵，$0= \begin{pmatrix} 0 & 0 \\ 0 & 0\end{pmatrix}$ 为 $2 \times 2$ 的零矩阵,

而 $\boldsymbol{\sigma}=(\sigma _1,\sigma _2, \sigma _3)$ ，其中 $\sigma _i , , , i=1,2,3$ 为泡利矩阵。

此外，还要定义 $$\gamma ^5 \equiv i \gamma ^0 \gamma ^1 \gamma ^2 \gamma ^3 = \begin{pmatrix} 0 & I \\ I & 0 \end{pmatrix} $$

这里定义$\gamma ^5$而不是$\gamma ^4$ ，据说是因为以时间为虚数的那一套度规之中，没有$\gamma ^0$，取而代之的是$\gamma ^4$。因此为了防止与此混淆，所以只能定义$\gamma ^5$。

负概率的解决

我们来看Dirac方程解决的第一个问题：负概率

定义 $\bar{\psi} \equiv \psi ^\dagger \gamma ^0$，则 $(i\gamma^ \mu\partial_\mu-m)\psi(x^\mu)=0\Rightarrow i \bar{\psi} \gamma ^\mu \partial _\mu \psi - m \bar{\psi} \psi = 0$

若取共轭，则变为 $-i(\partial _\mu \psi^\dagger) (\gamma^ \mu)^\dagger -m\psi^\dagger=0\Rightarrow-i(\partial _\mu \psi ^\dagger)(\gamma^ \mu)^\dagger \gamma ^0 -m \bar{\psi}=0 \Rightarrow i(\partial _\mu \psi ^\dagger \gamma ^0)\gamma^ \mu +m \bar{\psi}=0$ ，再右乘 $\psi$ ，得 $i (\partial _\mu \bar{\psi}) \gamma ^\mu \psi + m \bar{\psi} \psi = 0$

上面用到了$(\gamma^ \mu)^\dagger \gamma ^0 = \gamma ^0 \gamma^ \mu$

上面得到的两结果 $i \bar{\psi} \gamma ^\mu \partial _\mu \psi - m \bar{\psi} \psi = 0$ 和 $i (\partial _\mu \bar{\psi}) \gamma ^\mu \psi + m \bar{\psi} \psi = 0$ 相加，可得 $ \partial _\mu (\bar{\psi}\gamma ^\mu \psi)=0$

这里我们定义四维概率流密度为 $j ^\mu = (\rho,\textbf{j})= \bar{\psi} \gamma ^\mu \psi$ ，那么概率守恒方程为：

$$ \partial _\mu j ^\mu =\partial _t \rho + \nabla \cdot \textbf{j}=0$$

概率流密度： $\textbf{j}= \bar{\psi} \boldsymbol{\gamma} \psi=\psi ^\dagger \gamma ^0 \gamma ^0 \boldsymbol{\alpha} \psi =\psi ^\dagger \boldsymbol{\alpha} \psi$

概率密度：$\rho = \bar{\psi} \gamma ^0 \psi= \psi ^\dagger \gamma ^0 \gamma ^0 \psi= \psi ^\dagger \psi > 0$ ，即正定

也就是说Dirac方程避免了KG方程所具有的负概率问题。

Dirac方程的洛伦兹协变性

洛伦兹协变性指方程在洛伦兹变换下保有原来的形式的性质，对于Dirac方程就是说：$(i\gamma^\mu\partial_\mu-m)\psi(\textbf{x},t)=0$，在洛伦兹变换$x^\mu\rightarrow\tilde{x}^\mu=\Lambda^\mu_\upsilon x^\upsilon$下，变为$(i\gamma^\mu \tilde{\partial}_\mu-m) \tilde{\psi}( \tilde{\textbf{x}},\tilde{t})=0$。

接下来来探究要使协变性成立 $\gamma^\mu$ 矩阵要满足什么：

首先 $\tilde{\partial} _ \mu=\frac{\partial}{\partial\tilde{x}^\mu} = (\Lambda^{-1}) ^{\upsilon} _ \mu \partial_ \upsilon \Rightarrow \partial _ \mu=\Lambda ^\upsilon _ \mu \tilde{\partial} _ \upsilon $；而常数矩阵 $\gamma^\mu$ 因为不含 $x^\mu$ 所以不随参考系变化；最后 $\tilde{\psi}(\tilde{x^\mu}) = D(\Lambda)\psi(x^\mu)$ 。

其中 $D(\Lambda)$ 是 $4 \times 4 $ 矩阵，为洛伦兹群的4维旋量表示，且由 $\psi(x^\mu)=D^{-1}(\Lambda)\tilde{\psi}(\tilde{x}^\mu)=D^{-1}(\Lambda)\tilde{\psi}(\Lambda^\mu_\upsilon x^\upsilon)$ 和 $\psi(x^\mu)=D(\Lambda^{-1})\tilde{\psi}(\Lambda^\mu_\upsilon x^\upsilon)$ ，可得$D(\Lambda^{-1})=D^{-1}(\Lambda)$

那么，把 $\psi(x^\mu)=D^{-1}(\Lambda)\tilde{\psi}(\tilde{x}^\mu)$ 代入 $(i\gamma^ \mu\partial_\mu-m)\psi(x^\mu)=0$，且令等式两边同乘 $D(\Lambda)$ ，可得：

$$ \begin{align*} &D(\Lambda)(i\gamma^\mu\partial_\mu-m)D^{-1}(\Lambda)\tilde{\psi}(\tilde{x}^\mu)=0\\ \Rightarrow &[iD(\Lambda)\gamma^\mu D^{-1}(\Lambda)\partial_\mu-m]\tilde{\psi}(\tilde{x}^\mu)=0 \end{align*} $$

上结果与 $(i\gamma^\mu\tilde{\partial}_\mu-m)\tilde{\psi}(\tilde{\textbf{x}},\tilde{t})=0$ 对比，可得：

$$D(\Lambda)\gamma^\mu D^{-1}(\Lambda)=(\Lambda^{-1})^\mu_\upsilon\gamma^\upsilon$$

Clifford代数 $\frac{1}{2}(\gamma^\mu\gamma^\upsilon+\gamma^\upsilon\gamma^\mu)\equiv\frac{1}{2}\{\gamma^\mu,\gamma^\upsilon\}=\eta^{\mu\upsilon}\textbf{1}$，在洛伦兹变换下不变。

Dirac方程与自旋

我们考虑洛伦兹变换下一个普通右矢的变化为：$\left|\alpha(t)\right> \rightarrow U(\Lambda) \left|\alpha(t)\right>$ ，接着来看$U(\Lambda)$ 与 $D(\Lambda)$ 的关系：

$$ \psi _a (x)= \left<\textbf{x},a|\alpha(t) \right> \rightarrow \left<\textbf{x},a|U(\Lambda)|\alpha(t) \right>=\tilde{\psi} _a(x)=[D(\Lambda)] _{ab} \psi _b (\Lambda ^{-1} x) $$

注意这里的爱因斯坦求和规则，且上面用到了 $\tilde{\psi}(\tilde{x})=D(\Lambda)\psi(x)=D(\Lambda)\psi(\Lambda ^{-1} \tilde{x}) \Rightarrow \tilde{\psi}(x)=D(\Lambda)\psi(\Lambda ^{-1}x)$

这里我们先考虑无穷小变换 $\Lambda ^\mu _\upsilon = \sigma ^\mu _\upsilon + \omega ^\mu _\upsilon$

由 $\eta _{\rho \sigma} \Lambda ^\rho _\mu \Lambda ^\sigma _\upsilon = \eta _{\mu \upsilon}$，可定义 $\omega _{\mu \upsilon} \equiv \eta _{\mu \alpha} \omega ^\alpha _\upsilon = - \omega _{\upsilon \mu}$

那么 $D(\Lambda = \textbf{1} + \omega)=\textbf{1}-\frac{i}{2}\omega _{\alpha \beta} S ^{\alpha \beta}$

其中 $S ^{\alpha \beta}$ 是 $D(\Lambda)$ 的生成元，且$S ^{\alpha \beta}=-S ^{\beta \alpha}$

将上式代入 $D(\Lambda)\gamma^\mu D^{-1}(\Lambda)=(\Lambda^{-1})^\mu_\upsilon\gamma^\upsilon$ ，则可得

$$ [\gamma ^\mu,S ^{\alpha \beta}] = i(\eta ^{\mu \alpha} \gamma ^\beta - \eta ^{\mu \rho} \gamma ^\alpha) $$

再考虑Clifford代数以及归一化 $det|D(\Lambda)|=1$ ，最终可得生成元为： $$ S ^{\alpha \beta}= \frac{i}{4}[\gamma ^\alpha ,\gamma ^ \beta] $$

再回到波函数在无穷小洛伦兹变换下的情形，那么，

$$ \begin{align*} \tilde{\psi}(x ^\mu) &=(\textbf{1}-\frac{i}{2} \omega _{\alpha \beta}S ^{\alpha \beta})\psi (x ^\mu - \omega ^\mu _\upsilon x ^\upsilon) \\ &= (\textbf{1}-\frac{i}{2}\omega _{\alpha \beta}S ^{\alpha \beta}-\omega _{\alpha \beta}x ^ \beta \partial ^\alpha)\psi (x ^\mu) \end{align*} $$

接下来，我们想得到洛伦兹变换下的总角动量，所以只考虑空间转动就行，即令洛伦兹 boost 参数为 $\omega _{0i}=0$。而转动参数不妨令为：$\omega _{ij}=\epsilon ^{ijk} n ^k d\phi$，令 $\hat{\textbf{n}}=(n ^1,n ^2,n^3)$ 。

而同时可发现，若令 $S ^k \equiv \frac{1}{2}\epsilon ^{ijk} S ^{ij}$ ，则转动生成元 $ S ^{ij} = \epsilon ^{ijk} S^k$ ，而生成元 $ S ^{ij} $ 只有三个独立分量，即 $S ^1=S ^{23},S ^2=S ^{31},S ^3=S ^{12}$ ，不妨用这三个独立分量定义一个矢量 $\textbf{S}=(S ^{23},S ^{31},S ^{12})$

若考虑其在4维Dirac表示下的矩阵，那么由 $[\sigma ^i ,\sigma ^j]=2i \epsilon ^{ijk}\sigma ^k$ ，可得：

$$ \textbf{S}= \frac{1}{2} \boldsymbol{\Sigma}=\frac{1}{2} \begin{pmatrix} \boldsymbol{\sigma} & 0 \\ 0 & \boldsymbol{\sigma} \end{pmatrix} $$

把该矢量代入波函数在无穷小洛伦兹空间转动的情形，则可得：

$$ \tilde{\psi}(x)=[\textbf{1}-i\textbf{S}\cdot \hat{\textbf{n}} d\phi -(\textbf{x}\times \nabla) \cdot \hat{\textbf{n}} d\phi] \psi(x) $$

那么有限洛伦兹空间转动则为：

$$ \tilde{\psi}(x)=e ^{-i[\textbf{x}\times (-i\nabla) + \textbf{S}]\cdot \hat{\textbf{n}} d\phi}\psi(x) \equiv e ^{-i\textbf{J} \cdot \hat{\textbf{n}} d\phi}\psi(x) $$

最终可推得，总角动量为：

$$ \textbf{J} = \textbf{x}\times (-i\nabla) + \frac{1}{2} \boldsymbol{\Sigma}= \textbf{L}+\textbf{S} $$

正如实验中所显示的，电子存在着内禀的自旋 $\textbf{S}$。

也就是可以从Dirac方程出发，以理论的角度推出自旋的存在，且自旋是一种相对论效应。

Dirac方程的自由粒子解

虽然我们在之前定义了 $4 \times 4$ 的矩阵以及旋量，但是它们具体的物理意义似乎还是不够明显，所以这里以自由粒子为例，给出$H$的本征值及本征态。

自由粒子的色散关系（能量与动量关系）为：$E ^2=\textbf{p} ^2+m ^2=E ^2 _p \Rightarrow E = \pm E _p$

这里令 $\textbf{p}=p \hat{\textbf{z}}$，那么$H= \gamma ^0 \gamma ^3 p +\gamma ^0 m$

再定义螺旋度算符:

$$\textbf{S} \cdot \textbf{p}=\frac{p}{2}\Sigma _z=\frac{p}{2} \begin{pmatrix} \sigma _3 & 0 \\ 0 & \sigma _3 \end{pmatrix}$$

则在动量表象的能量本征方程 $H\psi=E\psi$ 为：

$$ \begin{pmatrix} m & 0 & p & 0\\ 0 & m & 0 & -p\\ p & 0 & -m & 0\\ 0 & -p& 0 & -m \end{pmatrix} \begin{pmatrix} u _1\\ u _2\\ u _3\\ u _4 \end{pmatrix} = E \begin{pmatrix} u _1\\ u _2\\ u _3\\ u _4 \end{pmatrix} $$

可解得本征态有：

正能解 $E = + E _p$：

$$u ^{(+)} _R (p)=\begin{pmatrix} 1\\ 0\\ \frac{p}{E _p +m}\\ 0\end{pmatrix},u ^{(+)} _L (p)=\begin{pmatrix} 0\\ 1\\ 0\\ \frac{-p}{E _p +m}\end{pmatrix}$$

且有 $\textbf{S}\cdot \textbf{p} u ^{(+)} _R (p)=+u ^{(+)} _R (p) \ ,\textbf{S}\cdot \textbf{p} u ^{(+)} _L (p)=-u ^{(+)} _L (p)$

$u ^{(\pm)} _{R,L} (p)$ 的上标 $(\pm)$ 表示正或负能解，下标 $R,L$ 表示右手或左手性（或者说，正或负螺旋度）。
负能解 $E = - E _p$：

$$u ^{(-)} _R (p)=\begin{pmatrix} \frac{-p}{E _p +m}\\ 0\\ 1\\ 0\end{pmatrix},u ^{(-)} _L (p)=\begin{pmatrix} 0\\ \frac{p}{E _p +m}\\ 0\\ 1\end{pmatrix}$$

且有 $\textbf{S}\cdot \textbf{p} u ^{(-)} _R (p)=+u ^{(-)} _R (p) \ ,\textbf{S}\cdot \textbf{p} u ^{(-)} _L (p)=-u ^{(-)} _L (p)$

在 $\textbf{p}=p \hat{\textbf{z}}$ 的情况下，$ u _R$ 与 $u _L$ 分别也是 $S _z=\textbf{S}\cdot \hat{\textbf{p}}$ 所对应不同本征值的本征态。也就是说在正负能解的情况下，自旋也提供了一个自由度，使自旋 $\frac{1}{2}$ 的自由粒子在动量表象下呈现为4维。

可见负能解释构成解完备性的一部分，不可或缺。

负能态的解释：

为消除负能态引发的真空不稳定性，Dirac 提出如下的解释：
- 所有负能态都被填满，形成“负能海”，Pauli不相容原理阻止正能电子向负能态跃迁。
- “负能海”的无穷能量与无穷电荷背景不能被人们观测到。
- 高能粒子（比如 $\gamma$ 光子）可能从海中激发出⼀个正能电子，留下一个空穴，相当于⼀个具有相同质量与自旋，但相反电荷的粒子，即正电子。
- 电子向负能态跃迁，填满空穴，释放出高能光子，看作是正负电子湮灭成光子。
氢原子能级 $\alpha ^4$ 项：

引入电磁相互作用，$\partial _\mu \rightarrow D _\mu=\partial _\mu+ieA _\mu , A _\mu=(\Phi,-\textbf{A})$。

则带电的Dirac方程为：

$$(i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m)\psi=0$$

应用于氢原子 $\textbf{A}=0,e\Phi=-\frac{e ^2}{r} $ ，可解出氢原子展开至 $\alpha ^4$项的能级为：

$$E= m[1-\frac{\alpha ^2}{2n ^2}-\frac{\alpha ^4}{2n ^4}(\frac{n}{j+\frac{1}{2}}-\frac{3}{4})+ \cdots]$$

此结果的 $\alpha ^4$项与实验结果一致。若要进一步解除关于 $l$ 的简并，就要考虑兰姆位移的辐射修正。

Dirac 方程的对称性

空间转动

自由粒子的Dirac方程满足洛伦兹对称性，包含了空间转动对称性，因此角动量守恒，即 $[H,\textbf{J}]=0$

宇称

宇称变换对应的广义洛伦兹变换矩阵为： $$ \Lambda ^\mu _\upsilon= \begin{pmatrix} 1 & 0 & 0 & 0\\ 0 & -1 & 0 & 0\\ 0 & 0 & -1 & 0\\ 0 & 0& 0 & -1 \end{pmatrix} \equiv \mathscr P ^\mu _\upsilon $$

协变的Dirac方程在宇称变换下不变，则反射态可看作由特殊的洛伦兹变换所得，有：

$$ \psi _P (t,\textbf{x}) =D(\mathscr{P})\psi (t,-\textbf{x})=D(\mathscr{P})\pi \psi(t,\textbf{x}) =\mathbb P \psi (t,\textbf{x}) $$

也就是说 $\mathscr{P}$ 属于洛伦兹变换，且 $\psi _P (t,\textbf{x})\equiv \left<\textbf{x}|U(\mathscr P ) |\alpha (t)\right>=\mathbb P \psi (t,\textbf{x})$

又由$D ^{-1}(\mathscr{P})\gamma ^\mu D(\mathscr{P})=\mathscr{P} ^\mu _\upsilon \gamma ^\upsilon$，且 $D ^2(\mathscr{P})=\textbf{1}$

最终可得，$D(\mathscr{P})=\gamma ^0 \ ,\mathbb{P}=\gamma ^0 \pi$

电荷共轭

这里我们定义电荷共轭变换：粒子$\rightarrow$反粒子，质量不变，电荷$q\rightarrow -q$。

接下来我们寻找一个电荷共轭算符，它可以使粒子的波函数变为反粒子的波函数。

由Dirac方程求其共轭： $$ (i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m)\psi(t,\textbf{x})=0\\ \Downarrow \\ (-i(\gamma ^\mu) ^* \partial _\mu -e(\gamma ^\mu)^* A _\mu-m)\psi ^*(t,\textbf{x})=0 $$

接下来定义一个矩阵$\tilde{C}$ ，它满足 $\tilde{C}(\gamma ^\mu) ^\mu \tilde{C} ^{-1}=-\gamma ^\mu$，将它作用于Dirac的共轭方程：

$$ \tilde{C} (-i (\gamma ^\mu) ^ * \partial _ \mu -e(\gamma ^\mu) ^ * A _\mu-m) \tilde{C} ^{-1} \tilde{C} \psi ^ * (t,\textbf{x})=0\\ \Downarrow \\ (i \gamma ^\mu \partial _\mu +e \gamma ^\mu A _\mu-m) \tilde{C} \psi ^ * (t,\textbf{x})=0$$

所以 $\tilde{C} \psi ^ * (t,\textbf{x})$ 就是反粒子的波函数，且不难发现$\tilde{C}=i \gamma ^2 \ , \tilde{C}\psi ^ * =i\gamma ^2 (\bar{\psi} \gamma ^0)^T=i\gamma ^2 \gamma ^0 (\bar{\psi}) ^T$

注意：这里的 $\gamma ^2$ 不是 $\gamma$ 平方

因此可以定义电荷共轭算符 $\mathbb{C}=i \gamma ^2 K$ ，所以电荷共轭变换有： $$ \psi \rightarrow \psi _C \equiv \mathbb{C} \psi =i \gamma ^2 \psi ^* =i \gamma ^2 \gamma ^0 (\bar{\psi}) ^T $$

其中 $K$ 为复共轭算符：$K\psi=\psi ^*$

时间反演

时间反演对应的广义洛伦兹变换矩阵为：

$$ \Lambda ^\mu _\upsilon= \begin{pmatrix} -1 & 0 & 0 & 0\\ 0 & 1 & 0 & 0\\ 0 & 0 & 1 & 0\\ 0 & 0& 0 & 1 \end{pmatrix} \equiv \mathscr T ^\mu _\upsilon $$

对自由Dirac方程：

自由的Dirac方程 $(i\gamma ^\mu \partial _\mu-m)\psi(t,\textbf{x})=0$ 在时间反演变换下不变，则此时时间反演后的波函数可看作特殊的洛伦兹变换所得，即： $$ \tilde{\psi}(t,\textbf{x})=D(\mathscr{T}) \psi (-t,\textbf{x}) =\mathbf{T} \psi(t,\textbf{x}) $$

又由$D ^{-1}(\mathscr{T})\gamma ^\mu D(\mathscr{T})=\mathscr{T} ^\mu _\upsilon \gamma ^\upsilon$，且 $D ^2(\mathscr{T})=\textbf{1}$，所以：

$$D(\mathscr{T})=-i \gamma ^1 \gamma ^2 \gamma ^3 \ ,\mathbf{T}=-i \gamma ^1 \gamma ^2 \gamma ^3 T^0$$

其中 $ T ^0 \psi (t,\textbf{x})=\psi (-t,\textbf{x})$
对带电Dirac方程：

但是若考虑带电的Dirac方程 $(i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m)\psi(t,\textbf{x})=0$，它在时间反演下，若取反演后的波函数为 $\tilde{\psi}$ ，则并不协变。

因为若 $t \rightarrow -t$ ，则 $i\gamma ^\mu \partial _\mu -e\gamma ^\mu A _\mu-m \rightarrow -i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A}$ ，而 $(-i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A})\tilde{\psi} \ne 0$

则我们需要构建一个时间反演算符 $\mathbb{T}$，或一个时间反演态 $\psi _T(t,\textbf{x})$，使下面成立： $$ \psi _T(t,\textbf{x})=\mathbb{T} \psi (t,\textbf{x}) ，(-i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A})\psi _T = 0 $$

而这里我们可以发现若取电荷共轭的公式： $$ (i \gamma ^\mu \partial _\mu +e \gamma ^\mu A _\mu-m) \psi _C(t,\textbf{x})=0 $$

再将 $\mathbf{T}$ 作用于其上，则： $$ \mathbf{T}(i \gamma ^\mu \partial _\mu +e \gamma ^\mu A _\mu-m)\mathbf{T} ^{-1} \mathbf{T} \psi _C(t,\textbf{x})=0\\ \Downarrow\\ (-i\gamma ^0 \partial _0 -i\boldsymbol{\gamma}\cdot \nabla -e\gamma ^0 A _0- e \boldsymbol{\gamma}\cdot \textbf{A})\mathbf{T} \psi _C(t,\textbf{x}) = 0 $$ 所以可以定义时间反演态为： $$ \psi _T (t,\textbf{x}) =D(\mathscr{T})\psi _C (-t,\textbf{x})=D(\mathscr{T}) \mathbb{C} T ^0 \psi(t,\textbf{x}) \equiv \mathbb{T}\psi(t,\textbf{x}) $$

最终可得，$\mathbb{T}=\gamma ^1 \gamma ^3 K T ^0$

电荷共轭-宇称-时间反演（CPT）联合对称性

若Dirac方程具有CPT对称性，则经过CPT变化后， $$ \psi(t,\textbf{x}) \rightarrow \psi _{CPT}(t,\textbf{x})=\mathbb{CPT}\psi(t,\textbf{x})\equiv \gamma ^5 \psi(-t,-\textbf{x}) $$

局限性与新的理论

Dirac理论的局限性：
- 关于单个粒子的运动方程，结果却要依靠多粒子背景（即填满的负能海）来回避负能态的问题。
- 其出发点（对正概率密度的分析）排除了任何自旋为0的粒子，但是 $\pi ^-$原子实验结果却与KG方程一致。
- 玻色子不遵循Pauli不相容原理，无法保持其稳定性，也无法用空穴理论描述其反粒子。
所以Dirac理论作为关于单粒子对相对论量子力学基本理论是不成功的，但可以作为费米子在低能标下的近似。

相对论性波动方程的局限性：

此外，相对论性波动方程（即KG方程与Dirac方程）都存在因果关的系破坏，这也不得不使我们放弃相对论性波动方程，从而寻找其他理论。

虽然KG方程与Dirac方程两者都并不能完美的解释相对论量子力学，但它们在构建真正适用的理论过程中起着重要作用。

量子力学中的空间与时间不对等：

在找寻新理论前，我们不妨考虑一下为什么建立相对论量子力学如此复杂。

在量子力学中，空间坐标 $\textbf{x}$ ，为厄米算符或者算符的本征值，但时间 $t$ 只是参数或标记。也就是在量子力学中，空间与时间不对等。但狭义相对论却要求空间坐标与时间对等处理。

结合量子力学与狭义相对论的途径：

为了结合量子力学与狭义相对论，我们就要使空间与时间对等，目前有两种思路：
- 提升时间为厄米算符，这是一种非主流的方式。
- 降坐标 $\textbf{x}$ 为参数或标记，用来标记算符$\hat{\psi}(\textbf{x},t)$ $\rightarrow$ 量子场论。

参考书籍

樱井纯《现代量子力学》第二版中译

曾谨言《量子力学》卷二第五版

若文章帮助到了您，就不妨点一下👇广告，支持博主吧！

目录