(https://journals.aps.org/rmp/abstract/10.1103/RevModPhys.82.3045)[TOC]
凝聚态物理学中一个不变的主题就是发现并分类独特的物相, 通常朗道的相变理论可以通过发现自发对称性破缺来分类不同的相。然而近三十年来, 量子霍尔效应的发展引领了一种新的物相分类范式, 那就是拓扑序。引起量子霍尔效应的态并没有打破任何对称性, 而是定义了一种拓扑相。在这种拓扑相中, 类似霍尔电导和无带隙的边缘态这种基本性质是对材料参数的连续变化不敏感的, 也就是说除非系统经历了一个量子相变, 否则这种其霍尔电导和边缘态完全不会改变。而传统相变是在温度、压强等参数连续变化中出现的, 这就和拓扑相完全不同。
在过去五年中, 成功预言并在真实体系中实现了由自旋轨道耦合引起的拓扑电子态, 由此一个凝聚态的新分支开始出现。就像平常的绝缘体一样, 拓扑绝缘体也有一个将最高电子占据态和最低空态分开的体能隙。然而, 拓扑绝缘体在其表面 (如果是二维材料则是边缘) 必须有一个受时间反演对称性保护的无带隙态。拓扑绝缘体和二维的整数量子霍尔效应也有着密切关系, 其中二维整数量子霍尔效应就是个独特的边缘态。拓扑绝缘体的表面 (或边缘) 产生了一个导电的表面态 (因为无带隙) , 这和任何已知的一维和二维电子系统都不相同。除了拓扑绝缘体的基础性质以外, 它还被预测在量子计算和自旋电子学中有非常大的应用。
拓扑序这个概念在1995年由文小刚提出, 它不仅可以描述简单的整数量子霍尔效应 (Thouless, 1982) , 也可以描述需要量子多体方法 (Laughlin, 1983) 的复杂分数量子霍尔效应 (Tsui, Stormer和Gossard, 1982)。仅就这一点而言, 拓扑绝缘体也和整数量子霍尔效应有很多相似之处。由于存在单粒子能隙, 因此电子-电子相互作用不会本质上改变拓扑态, 因此我们可以在固体能带论 (Bloch, 1929) 的框架下理解拓扑绝缘体。
在系列中, 我们会回顾一下这个快速发展领域中的实验和理论基础:
在第二部分: 简要介绍拓扑能带论, 并且用它来解释量子霍尔效应和拓扑绝缘体中的拓扑序。接着会对拓扑超导体做一个简要的介绍, 这也是可以和前面两种现象用同一套框架解决的问题。这些量子态有个统一特征就是体相边缘对应 (bulk-boundary correspondence) , 它是和引起无带隙边缘模式的晶体体相拓扑结构有关的。
在第三部分: 我们会涉及到二维拓扑绝缘体, 也就是大家知道的量子自旋霍尔绝缘体, 紧接着会讨论一下在$\rm HgCdTe$中发现的量子阱。
在第四部分: 会涉及到三维拓扑绝缘体。在这个部分, 我们会回顾一下在$\rm Bi_{1-x} Sb_x$的实验发现, 同时还有离现在更近的的工作, 包括“二代”材料$\rm Bi_2 Se_3$和$\rm Bi_2 Te_3$。
在第五部分: 我们关注于一个在拓扑绝缘体表面因诱导产生能隙。这个能隙是磁场诱导产生, 会出现一个伴随拓扑磁电效应新奇拓扑态。另外, 如果将拓扑绝缘体靠近一个超导体, 那么可能会出现马约拉纳费米子的表面态, 这为拓扑量子计算提供了一个可以实现的平台。
在第六部分: 我们讨论了一些新的材料、新实验和新问题作为总结。
如果上述某些概念对你来说很陌生, 那么可以查看之前相关的综述文章, 包括量子自旋霍尔效应 (König, 2008) , 还有一些其它的工作 (Moore, 2010) 和 (祁晓亮, 张守晟, 2010) 可能对你有帮助。
绝缘态是最基本的一种物态。最简单的绝缘态就是原子, 因为其电子都被束缚在原子的壳层上。原子绝缘态的绝缘性来源于原子需要有限的能量将电子从原子的势场中向外推。比原子更强一些的作用是晶体中原子间的相互作用, 他们之间形成了共价键。二十世纪量子力学最伟大的发现之一就是固体能带论, 它发明了一种可以描述晶体中电子结构的范式。固体能带论利用了晶体的平移对称性, 在动量空间分类了电子结构, 并且定义了周期性的布里渊区。固体能带论的哈密顿量是周期性的布洛赫哈密顿量$\mathcal{H}(\boldsymbol{k})$, 其可解出相应的本征态和本征能量$E_m(\boldsymbol{k})$, 这种能量在$k$空间的分布就是所谓能带。
绝缘体中, 能隙 (即寻遍任何对应的$k$都无法找到的$E_m (k)$的能量范围) 将被占据的价带和空的导带分开 (如图一 (b) )。比如虽然氩原子的固体的能隙远远大于很多半导体, 但是我们仍然在拓扑上把他们看成相同的相, 因为他们都有着能隙。可以想象, 我们可以通过调节哈密顿量连续地改变能隙。因为这种调节是不关闭能隙的, 因此我们可以在这些拥有不同能隙大小的绝缘体中定义一个拓扑等价类 (topological equivalence)。我们有一种稍微粗糙但“稳定”的拓扑分类法, 即将拥有不同平庸芯能带 (trivial core band) 的不同态同等对待, 那么我们就可以把所有传统绝缘体都看成是等价的。 (换句话说, 传统绝缘体之间的分别仅仅是平庸芯能带数量的不同, 而它们与拓扑绝缘体的分别在于, 拓扑绝缘体有着非平庸的芯能带。) 事实上, 这样的传统绝缘体是和真空等价的, 因为根据狄拉克的相对论性的量子理论来说, 真空也具有一个能隙 (对于从真空中产生一对电子-正电子对而言) 、一个导带 (电子) 和一个价带 (正电子)。
那么, 所有有能隙的电子态在拓扑上都和真空等价吗?答案是否定的, 许多新奇的电子态都是反例。
上述提到最简单的反例就是整数量子霍尔效应 (von Klitzing, Dorda, Pepper, 1980; Prange, Girvin, 1987) , 因此我们对整数量子霍尔效应做一个简单的介绍。整数量子霍尔效应出现在二维电子外加强磁场时 (如图一 (d) ) , 在经典力学中此时电子会在体系内做圆周运动。在量子力学中, 其圆形轨道会被量子化, 其能量也被量子化为朗道能级 $\epsilon_m=\hbar\omega_c(m+1/2)$, 以$\omega_c$为圆频率 。因为每个朗道能级都是分立的, 因此两个朗道能级之间都没有可占据的量子态 (如图一 (e) )。如此一来, 如果第$N$个朗道能级被填满, 剩下的朗道能级是空的, 那么费米面就刚好落在第N个朗道能级与第$N+1$个朗道能级之间的无量子态的能量范围内, 即带隙内。这种情况下, 以能带的角度来说, 这个体系就是一个绝缘体。然而, 如果在整数量子霍尔效应中再加一个电场, 却能够产生上述圆形轨道的漂移, 进而引起了有着量子化霍尔电导
\[\sigma_{xy}=Ne^2/h \tag{1}\]的霍尔电流。这种外加电场产生电流的效应却是与绝缘体完全不同的。量子化的霍尔电导的测量精度已经达到 $10^{-9}$ , 这种精度其实恰好就是拓扑性质 (不会因为微小的扰动产生涨落) 的体现。
朗道能级可以被看作是一种“能带结构”, 却不是真正的能带结构。因为平移操作的生成元在磁场中无法对易, 即不满足平移对称性, 因此电子态没法在$k$空间标记。然而, 如果每个单胞都带有$2\pi\hbar c/eB$的封闭磁通量子 (磁通和晶格同周期) , 那么晶格平移操作就能对易, 所以布洛赫定理允许这些态被二维晶体动量$k$标记。在不存在周期势场时, 朗道能级是与动量$k$无关的, 即$E_m(\boldsymbol{k})=\epsilon_m$。然而在有周期势场, 并且和晶格周期相同时, 其能级就会出现随$k$变化的色散。上述的原因就导致了整数量子霍尔效应的能带的结构看起和寻常绝缘体一样。
图一: (a) 原子绝缘体; (b) 能带和绝缘带隙示意图: 红色是导带, 蓝色是价带; (c) $g=0$的球体; (d) 整数量子霍尔效应示意图: 蓝色是电子圆形轨道, 红色是磁通; (e) 分立的朗道能级, 能级之间的能隙相同; (f) $g=1$的轮胎面
经过上面的展示, 我们很容易问一个问题: 既然量子霍尔态和普通绝缘体都有能隙, 那为什么量子霍尔态有电导呢?它们之间的区别在哪呢?这个问题的答案由Thouless, Kohmoto, Nightingale和Nijs (即TKNN) 在1982年回答了, 那就是拓扑。
一个二维能带结构其实是由一个映射组成, 即从晶体的动量$k$ (定义在一个环上) 映射到布洛赫哈密顿量 $\mathcal{H}(\boldsymbol{k})$。有带隙的能带结构都能在拓扑性质上被分类, 分类方法即是: 如果一个能带结构能通过不闭合带隙 (即能带不相互交叉, 或不增加交叉的数量) 的条件下, 连续地变换到另一个能带结构, 则可以把这两个能带结构对应的布洛赫哈密顿量$\mathcal{H}(\boldsymbol{k})$视为一个等价类 (关于等价类知乎上的回答已经足以解释此部分的需要, 可自行搜索)。这些等价类可以通过一个拓扑不变量 $n\in \mathbb{Z}$来区分, 这个拓扑不变量称为陈不变量 (Chern invariant)。也就是说, 如果两个能带能够相互连续变换, 且不闭合能带, 他们就有着相同的陈不变量。
陈不变量是源于数学中的纤维从 (fiber bundle) 理论, 但我们可以从物理上来理解它, 其切入口就是和布洛赫波函数${ | u_m(\boldsymbol{k})\rangle}$密切相关的贝里相位 (Berry phase)。考虑没有偶然简并的情况, 贝里相位可以通过对$\mathcal{A}_m=i\langle u_m(\boldsymbol{k}) | \nabla_{\boldsymbol{k}} | u_m(\boldsymbol{k})\rangle$在$k$空间的闭合环路积分得到。贝里曲率也可以表示为贝里通量 (Berry flux) $\mathcal{F}_m=\nabla\times \mathcal{A}_m$的表面积分。而陈不变量就是贝里流通量整个布里渊区的总和。即陈不变量可以表示为 |
$n_m$是一个量子化的整数, 其原因类似于狄拉克磁单极子。总的陈数可以等于所有已占据能带的累加, 即 $n=\sum_{m=1}^Nn_m$。假如带隙是有限的, 那么即使占据态能带之间有简并, 陈数也是不变的。
TKNN的工作告诉我们, 霍尔电导$\sigma_{xy}$和陈数有着同样的形式, 即在公式 (1) 中的$N$是完全等价于陈数的$n$的。由于陈数是拓扑不变量, 因此当哈密顿量连续变化时, 它完全不变。这也解释了为什么霍尔电导的量子化的鲁棒性这么强。
公式 (2) 可以通过一个简单的类比来说得更明白一些。我们先不考虑复杂的布里渊区到希尔伯特空间的映射, 先考虑一个简单的从二维到三维之间的映射 (即是表面和体相的映射)。二维表面可以根据洞的个数在拓扑上分成不同的亏格 (genus) , 用$g$来表征。如图一 (c) , 一个球体没有洞, 则$g=0$; 然而如图一 (f) , 一个甜甜圈则有一个洞, 则$g=1$。宏观上我们可以观察到洞的个数, 然而我们同样能根据覆盖全表面的局域数据的积分来得到$g$的值。数学上, Gauss和Bonnet证明了: 对一个闭合的表面上的高斯曲率做积分, 就会得到一个量子化的整数, 即一个拓扑不变量。而拓扑能带论中的陈数$n$就类似与拓扑学中的亏格$g$, 一个可以通过贝里曲率积分得到, 另一个即是可以通过表面的高斯曲率积分得到。上述所说的映射即是将二维表面上的高斯曲率或贝里曲率, 按积分的形式映射到三维中的洞的个数或陈数。
Haldane在1988年提出了一个最简单量子霍尔效应的模型——石墨烯。我们在此稍微离题一下, 来简要介绍一下石墨烯的电子性质。由于石墨烯中存在着二维狄拉克电子, 这和三维拓扑绝缘体有着非常重要的类似之处, 因此石墨烯可以对我们了解二维量子自旋霍尔效应提供重要的洞见。
石墨烯最吸引人的地方在于其拥有狄拉克电子。狄拉克电子指的是拥有由狄拉克方程描述的线性色散的电子, 而普通的电子是抛物线色散的。这意味着狄拉克电子的运动方式类似于光子, 是相对论性的。而石墨烯中, 它的能带的导带和价带在动量空间的两个不同的点上发生的交叉, 并且交叉点的色散就满足狄拉克的线性色散。
石墨烯的布洛赫哈密顿量是一个$2\times2$的矩阵, 即
\[\mathcal{H}(\boldsymbol{k})=\boldsymbol{h}(\boldsymbol{k}) \cdot\vec{\sigma}\]其中, $\vec{\sigma}=(\sigma_x,\sigma_y,\sigma_z)$ 是泡利矩阵, 而$\boldsymbol{h}(\boldsymbol{k})=(h_x(\boldsymbol{k}),h_y(\boldsymbol{k}),0)$。空间反演对称 ($\mathcal{P}$) 和时间反演对称 ($\mathcal{T}$) 要求$h_z(\boldsymbol{k})=0$, 具体来说是因为空间反演对称$\mathcal{P}$ (二维材料内禀的对称性) 要求$h_z(\boldsymbol{k})=-h_z(-\boldsymbol{k})$, 时间反演对称 $\mathcal{T}$要求$h_z(\boldsymbol{k})=h_z(-\boldsymbol{k})$, 因此有$h_z(\boldsymbol{k})=0$。出现狄拉克点的原因是$\boldsymbol{h}(\boldsymbol{k})$ 的其它两个分量都可以指向零。在石墨烯中, 这两个点出现在 $\boldsymbol{k}$ 和 $\boldsymbol{K’}=-\boldsymbol{k}$, 其位置被对称性固定在布里渊区的角上。对于小的$\boldsymbol{q}\equiv\boldsymbol{k}-\boldsymbol{k}$而言, 有$\boldsymbol{h}(\boldsymbol{q})=\hbar v_F\boldsymbol{q}$,这里的$v_F$是费米速度。因此布洛赫哈密顿量变为 $\mathcal{H}(\boldsymbol{k})=\hbar v_F\boldsymbol{q} \cdot\vec{\sigma}$, 这就是二维无色散的狄拉克哈密顿量的形式。这意味着, 在靠近$\boldsymbol{k}$的地方的电子的行为是类光子的, 色散为$E(\boldsymbol{q})=\pm\hbar v_F\left | \boldsymbol{q} \right | $。 |
上面我们知道, 狄拉克点的的简并是靠空间反演对称$\mathcal{P}$和时间反演对称$\mathcal{T}$保护的。如果我们打破对称性, 那么这种能带简并就会被分开。比如, 如果一个原胞里两个原子不等价, 空间反演对称$\mathcal{P}$就会被打破, 此时$h_z(\boldsymbol{k})$就不一定等于零。如果$h_z(\boldsymbol{k})$很小的话, 那么在靠近$\boldsymbol{k}$的地方狄拉克哈密顿量就会多出一项关于$z$方向的项,
\[\mathcal{H}(\boldsymbol{k})=\hbar v_F\boldsymbol{q} \cdot\vec{\sigma} +m\sigma_z\]其中$m=h_z(\boldsymbol{k})$。然后色散就会变成$E(\boldsymbol{q})=\pm\sqrt{\left | \hbar v_F\boldsymbol{q} \right | ^2+m^2}$, 也就是说打破了空间反演对称性就会在狄拉克点处打开一个大小为$2\left | m \right | $的能隙。同时如果时间反演对称性没有被打破, 它就会要求$\boldsymbol{k}\rightarrow-\boldsymbol{k}$时保持不变, 即要求在靠近$\boldsymbol{K’}$的地方和靠近$\boldsymbol{k}$的地方有着同样的行为。因此在靠近$\boldsymbol{k}$点处同样打开了一个能隙, 并要求$m’=h_z(\boldsymbol{K’})=h_z(\boldsymbol{k})=m$。上述打破空间反演对称的情况是一个普通的绝缘体, 并非拓扑绝缘体。 |
然而, Haldane在1988年设想了一种情况: 如果添加一个和晶格周期完全相同周期的, 并且在空间上平均为零外磁场, 也就是我们不打破空间反演对称性, 反而只打破时间反演对称性。这其实是一种微扰方法, 与上一段相同它允许存在一个非零的$h_z(\boldsymbol{k})$, 并为狄拉克点引入了一个有限的质量。然而不同的是, 空间反演对称要求$h_z(\boldsymbol{k})=-h_z(-\boldsymbol{k})$, 即在靠近$\boldsymbol{K’}$和靠近$\boldsymbol{k}$的地方有着相反的符号, 即$m’=h_z(\boldsymbol{K’})=-h_z(\boldsymbol{k})=-m$。而Haldane认为, 这种有能隙的态并不是绝缘态, 而是一种量子霍尔态, 其霍尔电导为$\sigma_{xy}=e^2/h$。
对于非零的霍尔电导可以通过以下的方法来理解: 对于如 (3) 式的二能级哈密顿量而言, 我们知道贝里通量和单位方向矢量$\hat{h}(\boldsymbol{k})=\boldsymbol{h}(\boldsymbol{k})/\left | \boldsymbol{h}(\boldsymbol{k}) \right | $对应的立体角有关, 所以 (2) 式可以写成 |
这个式子可以简单地算出$\hat{h}(\boldsymbol{k})$绕单位球的次数。当在无质量情况下时, 即$m=m’=0$或$h_z(\boldsymbol{k})=h_z(\boldsymbol{k}’)=0$情况下, 方向矢量$\hat{h}(\boldsymbol{k})$就被限制在$h_z=0$的赤道面上, 并且这个方向矢量携带着一个对每个在$\left | \boldsymbol{h} \right | =0$处的狄拉克点的单位 (或相反的) 缠绕 (这句话完全看不懂)。对于很小并且有限的质量$m$而言, 在任何地方$\left | \boldsymbol{h} \right | \ne0$。并且取决于质量$m$的符号, $\hat{h}(\boldsymbol{k})$会指向南极或北极。于是, 每个狄拉克点就会对霍尔电导$\sigma_{xy}$贡献一个$\pm e^2/2h$。在绝缘态情况下$m=m’$, 因此两个电导相互抵消, 则霍尔电导$\sigma_{xy}=0$, 然而在量子霍尔态下, 两个电导不是抵消, 而是累加起来。 |
在这儿, 我们得到一个偶数的$n$是非常重要的, 否则霍尔电导就会变成半整数。换句话说, 上面的这一系列操作保证了在时间反演对称不被打破的情况下, 狄拉克点总是成对出现的, 这也就是所谓的费米子加倍定理 (fermion doubling theorem) (Nielssen, Ninomiy, 1983) , 这个定理会在第四章详细论述。
对有带隙的能带结构做拓扑分类的一个重要成果就是我们发现: 如果在界面处的拓扑不变量改变了, 那么就会在界面上形成一个无能隙的导电态。众所周知, 这种边缘态会在整数量子霍尔材料和真空的边界出现 (Halperin, 1982)。这种电导可以具象地理解为, 当量子霍尔效应材料体内的电子在进行圆周运动时, 其碰到材料表面后, 在表面上进行跃动, 在宏观上产生了沿表面的电流 (如图二 (a) )。更重要的是, 不难想象在磁场方向不变的情况下, 这种电子态只沿边界的一个方向运动, 也就是说我们可以认为这种电子态是具有手性的。另外, 量子霍尔效应在应用上也具有非常广大的前景。因为这种表面态是抗无序的, 也就是说小的扰动和无序不能破坏其电子态。更深一步说, 这是由于这种带隙内的边缘态是无法被背散射到其它任何态上去的, 这就导致了一个具有非常高鲁棒性的量子化的电子输运性质。
图二: (a) 圆周运动的电子碰到表面后在表面上进行跳跃的示意图 (b) 一个连接导带和价带之间的导电边缘态 在体相量子霍尔态的边界存在这样一条“通路”其实是和其拓扑性质本质相关的。可以设想一个量子霍尔态 ($n=1$) 和普通绝缘体 ($n=0$) 之间的界面, 界面法向规定为$y$方向。根据第一小节TNKK不变量的内容, 我们知道如果在不同的$y$的位置上, 能隙都未曾闭合的话, 那么, 拓扑不变量是不会改变的。因此不难理解, 在$n=1$和$n=0$中间的某个区域, 能隙必然曾经闭合过。这个过程可以看成在$n=1\rightarrow n=0$的过程中, 能隙渐渐闭合, 然后导带价带交叉, 然后能隙又渐渐打开。因此在能隙为零的地方就会出现一个低能导电态。这种拓扑性质和无能隙模式之间的关系是广泛存在在很多物理体系中的, 它最初被发现是在分析一维场论时 (Jackiw, Rebbi, 1976)。与之相似的, 其也被运用在描述聚乙炔中的孤子态 (Su, Schrieffer, Heeger, 1979)。
在这里我们尝试用上述提到的一维场论的方法简单地描述一下这种手性边缘导电态。我们使用公式 (4) 中的双带狄拉克模型, 考虑一个边界上, 其狄拉克点上的质量$m$随$y$ (界面法向) 变化而改变符号 (第二节中提到, 能隙其实和质量是正相关的$E_g=2\left | m \right | $, 这种质量变化的过程也反映了能隙的变化)。因此我们可以将质量写成$y$的函数$m\rightarrow m(y)$, 我们可以规定$y>0$是普通绝缘体方向, 而$y<0$是量子霍尔态方向。我们规定, 在$\boldsymbol{K’}$处, 不管是普通绝缘体, 还是量子霍尔效应, 其质量都应该大于零, 即$m’(y)>0$总成立。那么根据第二小节, 对于公式 (4) 和分别打破时间反演对称性和空间反演对称性的论述, 我们可以知道, 对于普通绝缘体而言, 有$m=m’$; 而对于量子霍尔态而言, 有$m=-m’$。因此在如上的规定下, 我们可以得出: 在$\boldsymbol{k}$处, 有普通绝缘体$m(y>0)>0$, 量子霍尔态$m(y<0)<0$。在公式 (4) 中将$\boldsymbol{q}$在坐标表象下写为$-i\vec{\nabla}$, 会得到一个精确优雅的解析解 |
且本征值为$E(q_x)=\hbar v_F q_x$。这个能带模式是和费米面相交的 (如图二 (b) ) , 并且其有一个正色散导数, 即群速度$dE/dq_x=\hbar v_F$为正。这意味着这条能带上的电子的运动方向只有一个, 即定义了一个手征的边缘态。
在二十世纪八十年代, 使用有质量的三维狄拉克哈密顿量模型, 上面叙述的这套思想被用在窄带半导体上 (Volkov, Pankratov, 1985; Fradkin, Dagotto, Boyanovsky, 1986)。这个工作说明了, 如果在界面处狄拉克质量变号了, 那么这个界面一定和无带隙的二维狄拉克费米子有关。这种无带隙的二维狄拉克费米子与三维拓扑绝缘体的表面态具有某些相似性, 但是我们会在第四章详细说明, 它们之间有本质的不同。同时, 在另一个相对独立发展的领域中, Kaplan在1992年说明了, 在格点QCD理论中, 四维的手征费米子可以在五维格点的畴壁上进行模拟。这个工作的意义在于, 它避开了之前发现的费米子翻倍定理 (doubling theorem) (Nielssen, Ninomiya, 1983)。而费米子翻倍定理告诉我们, 在四维格点上不可能出现手征费米子。同样地, 量子霍尔效应的边缘态和拓扑绝缘体的表面态也避开了类似的翻倍定理。
通过解具有$y=0$边缘的半无限大结构的Haldane模型, 我们可以清晰地看到在量子霍尔效应里存在手征边缘态。图二 (b) 展示了在沿着边缘方向, 能带和动量$k_x$的函数关系。实心区域是体相的导带和价带, 它们形成了连续的能带, 并在$\boldsymbol{k} 和 \boldsymbol{K’}$附近有个能隙。同时, 一条束缚在边缘的单带出现在能隙中, 它连接导带和价带, 并且有正的群速度。
在上面这样的体系中, 我们可以通过改变表面附近的哈密顿量来修饰边缘态。比如, 我们可以通过调整边缘态的$E(q_x)$来在费米面上产生一个能带的扭结。换一种说法就是, 我们可以让边缘态的能带三次穿过费米面, 其中两次有正的群速度, 一次有负的群速度。但是, 尽管可以产生诸多扭结, 但是其正群速度和负群速度的模式数量之差
\[\Delta _n=N_R-N_L\]却是恒定不变的, 并且两者的模式差不取决于表面哈密顿量, 仅仅取决于体相的拓扑结构。更深一步来说, 其实$\Delta_n$是界面两边陈数的差值, 这再次体现了我们之前提到的体相表面对应性。
因为霍尔电导在$\mathcal{T}$保护下是奇函数, 因此B.3小结中描述的拓扑非平庸态可以只出现在$\mathcal{T}$对称性被破坏时。然而, 如果考虑到了自旋轨道相互作用, 那么即使$\mathcal{T}$对称性没有破缺, 在绝缘能带结构上仍然会出现一个与B.3小节中出现的用TNKK不变量分类不同的的拓扑类, 是为$Z_2$不变量。而理解这种由自旋轨道耦合引起的新的$Z_2$拓扑类的关键是去分析$\mathcal{T}$对称性在自旋 1/2 粒子中扮演的角色。
$\mathcal{T}$对称性可以用一个反幺正操作表示为$\Theta=\exp(i\pi S_y/\hbar)K$, 其中$S_y$是自旋算符, $K$是复共轭。对于自旋为 1/2 的电子而言, $\Theta$满足性质$\Theta^2=-1$。这引出一条重要的定理, 即克拉默定理 (Kramers’ theorem)。克拉默定理说的是, 如果哈密顿量满足时间反演对称性, 那么其所有本征态至少二重简并。这很容易理解, 因为如果存在一个非简并本征态$ | \chi \rangle$, 那么由哈密顿量与$\Theta$对易, 有$\Theta | \chi\rangle=c | \chi\rangle$, 自然有$\Theta^2 | \chi\rangle=\left | c \right | ^2 | \chi\rangle$。然而, 这与 $\Theta^2=-1$相违背了, 因此在$\mathcal{T}$对称性下必然有二重简并。在没有自旋轨道耦合情况下, 克拉默简并实际上就是自旋上和自旋下的简并。然而, 在有自旋轨道作用时, 克拉默定理就会得到一个非平庸的结果。 |
满足$\mathcal{T}$对称性的布洛赫哈密顿量必须满足如下形式:
\[\Theta \mathcal{H}(\boldsymbol{k})\Theta^{-1}=\mathcal{H}(-\boldsymbol{k})\tag{8}\]同上一节一样, 我们可以把在不闭合能带的前提下, 连续相互变换的哈密顿量归为一个等价类。这个情况下, TKNN不变量为$n=0$。但是这还存在这另外的不变量, 其取值可以为$\nu=0$或$\nu=1$ (Kane, Mele, 2005b)。
图三: 在两个边缘克拉默简并点之间的电子色散。 (a) 跨越费米面的表面态的次数是偶数; (b) 跨越费米面表面态的次数是奇数, 奇数次的跨越费米面会导致拓扑保护的边缘态。
在图三中, 我们画了一个和图二类似的$\mathcal{T}$不变的二维绝缘体边缘态的能带图。因为$\mathcal{T}$对称性要求, 在布里渊区内是关于$k_x=0$镜面对称的, 因此能带图只画出了$0<k_x<\pi/a$的部分 (其中 $\Gamma_a=0$且$\Gamma_b=\pi/a$)。就和图二中一样, 阴影部分描述了体相的导带和价带, 并且有一条分割两者的能隙。我们需要确定哈密顿量在边缘的细节才能确定在能隙中是否存在一个束缚在表面的边缘态。如果存在, 那么克拉默定理要求在$\mathcal{T}$对称性下, 在$0<k_x<\pi/a$的区间内, 这个态是二重简并的。图三中, 在远离由$\Gamma_{a,b}$标记的特殊点时, 自旋轨道相互作用就会显现, 并劈裂之前的二重简并。图三中展示了两种连接 $k_x=0$和$\pi /a$的方法, 比如图三 (a) 是将特殊点成对连接的。这种情况下, 我们可以通过将束缚态整体推离能隙来消灭边缘态。并且这种情况下, 能带穿过$E_F$偶数次。然而相反的是, 图三 (b) 就无法通过这种方法来消灭边缘态, 因为其穿过$E_F$奇数次。
那么问题就来了, 哪种能带连接方法是依赖于体相能带结构的拓扑类呢?因为$\mathcal{T}$不变, 每个在$k_x$方向穿过费米面的能带, 在其关于 $k_x=0$镜面对称的 $-k_x$的地方有着一条对应且相同的能带, 称为克拉默对应带 (Kramers partner)。因此, 体相边缘一致性会将穿过费米面的表面模式的克拉默配对 (Kramers pair) 的数量$N_K$和横跨界面的$\mathbb{Z}_2$不变量的改变, 即
\[N_K=\Delta\nu\mod 2\tag{9}\]我们总结了二维拓扑绝缘体被拓扑保护的态。这些态形成了一个独特的边缘电导, 我们会在第三部分讨论它们的性质。上述关于二维的讨论可以推广到被表面态保护的三维拓扑绝缘体, 其性质也会在第四部分被讨论。
那么问题就来了, 上面我们一直提到的$\mathbb{Z}2$不变量到底是什么呢?定义$\mathbb{Z}_2$不变量$\nu$的数学定理有很多, 关心的可自行阅读相关文献。其中一个方法是用布洛赫波函数定义了一个幺正矩阵$w{mn}(\boldsymbol{k})=\left< u_m(\boldsymbol{k}) \right | \Theta\left | u_n(\boldsymbol{-k})\right>$。我们可以分析其性质。首先, 因为$\Theta$是个反幺正的, 并且满足性质 $\Theta^2=-1$, 因此有$w^T(\boldsymbol{k})=-w(-\boldsymbol{k})$ 。其次, 由于二维体相布里渊区是一个上下相接, 左右相接的轮胎面, 因此其存在四个特殊点$\Lambda_a$。在这四个特殊点处, $\boldsymbol{k}$和$\boldsymbol{-k}$实际上是同一个点, 即$w(-\boldsymbol{k})=w(\boldsymbol{k})$。结合上述两点可知$w^T(\Lambda_a)=-w(\Lambda_a)$, 即在这四个特殊点处, 矩阵$w$是一个反幺正矩阵。我们知道, 如果矩阵是反幺正的, 则满足$\mathrm{Pf}[w(\Lambda_a)]^2=\det[w(\Lambda_a)]$, 其中$\mathrm{Pf}$操作指的是Pfaffian。这样我们就可以定义一个取值只能是$\pm1$的参数 $\delta_a=\mathrm{Pf}[w(\Lambda_a)]/\sqrt{\det[w(\Lambda_a)]}$。进一步可定义出$\mathbb{Z}_2$不变量 |
这个公式可以推广到三维拓扑绝缘体, 区别仅仅是三维布里渊区中的特殊点变成了八个。
如果晶体有其余的对称性, 那么上面的计算会变得更简单。比如在一个$S_z$守恒的体系中, 自旋上和自旋下的陈数$n_{\uparrow}$和$n_{\downarrow}$都是独立的, 并且$\mathcal{T}$对称性要求$n_{\uparrow}+n_{\downarrow}=0$。在量子自旋霍尔效应中, $n_\sigma=(n_{\uparrow}-n_{\downarrow})/2$定义了霍尔电导, 因此$\mathbb{Z}_2$不变量就可以简单地写成
\[\nu=n_\sigma\mod 2\]值得注意的是, 虽然可以通过量子自旋霍尔效应来计算$\mathbb{Z}2$不变量 (Sheng等人, 2006) , 但其并不是本质。因为当$S_z$不守恒时 (总会不可避免地出现) , 虽然$n{\uparrow}$和$n_{\downarrow}$都没有意义了, 但是 $\nu$仍然保持不变。
如果晶体有空间反演对称性, 就会有另一个简便算法 (傅亮和Kane, 2007)。在特殊点$\Lambda_a$处, 布洛赫态$u_m(\Lambda_a)$是宇称简并的, 其态带有本征值$\xi_m(\Lambda_a)=\pm1$。因此$\mathbb{Z}_2$不变量就可以简单地从公式 (10) 中推导而来, 即
\[\delta_a=\prod_{m} \xi_m(\Lambda_a)\]此处的连乘是乘遍所有的占据态的克拉默对。这已经被证明在根据能带结构来判断是否为拓扑绝缘体时非常有用 (傅亮和Kane, 2007; Teo, 傅亮, 和Kane, 2008; Guo和Franz, 2009; Zhang, Liu等, 2009; Pesin和Balents, 2010)。
用拓扑能带论来分类超导体看来是最近非常新奇的理论发展课题 (Roy, 2008; Schnyder等, 2008; Kitaev, 2009; 祁晓亮, Hughes等, 2009)。这一小节, 我们会给出一个最简单的超导模型, 更普适的情况会在最后提到。我们即将介绍拓扑超导的概念基础和超导体系中马约拉纳费米子的元激发。这节的内容是为了第五部分B小结打基础, 在第五部分我们会讨论拓扑超导绝缘体结构中马约拉纳费米子在量子计算中的可能应用。
在BCS平均场理论中, 无自旋电子系统的哈密顿量可以写成下列形式
\[H-\mu N=\frac{1}{2}\sum_{\boldsymbol{k}}(c_{\boldsymbol{k}}^+c_{-\boldsymbol{k}})\mathcal{H}_{BdG}({\boldsymbol{k}})\pmatrix{c_{\boldsymbol{k}}\c_{\boldsymbol{-k}}^+}\tag{13}\]此处$c_{\boldsymbol{k}}^+$是电子产生算符, $\mathcal{H}_{BdG}$是一个 $2\times2$的矩阵, 可以写成泡利矩阵$\vec{\tau}$的形式
math \mathcal{H}_{BdG}(\boldsymbol{k})=[\mathcal{H}_0(\boldsymbol{k})-\mu]\tau_z+\Delta_1(\boldsymbol{k})\tau_x+\Delta_2(\boldsymbol{k})\tau_y\tag{14}
此处$\mathcal{H}0(\boldsymbol{k})$是未超导时的布洛赫哈密顿量, $\Delta=\Delta_1+i\Delta_2$是BCS平均场理论中的配对能。其中对于无自旋的粒子而言, 其配对能一定是奇手性的, 即$\Delta(-\boldsymbol{k})=-\Delta(\boldsymbol{k})$。对于一个统一的系统而言, 超导激发谱由$\mathcal{H}{BdG}$的本征值给出, 其中存在着一个超导能隙。以上可以总结为, 空间依赖的布洛赫哈密顿量$\mathcal{H}_0(\boldsymbol{k})$和能隙 $\Delta$相关的薛定谔方程通常可以被Bogoliubov-de Gennes (BdG) 方程描述
因为公式 (13) 有$c$和$c^+$参与, 因此存在一个固有冗余信息。当 $\Delta=0$时, $\mathcal{H}{BdG}$包括两个带有相反正负号的 $\mathcal{H}_0$项。也就是说, $\mathcal{H}{BdG}$有一个内禀的粒子-空穴对称性 (particle-hole symmetry) , 可以表示为
\[\Xi\mathcal{H}(\boldsymbol{k})_{BdG}\Xi^{-1}=-\mathcal{H}_{BdG}(-\boldsymbol{k})\tag{15}\]其中引入粒子-空穴算符$\Xi=\tau_xK$, 其满足$\Xi^2=\pm1$。公式 (15) 满足$\mathcal{H}0(-\boldsymbol{k})=\mathcal{H}_0(\boldsymbol{k})^*$, 而且实数$\Delta(\boldsymbol{k})$满足奇手性, 即$\Delta(-\boldsymbol{k})=-\Delta(\boldsymbol{k})$。由此可见, 每一个能量为 E 的 $\mathcal{H}{BdG}$的本征态都有一个在$-E$处的对应态。其实这两个态是冗余的, 因为和它们有关的准粒子算符满足$\Gamma^+E=\Gamma{-E}$。因此, 创造一个在$E$处的准粒子态等价于在$-E$处消灭一个准粒子态。
公式 (15) 中的粒子-空穴对称性的约束有一个和公式 (8) 中时间反演对称性约束相似的结构, 所以我们很自然地可以用相似的分类法对BdG哈密顿量分类, 即是否能够在不关闭能带的情况下, 连续地从一个能带类型变化到另一个。在最简单的无自旋费米子情况下, 一维情况可以根据$\mathbb{Z}_2$不变量来分类, 而二维则是根据$\mathbb{Z}$不变量。像C小节中一样, 通过体相边界一致性来理解这种分类方法。
图四: 拓扑超导体 (TSC) 边缘态示意图 (a) 一维超导体的两个端点束缚态; (b) 普通一维超导的激发谱; (c) 一维拓扑超导体的激发谱; (d) 带有一个磁通量子二维拓扑超导体, 其与一个零能模相关; (e) 手性马约拉纳边缘态。 如图四 (a) 到四 (c) , 在一维超导体的两个端点上, 其束缚态可能分立也可能不分立 (Kitaev, 2000)。如果分立, 那么每个在$E$处的态都会有一个在$-E$处的对应态。这种态其实只是一般的超导态, 可以简单地从超导能隙推导而来。然而, 如果在$E=0$存在一个被保护的未配对的束缚态, 我们可以称之为零能模。而零能模是否存在, 可以根据一维超导体的体相$\mathbb{Z}_2$不变量来判断。
Bogoliubov准粒子态和零能模密切相关, 这已经成为一个相当有活力的研究课题 (Kitaev, 2000; Read, Green, 2000; Ivanov, 2001; Stern, von Oppen, Mariani, 2004; Nayak等, 2008)。因为满足 $\Gamma_0=\Gamma_0^+$ (我们可以称之为粒子 - 空穴冗余 (particle-hole redundancy) ) , 即粒子的反粒子和其本身相同, 这可以定义出马约拉纳费米子。一个马约拉纳费米子可以说是一个普通狄拉克费米子的一半。由于粒子-空穴冗余, 一个单费米子态可以和在$\pm E$处的粒子对态联系起来。这种零能模的存在与否定义了一个带有能量劈裂为$E$的二能级系统。马约拉纳零能模总是成对出现的 (比如一维超导体中有两个端点) , 并且一个劈裂的电子对态可以定义一个简并的并且非局域的二能级系统。这个发现意义深远, 我们会在第五章B节讨论Kitaev (2003) 关于量子信息的性质时候详细分析。
如图四 (d) 和 (e) 所示, 在二维情况下, 整数的拓扑不变量$\mathbb{Z}$给出了手性马约拉纳零能模的个数。这种情况和量子霍尔效应很想, 不过对应的对称性变成了粒子-孔洞对称性。一个最简单的二维拓扑超导的模型就是带有$p_x+ip_y$的对称性的无自旋超导体, 这种超导体在磁通涡旋中心也会表现出马约拉纳束缚态 (Caroli, de Gennes, Matricon, 1964; Volovik, 1999; Read, Graen, 2000)。如图四 (d) 所示, 我们可以通过把磁通涡旋看成是一个被边缘模式环绕的孔洞。当其孔洞的磁通是$h/2e$时, 边缘模式就被量子化成上面提到的$E=0$处的零能模。
马约拉纳费米子已经在粒子物理领域研究了好几十年, 然而它却从来没被观测到过 (Majorana, 1937; Wilczek, 2009)。中微子可能是个马约拉纳费米子, 不过仍然也没有确定。在凝聚态物理中, 马约拉纳费米子可以由一种配对的凝聚体产生。这种凝聚体允许费米型的准粒子配对, 然后“湮灭”成凝聚体。有许多物理体系已经预言马约拉纳费米子的存在, 他们都和无自旋的 $p_x+ip_y$ 超导有关。比如有 $\nu=5/2$ 的Moore-Read量子霍尔态 (Moore, Read, 1991; Greiter, 文小刚, Wilczek, 1992; Read, Green, 2000) , $\rm{Sr_2RuO_4}$ (Sarma, Nayak, Tewari, 2006) , 在Feshbach共振附近的费米型冷原子 (Gurarie, Radzihovsky, Andreev, 2005; Tewari等, 2007) , 具有超导、磁性和强自旋轨道耦合特征的二维体系 (Lee, 2009; Sato, Fujimoto, 2009; Sau等, 2010)。在第五章B小结中, 我们会讨论在拓扑绝缘体和普通超导体的界面上创造马约拉纳费米子的展望 (傅亮, Kane, 2008)。
表一: 拓扑绝缘体和拓扑超导的周期表。其中大写的Gamma是粒子-空穴算符乘上时间反演算符。正负一指的是算符平方的值, 而零代表无此对称性。 拓扑绝缘体和超导体结合在一起形成了一个复杂却优雅的数学结构, 由此我们可以用其来概括上面提到的拓扑能带论的概念 (Schnyder等, 2008; Kitaev, 2009; Schnyder等, 2009; Ryu等, 2010)。这种方法用对称性和维度分出了哈密顿量的等价类。对称性分类包括是否存在$\mathcal{T}$对称性$\Theta^2=\pm1$、是否存在粒子-空穴对称性$\Xi^2=\pm1$, 此外还包括十个与随机矩阵密切相关的分类 (Altland, Zirnbauer, 1997)。由$\mathbb{Z}$、$\mathbb{Z_2}$和 0 给出的拓扑分类可以如表一一样给出一个和维度及对称性有关的拓扑绝缘体和拓扑超导的周期表。
先前描述的所有拓扑体系, 如量子霍尔效应 (A类, 没有对称性, 二维) 、$\mathbb{Z}_2$拓扑绝缘体 (AII类, $\Theta^2=-1$,二维和三维) 、$\mathbb{Z}_2$和$\mathbb{Z}$拓扑超导 (D类, $\Xi^2=1$, 一维和二维) 都写在了周期表中。除此之外, 周期表中还有一些其它的非平庸的拓扑超导和超流相。每个非平庸的相都可以通过体相边缘一致性去预测是否有无带隙的边界态。其中一个值得注意的例子是 ^3HeB 的超流相 (Volovik, 2003; Roy, 2008; Schnyder等, 2008; Nagato, Higashitani, Nagai, 2009; 祁晓亮, Hughes等, 2009; Volovik, 2009) , 它属于DIII类, 并且有着 $\Theta^2=-1$, $\Xi^2=1$的三维拓扑性质, 从表中可知此对应着$\mathbb{Z}$不变量分类, 这预示着其表面存在无带隙的二维马约拉纳费米子模式。2001张首晟和胡江平报道了四维量子霍尔效应, 他们认为其可能对应着四维的A类或者AII类。然而, 表中还有很多维度的类在现实体系中没有对应, 还有待新的研究对其进行拓展。
二维拓扑绝缘体最为人所知的就是量子自旋霍尔绝缘体。最初理论证明这个量子态存在于石墨烯 (Kane, Mele, 2005a) 和存在均匀的应变梯度的二维半导体 (Bernevig, 张首晟, 2006)。随后的理论预言量子自旋霍尔态存在于 HgCdTe 体系的量子阱结构中 (Bernevig, Hughes, 张首晟, 2006) , 并且马上被实验观测到 (Konig等, 2007)。在本章的A节, 我们会介绍自旋量子霍尔态在石墨烯模型体系中的新奇边缘态; 在B节, 我们会回顾一下Koing等人在2008年, 在发现量子自旋霍尔态上所作出的实验上的贡献。
图五: 量子自旋霍尔效应 (QSHI) 的边缘态。 (a) QSHI和一个普通绝缘体的界面。 (b) 上下自旋向相反方向传播时, 石墨烯体系中边缘态的色散。
在上一章B节的第二小节 (石墨烯、狄拉克电子和Haldane模型) 中, 我们已经讨论过, 因为石墨烯的体系被$\mathcal{T}$对称性保护, 所以其中的狄拉克点上的简并态是受拓扑保护的。然而, 这个结论忽视了自旋对拓扑的重大影响。对于所有石墨烯中存在的对称性而言, 考虑自旋轨道相互作用都会在公式 (3) $\mathcal{H}(\boldsymbol{k})=\boldsymbol{h}(\boldsymbol{k}) \cdot\vec{\sigma}$中增添新的质量项。我们可以考虑最简单的情况, 内禀的自旋轨道相互作用是和电子自旋$S_z$对易的, 因此原来的哈密顿量可以解耦合成两个相互独立的自旋上和自旋下的哈密顿量。上述模型的理论结果仅仅是Haldane模型 (1988) 的两个copy而已, 区别仅仅是自旋上下的区别会导致霍尔电导的符号相反而已。因为时间反演会导致自旋和$\sigma_{xy}$都反转, 因此电导符号相反并不违反$\mathcal{T}$对称性。在一个外加电场的情况下, 自旋上的电子和自旋下的电子会分别产生两个方向相反的霍尔电流, 两电流因此抵消, 造成霍尔电导为零。然而, 实际上却还存在着一个量子化的自旋霍尔电导 (没有电流, 但是有自旋流) , 其定义为$\boldsymbol{J}x^{\uparrow}-\boldsymbol{J}_x^{\downarrow}=\sigma{xy}^S\boldsymbol{E}y$, 此处的$\sigma{xy}^S=e/2\pi$。类似的想法早在先前的关于$^3\rm{He}$薄膜的平面态中已经被提到 (Volovik, Yakovenko, 1989)。如图五所示, 因为这两个量子自旋霍尔态仅仅是量子霍态的两个copy, 因此它们一定是无带隙的边缘态。
上述的讨论都建立在自旋$S_z$是守恒的情况, 然而自旋$S_z$守恒并不是一个基本的对称性。因为在许多真实体系中, 自旋$S_z$不守恒是时常出现的, 这会使$\sigma_{xy}^S$变得没有意义。显然, 这种守恒失效引发了对“依靠自旋守恒去预测整数量子化的霍尔电导$\sigma_{xy}^S$”这一理论的质疑 (Volovik, Yakovenko, 1989; Bernevig, 张首晟, 2006; 祁晓亮, 吴咏时, 张首晟, 2006) , 同时关于非量子化自旋霍尔绝缘体的理论 (Murakami, Nagaosa, 张首晟, 2004) 也遭到质疑。但是在Kane和Mele (2005a) 的理论表面那个, 由于$\mathcal{T}$对称性, 即使当自旋守恒被打破时, 量子自旋霍尔绝缘体中的边缘态仍然是相当具有鲁棒性的, 因为边缘态的能带在 k=0 处的交叉是受到Kramers简并的保护的 (就像在上一章C节中讨论的一样)。这个理论就成功确认了量子自旋霍尔效应是一个拓扑相。
量子自旋霍尔边界态具有重要的“自旋过滤”的特性: 在边缘上, 自旋向上的电子都向同一个方向运动, 而自旋向下的电子向另一个方向传播。这种边缘态因为与自旋动量关联的螺旋性相类似, 因此后来被称为“螺旋的 (helical) ”边缘态 (吴从军, Bernevig, 张首晟, 2006)。这赋予了一维导体独特的性质, 总的来说, 可以说是正常一维导体的一半。在普通一维导体中, 在同一个方向传播的电流上既有向上自旋的电子, 同时也有向下自旋的。因为这种状态的电子易受弱无序引起的安德森局域化影响, 所以正常一维导体很脆弱。相比之下, 即使在强烈无序的情况下, 量子自旋霍尔边缘态也不会被局域化。我们可以把量子自旋霍尔边缘态想象成一个有限区域内有强无序, 然而在其周围有完全清洁的边缘的情况。从数学上看, 我们可以解在无序区域附近的入射与散射的散射问题来确定其本征态。Kane和Mele (2005a) 的结果表明, 在$\mathcal{T}$对称性下, 因为涉及自旋翻转 (flipping the spin) , 因此这个本征态的反射振幅是奇数的。因此除非$\mathcal{T}$对称性被破坏, 入射电子总能完美地穿过无序的区域。总结来说, 任何情况这种量子自旋霍尔边缘态都会分布在更长的空间中, 尤其是当 T=0 时, 其就成为弹道输运; 而对于 T>0 的情况而言, 这允许非弹性的背散射过程, 因此会有一个有限的电导。
和上述强无序类似, 这种受保护的边缘态也不受弱电相互作用影响。然而, 对于强相互作用而言, Luttinger液体效应会导致磁不稳定性 (吴从军, Bernevig, 张首晟, 2006)。这种强相互作用的相非常有趣, 因为它会表现出类似于孤子 (soliton) (苏武沛, Schrieffer, Heeger, 1979) 一样带有二分之一电荷的准粒子。
石墨烯中的碳是一种自旋轨道相互作用很弱的元素。虽然对于石墨烯带隙的具体大小有很多争议 (Huertas-Hernando, Guinea, Brataas, 2006; Min等, 2006; Boettger, Trickey, 2007; 姚裕贵等, 2007; Gmitra等, 2009) , 但是能带相对较小应该是确定的。显然, 我们要寻找上一小结中描述的物理, 一个更好的选择应该是具有强自旋轨道相互作用的体系, 这样一来就可以验证自旋不守恒体系的拓扑态的鲁棒性。要找到强自旋轨道耦合的体系, 我们应该找元素周期表中, 最下面几行的重元素。最后, Bernevig, Hughes和张首晟 (BHZ) 提出了 HgCdTe 量子阱的想法。这为量子自旋霍尔绝缘体相的发现铺平了道路。
$\rm{Hg_{1-x}Cd_{x}Te}$是具有强自旋轨道耦合的半导体 (Dornhaus, Nimtz, 1983) ; CdTe 有一个和半导体类似的能带结构。其在导带边上的态有一个类 s 的对称性, 而价带边上的太具有类 p 的对称性。与之相反, HgTe 的类 p 能级上升到了类 s 能级的上方, 由此造成了一个能带反转的结构 (图六 (b) )。BHZ考虑, 是否我们可以把 HgTe 和 CdTe 两种晶体做成三明治型的量子阱的结构 (图六 (a) ) , 这样就能在两种能带中连续调节了。他们发现, 当 HgTe 的厚度在$d<d_c=6.3\ \rm nm$的时候, 束缚在量子阱中的二维电子态是和正常能带一样的, 然而当$d>d_c$时, 二维能带就会反转。BHZ将这种能带反转视为平庸绝缘体和量子自旋霍尔绝缘体之间随着中间层厚度变化的相变。这可以粗略理解为系统有空间反演对称性。在此情况下, 因为 s 和 p 态有相反的手性, 能带会不可避免地在$d=d_c$时交叉, 此时能隙就消失了。由公式 (12) 可以得知, 价带边态的手性的变化是$\mathbb{Z}_2$不变量变化时, 拓扑相变的一个标志。
图六: HgTe/CdTe量子阱的实验。 (a) 量子阱结构; (b) 二维量子阱随层厚变化时能带反转; 反转态是 (c) 螺旋形的量子自旋霍尔绝缘体; (d) 随可调节费米能级的门电压变化的边缘电阻; 样品I是小于6.3 nm展现普通绝缘体行为, III和IV展现与边缘态相关的量子化的输运。
在理论提出一年以后, 由Laurens Molenkamp领导的Wurzburg组成功制备除了这样的器件, 并且测量了输运实验, 这展现了量子自旋霍尔绝缘体最重要的一个特征。Konig等人 (2007) 测量了边缘态的电导。低温下的弹道输运也可以用简单的Landauer-Buttiker (Buttiker, 1988) 框架来描述: 边缘态的占据是根据铅的化学势来决定的。同时这也告诉我们, 每一组边缘态都给出一个量子化的电导 $e^2/h$。图六 (d) 展示了一系列样品的电阻随门电压的变化的示意图。此处门电压是可以通过调控体相能隙从而调节费米能级 (也就是化学势)。样品I是一个窄量子阱, 因此有一个大电阻。样品III和IV给出了一个与价带顶和导带底相关的量子化的电导$2e^2/h$。样品III和IV有相同的长度$L=1\ \mu m$, 但是有不同的宽度, 分别为 w=0.5 和$1\ \rm \mu m$, 这代表了此输运现象确实在边缘。样品II ( $L=20\ \rm \mu m$ ) 说明了有限温的散射效应。这些实验有力证明了量子自旋霍尔边缘态确实存在。
个人理解:
自旋量子霍尔效应的本质是自旋轨道耦合 (SOC)。在石墨烯模型中, SOC提供了Haldane模型中打破时间反演对称的交错磁通的作用; 而在BHZ中, SOC提供了能带反转。
其中的时间反演对称仅仅是保护拓扑态稳定而已, 在石墨烯模型中, 虽然SOC打破了单种自旋的时间反演对称, 但是两种自旋都打破时间反演对称情况下, 互相转变, 整个体系还是时间反演对称的。因此石墨烯中的边缘态不受时间杂质影响。然而, 如果这种杂质是磁性的, 那么会打破整个体系的时间反演对称, 此时的边缘态就不受保护了。
在2006年夏天, 三个理论小组独立地发现了量子霍尔绝缘态在三维空间中的拓扑性质 (傅亮, Kane, Mele, 2007; Moore, Balents, 2007; Roy, 2009b)。Moore和Balents (2007) 造了“拓扑绝缘体 (topological insulator, TI) ”这个词来描述上述说的电子态。傅亮、Kane和Mele (2007) 将体相的拓扑序和表面独特的导电态联系起来, 并预测了多个拓扑绝缘体体系的真实材料 (傅亮, Kane, 2007) , 其中包括$\rm Bi_{1-x}Sb_x$ 、应力作用的$\rm HgTe$和$\alpha-\rm Sn$。2008年, Hsieh等人报道了第一个3D拓扑绝缘体$\rm Bi_{1-x}Sb_x$的实验发现。2009年, 包括具有众多理想特性的$\rm Bi_2Sn_3$在内的第二代拓扑绝缘体在实验上 (Y. Xia, 钱冬, Hsieh, Wray等, 2009) 和理论上 (张海军, 刘朝星等人, 2009) 被发现。在本节中, 我们将回顾这些发展。
图七: 在表面布里渊区中, 弱拓扑绝缘体的费米环 (a) 和强拓扑绝缘体的费米环 (b) ; (c) 在最简单的强拓扑绝缘体中, 费米环会围住一个狄拉克点。 三维拓扑绝缘体的性质有四个$\mathbb{Z}_2$不变量$\nu_0$;$\nu_1\nu_2\nu_3$决定 (傅亮, Kane, Mele, 2007; Moore, Balents, 2007; Roy, 2009b)。就如同在 (二) 章C小节中讨论的那样, 我们可以通过体相边界一致性来简单理解。三维晶体的表面态可以通过二维晶体动量来标记。
如图七, 在表面布里渊区中, 存在四个时间反演不变点$\Gamma_{1,2,3,4}$ (由时间反演不变决定布里渊区随$\Gamma_1$点中心对称, 而倒空间布里渊区平移不变导致这四个点时间反演后变为自己本身, 因此称为时间反演不变点) , 在这些点上如果存在表面态的话, 那这些点必存在克拉默简并态 (由中心对称可知在第一象限有一条能带穿过$\Gamma_2$点, 在第四象限必然也有一条能带穿过由时间反演变换后的$\Gamma_2$点, 由于平移不变, 这两个点是同一个点, 因此有时间反演对称, 在$\Gamma_2$处必然有两条能带交汇, 因此必定有简并态) , 即时间反演不变点上的表面态必定成对存在 (如图七 (a) 和七 (b) )。在远离这些时间反演不变点处, 由于SOC的作用, 时间反演不再保持, 从而将两个边缘态分开, 它们不再简并。从能带上看就是这两条能带在时间反演不变点上交叉了, 而不在时间反演对称点上时他们分开了, 就如同图七 (c) 一样, 时间反演不变点在能带交叉以后, 形成了一个狄拉克点。一个更有趣的问题是, 在不同的简并点 (或者说时间反演不变点, 有时候是狄拉克点) 之间, 能带是怎样将这些点连接起来的。我们重新考察 (二) 章C节中讲到的图三, 其就展示出了两个简并点之间能带的连接方法。如果这两个点之间的连接的能带穿过费米面偶数次, 则表面态不受拓扑保护 (因为我们可以调节费米面让两个点之间的能带都位于费米面之上) ; 而如果是奇数, 则表面态受费米面保护。而这两种连接方法的出现与否, 取决于四个$\mathbb{Z}_2$不变量的值。
最简单的3D拓扑绝缘体可以通过将多层的2D量子自旋霍尔绝缘体 (quantum spin Hall insulator,QSHI, 也就是拓扑绝缘体) 垒起来得到。得到的结构是和3D整数量子霍尔态 (3D integer quantum Hall state) (Kohmoto, Halperin, 吴咏时, 1992) 的结构是相似的。
这种将2D量子自旋霍尔绝缘体垒起来的3D拓扑绝缘体会将之前在 (三) 章中提到的螺旋形的边缘态变成各向异性的表面态。一种可能的表面布里渊区中的费米面就如同图七 (a) 所示, 这种单一能带在$\Gamma_{1,2}$之间和$\Gamma_{3,4}$之间穿过费米面的情况被称为弱拓扑绝缘体。它们如同图三 (b) 中显示的, 其连接的能带穿过费米面的次数是奇数, 因此是拓扑非平庸的。弱拓扑绝缘体其中的“弱”, 源于这种拓扑绝缘体之间是通过2D拓扑绝缘体一层一层垒起来的, 其层间耦合相当弱, 拓扑性质来源于层内, 而整个3D拓扑绝缘体的性质。这种弱拓扑绝缘体的标志是其拓扑不变量$\nu_0=0$, 而指数$(\nu_1\nu_2\nu_3)$用于描述2D拓扑绝缘体垒起来的方向的密勒指数。
和单层2D螺旋形边缘态不同的是, $\mathcal{T}$对称并不保护3D的边缘态。虽然在干净表面上一定会有表面态, 但它们不像2D一样不受安德森局域化影响, 反而会因为某些无序的杂质局域在某处。此外, 与此相关的一个有趣的小问题可顺便一提。并非所有弱拓扑绝缘体都不受保护, 在弱拓扑绝缘体中的线性位错其实与受保护的1D螺旋形边缘态密切相关。
反之, 我们用$\nu_0=1$标记不能单纯用2D拓扑绝缘体垒起来的相, 称为强拓扑绝缘体。$\nu_0$确定费米面包围克拉默简并点的个数是奇数还是偶数。在强拓扑绝缘体中, 费米面圈出了奇数个克拉默简并狄拉克点, 就像图七 (b) 和 (c) 所示的那样。这种情况下的哈密顿量为
\[\mathcal{H}_{surface}=-i\hbar v_F\vec{\sigma}\cdot\vec{\nabla}\tag{16}\]此处$\vec{\sigma}$标记了自旋矢量算符 (对于一个镜面对称的表面而言, 对称性要求$\vec{S}\propto \hat{z}\times\vec{\sigma}$)。
除了狄拉克点的个数不同以外, 拓扑绝缘体的表面电子结构和石墨烯很像。石墨烯有四个狄拉克点, 由两个谷乘两个自旋态构成, 而拓扑绝缘体只有一个单独的狄拉克点。这种单狄拉克点的情况看起来是违背了我们在第二章B.2中提到的费米子加倍定理 (Nielssen, Ninomiya, 1983)。定理表述为: 在时间反演对称不被打破的情况下, 狄拉克点总是成对出现。但其实3D拓扑绝缘体的单狄拉克点现象并未违反这个定理, 只是这个狄拉克点的对应点在3D拓扑绝缘体的另一个相反的表面倒空间上而已。
强拓扑绝缘体的表面实际上形成了一个特殊的二维拓扑金属 (傅亮, Kane, 2007; 傅亮, Kane, Mele, 2007)。和普通金属不同的是, 我们可以把它看成是普通金属的一半。普通金属在费米面上的每个点都是自旋简并的, 也就是每个点都有上下自旋; 而拓扑金属态则是自旋分离的。在$\mathcal{T}$对称性的要求下, 在动量$\boldsymbol{k}$和$-\boldsymbol{k}$处的自旋要相反, 因此自旋方向会像图七 (b) 一样绕着费米面旋转。这种旋转会有拓扑不平庸的贝里相位 (Berry phase) 出现。$\mathcal{T}$对称性要求, 贝里相位只能在 0 和 $\pi$之间选择。每当电子绕着狄拉克点转过$2\pi$时, 贝里相位就会改变 $\pi$。
贝里相位对磁场下的行为 (在接下来的第五章A节会提到) 和无序效应有重要影响。特别是在2D电子气中, 无序会导致安德森局域化 (Anderson localization) (Lee, Ramakrishnan, 1985) , 进而表现出电导随温度下降而降低的现象。而具有$\pi$贝里相位的电子气则完全不同, 它改变了弱局域化和电导之间的关系, 呈现出电导随温度降低而升高的弱反局域化 (Suzuura, Ando, 2002)。事实上, 即使无序非常强, 只要体相能带是不变的, 强拓扑绝缘体的表面电子都不会表现出局域化的特征 (Nomura, Koshino, Ryu, 2007)。仅就这个特征来看, 这倒是和在第三章A节中讨论的量子自旋霍尔绝缘体的边缘态非常相似; 然而不同的是, 此处的电子运动是扩散输运, 而非量子自旋霍尔绝缘体一样是弹道输运。
公式 (16) 中的Dirac表面态可以用3D Dirac理论 (祁晓亮, Hughes, 张首晟, 2008) 解释。在这个理论中, Dirac质量和公式 (6) 一样会在表面变号 (3D拓扑绝缘体内由于对称性原因与真空中的Dirac质量不同, 因此在表面上有一个介于两者之间的态) , 这种畴-壁 (domain wall) 态在$\rm Pb_{1-x}Sn_xTe$体系中被讨论 (Volkov, Pankratov, 1985; Fradkin, Dagotto, Boyanovsky, 1986)。在这个体系中, 能带反转是$x$的函数 ($x$是界面法向坐标) , 并且在一个合适的界面上我们预测其存在2D无带隙态。值得注意的是, 这种表面态和拓扑绝缘体的表面态有着很重要的区别, 其在于 $\rm Pb_{1-x}Sn_xTe$体系的能带反转发生在四个等效的能谷上。因为四是偶数, 因此$\rm{PbTe}$和$\rm{SnTe}$是拓扑平庸的绝缘体, 其界面态不受拓扑保护。然而, 我们如果在其上加上单轴应力, 其能谷就会在能带反转附近劈裂 (傅亮, Kane, 2007) , 同样的套路也被用在$\rm HgTe$和$\rm CdTe$体系 (Cade, 1985; 張亞中等, 1985; 林留玉仁, Sham, 1985; Pankratov, Pakhomov, Volkov, 1987)。施加单轴应力后, 四个能谷就不再等价, 能带反转只会出现在单个能谷上。但是由于$\rm HgTe$是一个无带隙的半导体, 因此表面态是不受拓扑保护的。然而, 如果通过施加单轴应力破坏 $\rm HgTe$体相的立方对称的话, 那么带隙就会出现在$\rm HgTe$中, 进而 $\rm HgTe-CdTe$界面体系会有拓扑保护的边缘态 (傅亮, Kane, 2007)。
Colloquium: Topological Insulators https://journals.aps.org/rmp/abstract/10.1103/RevModPhys.82.3045