Programme de recherche

Une grande partie des technologies modernes (les ordinateurs, les télécommunications et l'électronique en général) repose sur les propriétés des électrons dans les solides. Selon leur comportement, un solide peut être un métal, un isolant, un aimant, un semiconducteur, un supraconducteur, etc. Notre compréhension théorique des électrons dans les solides est basée sur la mécanique quantique, mais souvent dans le cadre d'un modèle simple ou les électrons interagissent faiblement entre eux. Ce modèle est mis en échec dans plusieurs matériaux où l'effet des interactions électron-électron est capital. On dit alors que les électrons sont fortement corrélés. Je travaille sur des modèles théoriques d'électrons fortement corrélés, à l'aide des outils de la mécanique quantique et de puissants ordinateurs.

Plusieurs familles de matériaux sont fortement corrélés, mais la plus célèbre rassemble les supraconducteurs à haute température critique, découverts à la fin des années 1980. La supraconductivité est un phénomène inusité par lequel un matériau, à température suffisamment basse, perd toute résistance électrique et expulse tout champ magnétique. Ce phénomène est bien compris dans les alliages métalliques "traditionnels", où il est causé par une attraction effective entre électrons due aux vibrations du cristal. Mais dans les supraconducteurs à haute température, une autre explication est requise. Plusieurs physiciens croient que la forte répulsion mutuelle des électrons, qui normalement les confineraient à des positions fixes dans un état isolant, peut paradoxalement causer une attraction effective dans certaines circonstances et mener à la supraconductivité. L'un des buts de mes travaux est de vérifier si cela est vrai dans un modèle simple d'électrons fortement corrélés: le modèle de Hubbard. Ce modèle est défini par le hamiltonien suivant, dans le langage de la deuxième quantification:

$$ H = \sum_{i,j} t_{ij} c_i^\dagger c_j + U \sum_i n_{i\uparrow}n_{i\downarrow} - \mu\sum_i n_i $$

J'utilise pour cela une nouvelle méthode théorique que j'ai contribué à développer et qui allie la puissance de calcul des superordinateurs aux calculs analytiques. D'autres familles de matériaux, comme les supraconducteurs organiques ou les isolants topologiques, peuvent être étudiés de la même manière.

Pour une revue plus technique des méthodes utilisées dans mes recherches, voir: David Sénéchal, An introduction to quantum cluster methods, arXiv:0806.2690 (2008). Pour une introduction plus détaillée à certains des concepts évoqués ci-dessous, voir les sections énumérées ci-dessous.

 

 

Qu'est-ce que la supraconductivité?

La supraconductivité est un phénomène fascinant par lequel un matériau perd toute résistance électrique en-deça d'une certaine température appelée température critique et notée $T_c$. Il a été découvert en 1911 par Kammerlingh-Onnes à l'Université de Leyde. Kammerlingh-Onnes était un pionnier de la cryogénie et a été  le premier à avoir liquéfié l'hélium. En abaissant la température du mercure autour de 4K, il observa une chute brutale de la résistance de l'échantillon (données de l'époque):

L'absence de résistance électrique n'est cependant qu'un des aspects de la supraconductivité, et pas le plus fondamental. Une autre propriété remarquable est l'effet Meissner (Meissner et Ochsenfeld, 1935), par lequel un supraconducteur expulse un champ magnétique qui tente de le pénétrer. Cette propriété rend possible la lévitation magnétique: dans l'image ci-dessous, un échantillon supraconducteur refroidi à l'azote liquide est en lévitation sur un aimant.

Il faut ici préciser qu'il y a deux types de supraconducteurs, désignés avec beaucoup d'imagination comme de type I et de type II. Les supraconducteurs de type I expulsent complètement le champ magnétique jusqu'à concurrence d'une valeur critique du champ notée $H_{c1}$; au-delà de cette valeur, la supraconductivité disparaît. Les supraconducteurs de type II font de même, sauf qu'ils permettent une pénétration partielle du champ magnétique au-delà de $H_{c1}$, via des tubes de flux magnétiques appelés vortex. Chaque vortex porte un quantum de flux magnétique défini par l'expression $h/2e$, où $h$ est la constante de Planck et $e$ la charge élémentaire. Quand le champ magnétique augmente au-delà de $H_{c1}$, les vortex forment un réseau de plus en plus serré dans le supraconducteur, jusqu'à une deuxième valeur critique $H_{c2}$ du champ magnétique, au-delà de laquelle les vortex se fusionnent effectivement et la supraconductivité disparaît.

Il a fallu plus de cinquante ans avant qu'une théorie fondamentale explique la supraconductivité: c'est la théorie de Bardeen-Cooper-Schrieffer (ou théorie BCS), publiée en 1957. Ses auteurs furent récompensés par le prix Nobel de physique en 1972. Selon cette théorie, la supraconductivité est causée par la formation de paires d'électrons (les paires de Cooper), en raison d'une force d'attraction effective entre les électrons. Les électrons sont des fermions, mais les paires de Cooper sont des bosons et ces bosons peuvent collectivement condenser dans leur état fondamental. Ce condensat possède une cohérence de phase (au sens de la mécanique quantique) et se comporte en quelque sorte "comme un seul homme" lorsqu'une perturbation externe (champ électrique ou champ magnétique) est appliquée. Ce qui précède mérite cependant d'être qualifié: les paires de Cooper ne sont pas des "molécules électroniques", mais se manifestent plutôt par des corrélations entre électrons qui ont un effet sur des distances plus grandes que l'échelle atomique. 

Quelle est la force mystérieuse qui cause l'appariement des électrons? Dans les supraconducteurs dits "conventionnels", cette force est fournie par l'interaction des électrons avec les vibrations du réseau cristallin (les phonons). Pour employer un langage courant en physique des particules élémentaires, les électrons d'un solide peuvent s'échanger des phonons virtuels, tout comme ils s'échangent des photons virtuels dans le vide. L'échange de phonons virtuels est façon de décrire l'interaction électromagnétique. Les photons ayant un spin 1, on peut montrer que cette interaction est répulsive entre particules de mêmes charges. Par contre, les phonons ont un spin 0, ce qui entraîne que l'interaction correspondante est attractive.

 

Les supraconducteurs à haute température critique

En 1986, on découvrit une nouvelle catégorie de matériaux supraconducteurs, qui ont rapidement fracassé les records de température critique. Jusque là, le record était $T_c=11$K. En quelques mois, on atteint la valeur $T_c=135K$. Ces matériaux ont une structure moléculaire relativement compliquée, mais dont le point commun est la présence de plans de cuivre-oxygène (unité de base CuO$_2$), comme illustré ci-dessous:

Les cuprates supraconducteurs sont des matériaux quasi-bidimensionnels, c'est-à-dire que la mobilité des électrons entre les plans de CuO$_2$ est beaucoup moindre qu'au sein d'un plan. Pour cette raison, les modèles théoriques avancés pour comprendre le comportement des électrons dans les cuprates sont génréralement définis en deux dimensions et se veulent une modélisation des plans de CuO$_2$.

Il est important de souligner que les cuprates supraconducteurs ont une formule chimique variable (les symboles $x$ et $\delta$ dans la figure ci-dessous). Les composés dits stoechiométriques ($x=0$ ou $\delta=0$) ne sont pas supraconducteurs. Ce sont plutôt des isolants antiferromagnétiques. Un antiferroaimant est un matériau dans lequel les spins des atomes voisins sont ordonnés de manière antiparallèle, comme illustré ci-dessous:

Sur cette illustration, qui représente schématiquement un plan de CuO$_2$, les atomes de cuivre sont représentés en bleu et les atomes d'oxygène en rouge. Plus précisément, on représente une orbitale $d_{x^2-y^2}$ du cuivre, avec ses quatres lobes, et des orbitales $p_x$ et $p_y$ pour l'oxygène. L'orbitale $d$ du cuivre contient en moyenne un électron et le spin de cet électron a tendance à s'ordonner dans des directions alternées d'un atome de cuivre à l'autre.

Quand on introduit dans les cuprates des dopants ($x>0$) ou des oxygènes supplémentaires ($\delta>0$) qui vont se loger entre les plans de CuO$_2$, ces atomes vont soit capturer ou donner des électrons supplémentaire aux plans de CuO$_2$. Les plans sont alors dopés en trous ou en électrons selon le cas. Au-delà d'un certain dopage, l'antiferromagnétisme disparaît et la supraconductivité apparaît. Le diagramme de phase ci-dessous résume schématiquement la situation. La phase supraconductrice (en jaune) apparaît un peu en bas de 10% de dopage et disparaît un peu avant 30%, avec un maximum autour de 15% (les valeurs exactes dépendent des composés). En plus de cette phase, d'autres phénomènes curieux apparaissent. Signalons notamment une phase dite d'onde de densité de charge (ODS) , en compétition avec la supraconductivité, mais révélée quand cette dernière est supprimée par l'application d'un champ magnétique important. Une ODS se manifeste par une variation périodique de la densité d'électrons qui ne s'accorde pas à la période du réseau cristallin.

Également important est le phénomène appelé pseudogap. Ceci se manifeste par une disparition partielle des électrons de faible énergie, ce qui diminue la capacité du matériau à conduire l'électricité. Les cuprates supraconducteurs sont étranges à plus d'un titre. Leur compréhension théorique prend peu à peu forme, et cela 30 ans après leur découverte. La richesse de ce diagramme de phase de ces matériaux et la difficulté à l'expliquer théoriquement est liée à l'importance particulière des interactions électron-électron dans ces matériaux. On dits qu'ils sont fortement corrélés.

 

Le modèle de Hubbard

Le modèle de Hubbard est un modèle simple visant à décrire des électrons en interaction mutuelle dans un solide cristallin. En fait, il ne s'agit pas d'un modèle unique, mais plutôt d'une famille de modèles, dans laquelle on peut faire varier la structure de bande des électrons, ou le nombre de bandes considérées.

Commençons par décrire de manière rudimentaire la théorie des bandes dans les solides. Cette théorie néglige l'interaction mutuelle des électrons. Chaque électron est considéré comme indépendant, et se déplace dans un réseau cristallin, c'est-à-dire un arrangement régulier d'ions positifs. L'électron est alors sous l'influence d'un potentiel périodique $V(\mathbf{r})$ et le théorème de Bloch s'applique: les états quantiques possibles sont caractérisés par un indice de bande discret $n$ et un vecteur d'onde $\mathbf{k}$: $|n,\mathbf{k}\rangle$. L'énergie associée $E_n(\mathbf{k})$ constitue ce qu'on appelle la relation de dispersion des électrons, qui dépend de l'indice $n$. Le spectre en énergie est formée de bandes qui peuvent se superposer partiellement ou non.

Dans cette approche, l'état fondamental d'un système de $N$ électrons est obtenu en peuplant les $N$ états ayant les énergies les plus basses. Les bandes d'énergie complètement occupées, si elles sont bien séparées du dernier niveau occupé (le niveau de Fermi), sont effectivement inertes et on peut se concentrer sur les états proche du niveau de Fermi. Supposons, pour simplifier, qu'une seule bande d'états est présente autour du niveau de Fermi et qu'elle n'est que partiellement remplie. Pour décrire cet ensemble d'états, on peut utiliser une base faite d'états localisés autour de chaque atome, un peu comme des orbitales atomiques. Chaque site du réseau cristallin est alors associé à un état de cette base, et on peut dire, avec un léger abus de langage, qu'un électron saute d'un site à l'autre quand il effectue une transition quantique d'un état de base à un autre. Cette approche est illustrée par la figure suivante:

Chaque site du réseau carré correspond à un atome, et plus précisément à un état de base localisé autour de cet atome. Cet état peut être occupé par un électron de spin up, un électron de spin down, deux électrons de spins opposés ou pas d'électrons du tout. Les électrons peuvent en outre sauter d'un site numéroté $i$ vers un site voisin, numéroté $j$, avec une certaine amplitude de probabilité notée $t_{ij}$. Enfin, le fait d'occuper un site donné par deux électrons de spins opposés ajoute une énergie $U$ au système, en raison de la répulsion électrique entre électrons. Bien sûr, cette répulsion existe aussi entre des électrons occupant des sites voisins ou plus éloignés, mais elle est moins forte que $U$ dans ce cas et est négligée dans le modèle de Hubbard.

On peut décrire ce modèle plus exactement dans le langage de la deuxième quantification. Si $c_{i\sigma}$ est un opérateur quantique qui fait passer l'occupation de l'état centré au site $i$ par un électron de spin $\sigma$ ($\uparrow$ ou $\downarrow$) de 1 à 0, et que $c_{i\sigma}^\dagger$ fait le contraire (de 0 à 1), alors le hamiltonien du modèle de Hubbard peut s'écrire ainsi:

$$ H = \sum_{i,j,\sigma} t_{ij} c_{i,\sigma}^\dagger c_{j,\sigma} + U \sum_i n_{i\uparrow}n_{i\downarrow} - \mu\sum_i (n_{i\uparrow}+n_{i\downarrow}) $$

($\mu$ est le potentiel chimique, un paramètre qui contrôle le nombre d'électrons dans le système). Le nombre d'électrons de spin $\sigma$ au site $i$ est

$$ n_{i\sigma} = c_{i,\sigma}^\dagger c_{i,\sigma} $$

L'énergie d'interaction $U$ n'a donc un effet que si deux électrons de spins opposés sont présents sur un même site.

Ce modèle, extrêmement simple à définir, est par contre extrêmement complexe à étudier. Il n'existe une solution analytique que dans le cas particulier d'une seule dimension d'espace, dans le cas où les électrons ne peuvent sauter que d'un site vers ses voisins immédiats, avec une amplitude $t$.

On peut facilement généraliser ce modèle en considérant plus d'une bande; on parle alors d'un modèle de Hubbard à 2 bandes, 3 bandes, etc. On peut également introduire une interaction entre des électrons situés sur des sites voisins; on parle alors d'un modèle de Hubbard étendu.

Le modèle de Hubbard: stratégies de solution

Comment faire des prédictions à l'aide du modèle de Hubbard? Il faut être en mesure de calculer, du moins approximativement, les valeurs moyennes de certaines observables physique dans ce modèle. Ces valeurs peuvent être thermodynamiques (donc à température non nulle), ou encore quantiques (à température nulle). Les stratégies de calcul sont différentes selon le cas.

À température nulle, ce sont les valeurs moyennes dans l'état fondamental qui nous intéressent. Comme la tâche est impossible à réaliser de manière analytique, on doit nécessairement avoir recours à des méthodes numériques. Une méthode de force brute consisterait à représenter le hamiltonien $H$ par une matrice et à calculer numériquement le vecteur propre associé à la valeur propre la plus basse. Le problème avec cette approche est que la dimension de cette matrice serait $d=4^L$, où $L$ est le nombre de sites. Or, même avec un système aussi petit que 32 sites, la mémoire requise pour stocker l'état fondamental en double précision serait de $2^{67}$ octets, soit plus de cent milliards de gigaoctets. Cette mémoire augmente exponentiellement avec le nombre de sites. Il faut donc oublier la méthode brutale sauf pour des systèmes relativement petits (en pratique 16 sites ou moins).

Il faut remarquer que la connaissance de l'état fondamental lui-même n'est pas vraiment requise. Ce sont les valeurs moyennes d'observables qui nous importent. La fonction d'onde de l'état fondamental contient en fait beaucoup trop d'information, comme on l'a vu ci-dessus. Il existe des objets mathématiques beaucoup plus simples qui contiennent l'information nécessaire: les fonctions de Green. Les méthodes numériques que nous utilisons sont en fait des méthodes de calcul approximatif des fonctions de Green.

 

Les fonctions de Green

Plusieurs définitions équivalentes de la fonction de Green existent. Nous allons en donner une qui est valable à température nulle: si $i$ et $j$ dénotent deux sites dans le modèle de Hubbard, alors la fonction de Green à un électron, notée $G_{ij}(z)$, où $z$ est une variable complexe, est définie ainsi:

$$ G_{ij}(z) = \langle \Psi_0|c_i\frac1{z-H+E_0}c^\dagger_j|\Psi_0\rangle + \langle \Psi_0|c_j^\dagger\frac1{z+H-E_0}c_i|\Psi_0\rangle $$

où $|\Psi_0\rangle$ est l'état fondamental, $E_0$ l'énergie associée et $H$ le hamiltonien. La définition ci-dessus peut sembler difficilement applicable, car elle requiert de connaître l'état fondamental $|\Psi_0\rangle$ afin de calculer $G_{ij}(z)$, et nous voulons justement éviter d'avoir à calculer $|\Psi_0\rangle$. Notons que la fonction de Green est une quantité relativement simple en comparaison de la fonction d'onde: pour $L$ sites, il s'agit d'un ensemble de $L^2$ fonctions de la fréquence, au lieu d'un ensemble de $2^{2L}$ coefficients numériques. La différence est énorme.

Par contre, nous aurons recours à des stratégies d'approximation qui ont comme ingrédient la fonction de Green définie sur un petit système (moins de 16 sites) afin d'en trouver une approximation dans la limite thermodynamique ($L\to\infty$). Ces stratégies s'appliquent à la fonction de Green, mais pas pour l'état fondamental lui-même. On les appelle les méthodes d'amas quantiques. Elles consistent à diviser le réseau en amas identiques et à formuler une approximation pour la fonction de Green du réseau infini à partir de la fonction de Green d'un seul amas, calculée numériquement. Ces diverses méthodes sont souvent désignées par leurs acronymes

  • CPT : Cluster Perturbation Theory
  • VCA : Variational Cluster Approximation (ou encore variational CPT)
  • CDMFT : Cluster Dynamical Mean Field Theory
  • DCA : Dynamical Cluster Approximation
  • CDIA : Cluster Dynamical Impurity Approximation