Vue d’artiste de l’intérieur d’une cellule. Les éléments colorés sont des protéines. « Digital Renders by Evan Ingersoll & Gael McGill Paintings by David Goodsell ». Vue d’artiste de l’intérieur d’une cellule. Les éléments colorés sont des protéines. « Digital Renders by Evan Ingersoll & Gael McGill Paintings by David Goodsell ».

Entre physique et biologie déchiffrer le mouvement des protéines

Dossier : Nouvelles du PlatâlMagazine N°782 Février 2023
Par Hippolyte VERDIER (X14)

Obser­ver le mou­ve­ment des pro­téines, c’est suivre le détail du fonc­tion­ne­ment de la machi­ne­rie cel­lu­laire. Avec la thèse pré­sen­tée ici, on contri­bue à la construc­tion d’une métho­do­lo­gie robuste qui per­met­tra aux cher­cheurs de tirer les conclu­sions les plus exactes pos­sibles de leurs obser­va­tions, aus­si bien pour la mise au point de médi­ca­ments que pour des expé­riences de bio­lo­gie cellulaire.

Selon les pro­blé­ma­tiques abor­dées, le bio­lo­giste s’intéressera tan­tôt aux pro­prié­tés d’un être tout entier, d’un organe, d’un embryon, d’un amas de cel­lules, voire encore d’une simple cel­lule, d’une de ses sous-par­ties ou même à la chi­mie des molé­cules qui consti­tuent la matière bio­lo­gique. Bien qu’entremêlées les unes aux autres, ces dif­fé­rentes échelles du vivant requièrent cha­cune l’utilisation de méthodes expé­ri­men­tales et d’outils d’analyse adaptés.

Au cours de ma thèse, j’ai déve­lop­pé une nou­velle méthode d’analyse du mou­ve­ment des pro­téines, dont l’échelle carac­té­ris­tique se situe entre celle de la cel­lule et celle de la molé­cule : plus « macro » que l’échelle de la chi­mie, mais suf­fi­sam­ment petite pour que les phé­no­mènes aléa­toires dus à l’agitation ther­mique y soient pré­pon­dé­rants – une échelle pour laquelle la phy­sique et les sta­tis­tiques offrent de pré­cieuses clés de com­pré­hen­sion. J’ai notam­ment uti­li­sé cette méthode pour aider Sano­fi à vali­der une nou­velle immu­no­thé­ra­pie et pour ana­ly­ser les expé­riences d’un cher­cheur s’intéressant aux ori­gines molé­cu­laires de la mala­die de Parkinson.


En illus­tra­tion : Vue d’artiste de l’intérieur d’une cel­lule. Les élé­ments colo­rés sont des pro­téines. « Digi­tal Ren­ders by Evan Inger­soll & Gael McGill Pain­tings by David Goodsell ».


Le mouvement aléatoire des protéines

Pour com­prendre l’intérêt et la com­plexi­té de l’étude du mou­ve­ment des pro­téines dans les cel­lules, il est bon d’avoir à l’esprit quelques ordres de gran­deur. Tout d’abord, le dia­mètre typique d’une cel­lule est de quelques micro­mètres. Un niveau plus petit, l’ordre de gran­deur de la taille des orga­nelles, c’est-à-dire des com­par­ti­ments ou des uni­tés fonc­tion­nelles d’une cel­lule, est le micro­mètre. Pour com­prendre le fonc­tion­ne­ment de ces der­nières, on peut notam­ment s’intéresser à leurs prin­ci­paux com­po­sants « actifs » : les protéines.

Ces grosses molé­cules sont les petites mains de la cel­lule, ce sont elles qui consomment l’énergie, régulent les flux, trans­mettent les signaux, etc. Elles mesurent quelques nano­mètres de dia­mètre et sont per­cu­tées en per­ma­nence par les molé­cules d’eau qui les entourent, ce qui rend leur mou­ve­ment erra­tique – il est dit « dif­fu­sif ». En quelques secondes, au gré de ces fluc­tua­tions aléa­toires, une pro­téine peut ain­si tra­ver­ser la cel­lule dans laquelle elle se trouve. Cepen­dant, les pro­prié­tés dyna­miques d’une même pro­téine peuvent varier consi­dé­ra­ble­ment au cours du temps, selon sa géo­mé­trie, qui déter­mine notam­ment sa pro­pen­sion à se lier avec d’autres, ou selon l’endroit où elle se trouve : enche­vê­trée dans une zone peu­plée d’obstacles, elle sera cer­tai­ne­ment moins mobile.

Un désordre bien organisé

Le mou­ve­ment d’une pro­téine semble donc, à pre­mière vue, en grande par­tie gou­ver­né par le hasard. Pour­tant, la machi­ne­rie cel­lu­laire, pour rem­plir ses fonc­tions, ne sau­rait évi­dem­ment pas se conten­ter d’un désordre « homo­gène » : chaque pro­téine doit être ache­mi­née là où elle a son rôle, de manière à ce que des sous-uni­tés fonc­tion­nelles appa­raissent au sein de la cel­lule. Par exemple, les canaux res­pon­sables de l’équilibre des ions entre l’intérieur et l’extérieur de la cel­lule sont com­po­sés de plu­sieurs pro­téines dif­fé­rentes, qui doivent être loca­li­sées au même endroit pour que le canal puisse être assemblé.

De même, les récep­teurs char­gés de détec­ter la pré­sence de l’une ou l’autre molé­cule dans l’environnement de la cel­lule doivent être conduits à la mem­brane pour rem­plir leur fonc­tion. En fait, la dyna­mique de dif­fu­sion est inti­me­ment reliée à la fonc­tion des pro­téines et est donc sus­cep­tible de varier gran­de­ment d’un type de pro­téine à l’autre. Ain­si, puisque toutes les pro­téines n’ont pas les mêmes pro­prié­tés de dif­fu­sion aux mêmes endroits, cer­taines pré­do­minent là où d’autres se font rares ; d’autres encore sont confi­nées à cer­taines régions.

Certains médicaments affectent le mouvement des protéines

Pen­dant ma thèse, je me suis atta­ché à tra­vailler sur des exemples d’applications, pour les­quels il était impor­tant de com­prendre le mou­ve­ment de ces si petits com­po­sants de la cel­lule. J’ai notam­ment tra­vaillé avec une équipe de recherche de Sano­fi char­gée d’évaluer les molé­cules en déve­lop­pe­ment et de sélec­tion­ner les meilleurs can­di­dats. Le pro­jet auquel ont contri­bué mes tra­vaux por­tait sur la mise au point de nou­velles immu­no­thé­ra­pies contre le can­cer, c’est-à-dire de trai­te­ments visant à sti­mu­ler les cel­lules T (qui sont au cœur de la réponse immu­ni­taire) pour qu’elles « s’activent » et attaquent les cel­lules cancéreuses.

Plus pré­ci­sé­ment, je me suis inté­res­sé au mou­ve­ment de récep­teurs connus pour être capables de déclen­cher ou d’atténuer l’activation des cel­lules T. Situées à la mem­brane, et donc en contact à la fois avec l’intérieur et avec l’extérieur de la cel­lule, ces pro­téines enclenchent un méca­nisme dans la cel­lule lorsque se fixent à leur par­tie externe des anti­corps pré­sents dans l’environnement de la cel­lule. En temps nor­mal, ces anti­corps sont pro­duits par les cel­lules de l’organisme qui dys­fonc­tionnent, pour signa­ler leur état aux cel­lules T voi­sines afin d’être éli­mi­nées ; mais cer­taines cel­lules can­cé­reuses bloquent cette signa­li­sa­tion, passent donc inaper­çues et pro­li­fèrent. Les immu­no­thé­ra­pies visent à contrer cette stra­té­gie en intro­dui­sant de façon arti­fi­cielle des anti­corps capables, en quelque sorte, d’appuyer sur l’interrupteur.

Observer l’action des anticorps

Les dif­fé­rents méca­nismes d’activation sont encore assez mécon­nus, et l’on sait notam­ment peu de chose de leurs toutes pre­mières étapes, qui suivent la détec­tion des anti­corps. Quel que soit l’effet de l’anticorps sur le récep­teur auquel il se lie, il est pro­bable que le mou­ve­ment de ce der­nier s’en trouve affec­té, de façon plus ou moins mar­quée : il a été obser­vé dans cer­tains cas que les récep­teurs s’immobilisent com­plè­te­ment, mais le chan­ge­ment n’est pas tou­jours aus­si mar­qué. Au cours d’expériences, nous avons cher­ché à obser­ver les éven­tuels chan­ge­ments de dyna­mique induits par les anti­corps can­di­dats, pour carac­té­ri­ser d’éventuelles varia­tions d’intensité, voire de nature, dans les effets pro­duits sur le mou­ve­ment du récepteur.

Pour mesu­rer son mou­ve­ment, nous avons mar­qué le récep­teur afin de pou­voir l’observer et avons fil­mé son dépla­ce­ment dans des cel­lules acti­vées avec cha­cun des dif­fé­rents anti­corps. L’objet de ma thèse a été de déve­lop­per une méthode pour com­pa­rer les tra­jec­toires ain­si obser­vées et détec­ter d’éventuelles dif­fé­rences. Avant d’être ain­si éva­lués, les anti­corps sont bien sûr tes­tés d’autres manières : on sait par exemple qu’ils sont capables, dans des condi­tions bien pré­cises, de se lier à leur cible. Mais les expé­riences qui le prouvent sont effec­tuées dans des milieux très sim­pli­fiés, loin de repro­duire toute la com­plexi­té d’une cellule.

“Les protéines sont percutées par les molécules d’eau, ce qui rend leur mouvement erratique.”

Ain­si, il est pos­sible qu’un anti­corps se fixe bien à sa cible dans un tube à essai, mais en soit inca­pable lorsque ce récep­teur est situé à la mem­brane d’une cel­lule, parce que des contraintes géo­mé­triques l’empêchent de se lier de la même façon ou bien parce qu’il se lie mieux à une autre pro­téine pré­sente à la sur­face de la cel­lule, qui le détour­ne­ra de sa cible ini­tiale. Il existe d’autres moyens de véri­fier que les anti­corps ont bien pro­vo­qué le sti­mu­lus atten­du, par exemple en mesu­rant la concen­tra­tion de cer­taines pro­téines sécré­tées par les cel­lules lorsqu’elles sont activées.

Mais mon tra­vail de thèse per­met d’observer une étape inter­mé­diaire, elle donne accès à un nou­veau niveau de détail sur le mode d’action des anti­corps sur leur cible. Au-delà de la com­pa­rai­son de molé­cules can­di­dates, l’analyse du mou­ve­ment des pro­téines est un outil géné­rique qui per­met, selon le pro­to­cole expé­ri­men­tal choi­si, une meilleure com­pré­hen­sion de leur rôle au sein de la cel­lule et de la manière dont ce mou­ve­ment par­ti­cipe aux dif­fé­rentes fonc­tions dans les­quelles les pro­téines sont impliquées.

Décrire des trajectoires très diverses

L’exploitation des obser­va­tions de tra­jec­toires de pro­téines n’en est pour­tant qu’à ses bal­bu­tie­ments : plu­sieurs dif­fi­cul­tés com­pliquent en effet l’analyse, et je me suis atta­ché durant cette thèse à construire une métho­do­lo­gie qui y soit la moins vul­né­rable pos­sible. La pre­mière dif­fi­cul­té est d’identifier un « modèle » géné­rique, dont les tra­jec­toires seraient une réa­li­sa­tion et dont on s’attachera à déter­mi­ner les para­mètres. Un modèle simple de mou­ve­ment aléa­toire est celui du mou­ve­ment brow­nien, dans lequel chaque dépla­ce­ment est indé­pen­dant des pré­cé­dents, sui­vant une dis­tri­bu­tion cen­trée dont la variance consti­tue le seul para­mètre du modèle. 

Bien qu’il soit une bonne pre­mière approxi­ma­tion, celui-ci est loin de cap­tu­rer toute la com­plexi­té du mou­ve­ment des pro­téines dans les cel­lules : comme nous l’avons vu plus haut, leur dyna­mique change en fonc­tion de la région de la cel­lule dans laquelle elles se trouvent. Heu­reu­se­ment, les phy­si­ciens n’avaient pas atten­du de pou­voir obser­ver le mou­ve­ment de pro­téines pour s’intéresser aux marches aléa­toires : celles-ci ont, entre autres appli­ca­tions, été étu­diées dès le siècle der­nier pour mieux com­prendre le mou­ve­ment des élec­trons dans les métaux, qui déter­mine leurs pro­prié­tés de conduc­tion. Plu­sieurs modèles de marches aléa­toires, pre­nant cha­cun en compte un type de « dévia­tion » du modèle cen­tral qu’est le mou­ve­ment brow­nien, ont donc été imaginés. 

Une méthode qui emprunte à plusieurs modèles physiques

Pour que les pro­prié­tés du mou­ve­ment soient cal­cu­lables ana­ly­ti­que­ment, ces modèles sont res­tés rela­ti­ve­ment simples, ou en tout cas trop simples pour qu’on puisse rai­son­na­ble­ment les esti­mer capables de rendre compte de toute la com­plexi­té du mou­ve­ment des pro­téines dans les cel­lules. Il est plus rai­son­nable de s’attendre à ce que plu­sieurs des effets que modé­lisent les types de marches aléa­toires « clas­siques » agissent simul­ta­né­ment sur la dif­fu­sion des pro­téines dans les cel­lules. C’est pour­quoi la méthode que j’ai déve­lop­pée per­met d’interpoler entre plu­sieurs de ces modèles. 

Par ailleurs, comme dans pra­ti­que­ment tous les cas d’analyse de don­nées, il est néces­saire de défi­nir un niveau de gra­nu­la­ri­té adap­té à la quan­ti­té et à la qua­li­té des obser­va­tions dont on dis­pose. Les condi­tions expé­ri­men­tales font que la quan­ti­té de tra­jec­toires obser­vées varie de plu­sieurs ordres de gran­deur selon les expé­riences, le type de pro­téine obser­vé, etc. Ma méthode asso­cie un modèle à un ensemble de tra­jec­toires : plus l’ensemble est grand, plus le modèle sera déter­mi­né avec pré­ci­sion, mais une cen­taine de tra­jec­toires donnent sou­vent une bonne pre­mière approxi­ma­tion et la gra­nu­la­ri­té peut donc être ajus­tée en consé­quence : si l’on dis­pose de mil­liers de tra­jec­toires par cel­lule, on pour­ra com­pa­rer entre elles les dif­fé­rentes régions de la cel­lule. Cepen­dant, si l’on n’en observe qu’une cen­taine par cel­lule, on pour­ra tout de même ne consi­dé­rer qu’un ensemble par cel­lule et uti­li­ser ma méthode pour com­pa­rer entre elles ces dernières. 

Un algorithme entraîné sur des simulations

Au début de ma thèse, j’ai par­ti­ci­pé à un concours scien­ti­fique – une manière de sus­ci­ter beau­coup d’émulation au sein d’une com­mu­nau­té de cher­cheurs et de com­pa­rer les méthodes pro­po­sées selon des métriques com­munes – dont les résul­tats ont mon­tré que les réseaux de neu­rones sont aujourd’hui les meilleurs algo­rithmes connus pour esti­mer les para­mètres de dif­fu­sion. J’ai donc choi­si, pour carac­té­ri­ser les tra­jec­toires, d’utiliser un tel réseau, c’est-à-dire une fonc­tion para­mé­trable dont les coef­fi­cients sont ajus­tés au cours d’une phase d’apprentissage (appe­lée aus­si « entraînement »).

“L’analyse du mouvement des protéines permet une meilleure compréhension de leur rôle au sein de la cellule.”

Ces outils sont lar­ge­ment uti­li­sés pour l’analyse d’images et ce sont eux qui ont tiré le déve­lop­pe­ment de l’intelligence arti­fi­cielle ces der­nières décen­nies. Cepen­dant, leur entraî­ne­ment requiert sou­vent d’importantes quan­ti­tés de don­nées : par exemple, les algo­rithmes qui se pro­posent d’aider les radio­logues à iden­ti­fier les zones les plus inté­res­santes sur une radio­gra­phie néces­sitent de dis­po­ser de mil­liers d’exemples préa­la­ble­ment anno­tés. Ici, on a l’avantage de pou­voir créer à la fois les don­nées et les anno­ta­tions : puisque la phy­sique des marches aléa­toires est assez bien connue, il est pos­sible de simu­ler des tra­jec­toires dont on connaît les para­mètres de diffusion. 

Ain­si, en uti­li­sant uni­que­ment des tra­jec­toires simu­lées, j’ai entraî­né un réseau de neu­rones à infé­rer les para­mètres de dif­fu­sion et ai pu l’utiliser pour ana­ly­ser des tra­jec­toires de pro­téines obser­vées dans les cel­lules. La condi­tion pour que cette approche fonc­tionne est que les tra­jec­toires simu­lées à l’entraînement « res­semblent » assez aux tra­jec­toires obser­vées. Je me suis donc assu­ré que les échelles de temps et d’espace cor­res­pondent, et j’ai uti­li­sé plu­sieurs types de marches aléa­toires à l’entraînement, de façon à cou­vrir une grande varié­té de dyna­miques de diffusion.

Trajectoires de protéines à la membrane d’une cellule. Les moins mobiles sont en bleu, les plus rapides en jaune. Toutes les protéines sont du même type. © Hippolyte Verdier
Tra­jec­toires de pro­téines à la mem­brane d’une cel­lule. Les moins mobiles sont en bleu, les plus rapides en jaune. Toutes les pro­téines sont du même type. © Hip­po­lyte Verdier

Décrire les trajectoires avec un réseau de neurones 

Pour pro­duire l’estimation qu’on l’a entraî­né à four­nir, un réseau de neu­rones applique à la tra­jec­toire une série d’opérations. Le plus sou­vent, seul importe le résul­tat de la der­nière opé­ra­tion, qui consti­tue la sor­tie du réseau. Dans notre cas, il s’agit d’estimations de deux para­mètres phy­siques cou­ram­ment uti­li­sés pour décrire les marches aléa­toires. Mais, si l’on regarde quelques étapes en amont, il est pos­sible de « décom­po­ser » l’estimation en plu­sieurs fac­teurs, un peu comme plu­sieurs axes d’une carte sur laquelle le réseau pla­ce­rait chaque trajectoire. 

Pen­dant son appren­tis­sage, le réseau construit des axes de plus en plus per­ti­nents, et cal­cule sa pré­dic­tion à par­tir de la posi­tion des tra­jec­toires sur cette carte. Appe­lée « espace latent », cette repré­sen­ta­tion n’est pas direc­te­ment inter­pré­table, parce que le réseau n’explique pas à quoi cor­res­pond chaque dimen­sion ; néan­moins, elle contient plus d’informations sur la tra­jec­toire que la simple sor­tie du réseau – elle a été opti­mi­sée pour encap­su­ler au mieux l’information qui lui per­met d’estimer ensuite des gran­deurs physiques. 

J’ai donc choi­si d’utiliser l’espace latent pour com­pa­rer les tra­jec­toires : ma méthode consiste en fait à com­pa­rer les dis­tri­bu­tions dans l’espace latent issues de deux ensembles de tra­jec­toires, afin d’estimer si elles pré­sentent des dif­fé­rences sta­tis­ti­que­ment signi­fi­ca­tives. Cela per­met, plu­tôt que de se concen­trer sur un cri­tère pré­éta­bli, de com­pa­rer les tra­jec­toires selon plu­sieurs aspects en même temps, ce qui est par­ti­cu­liè­re­ment utile lorsque l’on n’a pas d’a prio­ri, c’est-à-dire lorsque l’on n’a pas d’hypothèse pré­cise au sujet de la dif­fu­sion des pro­téines qu’on observe – une situa­tion fré­quente quand on s’intéresse à un sys­tème bio­lo­gique encore peu exploré.

Une plateforme web pour l’analyse

Tout au long de ma thèse, j’ai échan­gé avec de nom­breux bio­lo­gistes, au sein de Sano­fi et dans des labo­ra­toires de recherche aca­dé­mique, afin de com­prendre les outils qu’ils uti­lisent aujourd’hui pour ana­ly­ser le mou­ve­ment des pro­téines aux­quelles ils s’intéressent. J’ai pu consta­ter que les méthodes varient gran­de­ment selon les domaines et les labo­ra­toires, néces­sitent plu­sieurs outils logi­ciels plus ou moins acces­sibles et faciles d’usage, ce qui nuit par­fois à la por­tée des résul­tats obte­nus et à leur repro­duc­ti­bi­li­té. De plus, peu d’études estiment aujourd’hui la signi­fi­ca­ti­vi­té sta­tis­tique des résul­tats tirés d’analyses de trajectoire.

Après avoir éprou­vé ma méthode sur des don­nées pro­ve­nant de plu­sieurs expé­riences dif­fé­rentes, de Sano­fi et d’ailleurs, j’ai donc vou­lu la rendre acces­sible au plus grand nombre, via un outil d’analyse en ligne. J’ai déve­lop­pé pour cela un por­tail sur lequel les cher­cheurs peuvent dépo­ser leurs tra­jec­toires, les ana­ly­ser avec mon algo­rithme et visua­li­ser puis télé­char­ger les résul­tats. À terme, j’espère que cette plate-forme per­met­tra d’intégrer plu­sieurs autres types d’analyses, pour prendre en compte de nou­veaux cas d’usage, et d’en par­ta­ger les résul­tats, afin de per­mettre une plus grande trans­pa­rence sur l’ensemble de l’analyse.

Conclusion

Obser­ver le mou­ve­ment des pro­téines, c’est suivre le détail du fonc­tion­ne­ment de la machi­ne­rie cel­lu­laire. Avec cette thèse, j’espère avoir contri­bué à la construc­tion d’une métho­do­lo­gie robuste qui per­met­tra aux cher­cheurs de tirer les conclu­sions les plus exactes pos­sibles de leurs obser­va­tions, aus­si bien pour la mise au point de médi­ca­ments que pour des expé­riences de bio­lo­gie cellulaire.


Informations sur la thèse

J’ai réa­li­sé ma thèse entre le labo­ra­toire « Déci­sion et pro­ces­sus Bayé­sien » diri­gé par Jean-Bap­tiste Mas­son à l’institut Pas­teur, et une équipe du dépar­te­ment « Méde­cine de pré­ci­sion » de Sano­fi, située sur le site de Vitry-sur-Seine. J’ai béné­fi­cié pour cela d’un contrat CIFRE (Conven­tion indus­trielle de for­ma­tion par la recherche), une forme de col­la­bo­ra­tion qui per­met aux labo­ra­toires phar­ma­ceu­tiques de nouer des liens avec la recherche aca­dé­mique. La thèse a été sou­te­nue le 4 octobre 2022 devant un jury com­po­sé de :

  • BERRY Hugues, Direc­teur de recherche INRIA
  • PRESSE Steve,
  • ALEXANDROU Anti­go­ni,
  • ALLASSONNIERE Stéphanie,
  • Mme EL KAROUI Meriem,
  • FRANÇOIS Paul,
  • LOUPE Gilles,
  • SAUER Mar­kus,
  • CASSE Alhas­san,
  • MASSON Jean-Bap­tiste


Informations sur le laboratoire

Le labo­ra­toire de Jean-Bap­tiste Mas­son vient d’être confir­mé pour dix nou­velles années à l’Institut. On y étu­die les moyens sélec­tion­nés par l’évolution pour ser­vir de méthodes de déci­sion aux orga­nismes bio­lo­giques. Plu­sieurs doc­to­rants, post-doc­to­rants, ingé­nieurs de recherche et cher­cheurs per­ma­nents (dont des poly­tech­ni­ciens) s’intéressent pour cela, avec plu­sieurs approches, au com­por­te­ment de la larve de mouche – un des rares orga­nismes dont la struc­ture de connexion des neu­rones entre eux soit entiè­re­ment connue.

Cela per­met de mieux com­prendre les liens entre les sti­mu­li aux­quels sont sou­mis les larves, l’activation de leurs neu­rones, la réponse de leur sys­tème moteur et in fine l’influence sur leur com­por­te­ment. D’autres tra­vaillent sur un dis­po­si­tif de réa­li­té vir­tuelle qui per­met aux méde­cins de visua­li­ser des scan­ners en trois dimen­sions afin de mieux pré­pa­rer cer­taines opé­ra­tions, ou d’affiner des diag­nos­tics. Le labo­ra­toire col­la­bore sur cer­tains sujets avec la start-up Ava­tar Medi­cal, cofon­dée par Jean-Bap­tiste Mas­son et un de ses anciens étudiants.


Poster un commentaire