Laboratoire de Biochimie Théorique
UPR 9080 CNRS / UNIVERSITÉ PARIS 7
IBPC, 13 rue Pierre et Marie Curie, F-75005 Paris - France
|
ETUDES DES SYSTEMES BIOMACROMOLÉCULAIRES Conformation et déformation des acides nucléiques
Les espaces conformationnels dans lesquels évoluent les acides nucléiques double brin ont la dimension de l’ensemble des angles de torsion et des paramètres hélicoïdaux qui décrivent la double hélice. Les paramètres hélicoïdaux, qui varient de manière quasi continue, permettent mal d’identifier des sous-états au sein d’une conformation allomorphe donnée. Par contre, les angles de torsion du brin, susceptibles d’adopter des conformations discontinues (gauche+, gauche- et trans), peuvent être de meilleurs traceurs de sous-états, pour peu qu’ils soient corrélés aux paramètres hélicoïdaux. Ce thème, développé depuis quelques années, a été approfondi par l’analyse des structures cristallographiques à haute résolution, qui atteignent maintenant un volume suffisant pour permettre une analyse statistique significative. Nous avons considéré les ARN et ADN en forme A et les ADN en forme B avec et sans protéines. Cette analyse révèle que les conformations BI et BII (angles e C3'-O3' et z O3'-P). du brin de l'ADN sont caractéristiques des ADN-B, et en particulier, des ADN-B isolés. En effet, dans les ADN-B complexés, la conformation BII est plus rare, mais, en contre-partie, apparaissent de nouveaux états du groupement phosphate qui mettent en jeu les angles de torsion a P-O5' et g C5'-C4' du brin ainsi que de nombreux sucres en conformation nord. Certaines de ces formes a/g non-canoniques apparaissent également dans la catégorie des ADN-A, mais sont totalement absentes dans les deux catégories ADN-B isolé et ARN-A. Toutes ces conformations non-canoniques du groupement phosphate (angles e/z et/ou a/g) sont accompagnées de paramètres hélicoïdaux caractéristiques qui ne parcourent qu'une gamme étroite de valeurs ne recouvrant que très partiellement celles qui sont associées à la conformation canonique. L’espace conformationnel accessible aux ADN peut donc bien être divisé en sous-états grâce au brin phosphodiester. Ces états alternatifs des angles a et g du brin n'ont à l'heure actuelle jamais été étudiés. Peuvent-ils apparaître en solution dans les ADN-B libres, et comment peuvent-ils contribuer à la reconnaissance spécifique entre ADN et protéines ? Pour tenter de répondre à ces questions, nous avons étudié par modélisation sous contrainte (mécanique moléculaire en solvant implicite et dynamique moléculaire en solvant explicite) la transition couplée des angles a et g dans un dodécamère d'intérêt biologique. Cinq sous-états stables ou méta-stables ont été trouvés. La voie la plus favorable pour y accéder est une contre-rotation des deux angles, via la conformation trans. La barrière d’énergie de cette configuration a/g : trans/trans est la plus élevée à franchir, et l’énergie libre correspondante (≈ 10 Kcal.mol-1) indique que la trans-conformation est très peu probable pour un ADN isolé, comme le suggérait l’analyse des structures cristallographiques. Ces résultats suggèrent fortement que les transitions des angles a/g non canoniques se produisent pendant la fixation de la protéine et jouent sur le verrouillage structural du complexe.
Il est très bien établi que la double hélice de l'ADN peut “traduire'' ses séquences de bases en des formes spécifiques tridimensionnelles. La forme la plus simple est la courbure planaire. Ce type de déviation de la symétrie hélicoïdale de l'ADN a été découvert il y a environ vingt ans pour les suites de paires AT ("A-tracts"), mais le mécanisme physique responsable de ce résultat est toujours un sujet controversé. Nous avons essayé d'avancer dans ce domaine en utilisant l'ICMD et notre modèle minimal de l'ADN (voir section D2). Pour cela nous avons cherché des séquences contenant des A-tracts qui se courbent spontanément à partir des conformations droites et symétriques pendant la durée limitée des trajectoires. Ensuite les structures détaillées des états courbés ont été étudiées pour comprendre le mécanisme moléculaire de ce phénomène. Nous avons trouvé qu'aucune des théories actuelles n'a été capable d'expliquer les résultats obtenus et nous avons proposé une théorie alternative baptisée "Compressed Backbone Theory" (CBT) qui offre une interprétation générale des observations expérimentales et computationnelles qui semblaient très étranges auparavant. Selon la CBT, la longueur spécifique du squelette sucre-phosphate est plus grande que le permet le modèle idéal de l'ADN-B canonique. Par conséquent elle se trouve dans un état compressé et tend à s'étendre en augmentant le "twist'', le "rise'', et en changeant d'autres paramètres de l'ADN. Mais les interactions entre les bases s'opposent à cette tendance et le squelette sucre-phosphate se trouve dans un état de frustration géométrique, une situation similaire à certains systèmes étudiés dans la physique des solides. L'ADN est donc obligé de dévier de sa trace spirale régulière de sorte que sa longueur augmente. La taille des deux sillons de l'ADN commence à varier et l'empilement parallèle des paires de bases est perturbé. Ceci conduit naturellement à une courbure macroscopique pour les séquences dans lesquelles les propriétés des paires de bases, notamment le twist idéal, alternent le long de la double hélice. Les A-tracts représentent un exemple extrême de ce type. Cette nouvelle théorie explique pourquoi la courbure diminue avec la température ainsi qu'avec un changement de l'activité de l'eau. Il faut noter que les systèmes linéaires étudiés dans la physique de solide, notamment le fameux modèle de Frenkel et Kontorova, possèdent des propriétés intéressantes telles que la structure fractale des niveaux énergétiques (sans effets quantiques) et d'autres attributs des vers des spins, ce qui peut avoir un rapport avec les observations récentes des temps de relaxation très longs dans des fragments d'ADN relativement courts.
Dans un travail récent utilisant le modèle minimal de l'ADN nous avons pu obtenir quelques trajectoires de longue durée (jusqu'à 20 ns) pour certaines séquences de l'ADN de 35 paires de bases. Cela nous a permis de comparer la courbure statique in silico avec celle in vitro mesurée par la mobilité des mêmes séquences dans les gels de polyacrylamide. A notre connaissance, ceci est la première fois que les fragments de l'ADN de cette taille ont été étudiés avec des trajectoires aussi longues et que les résultats obtenus ont été vérifiés expérimentalement a posteriori. Nous avons proposé deux approches expérimentales qui en principe peuvent distinguer la CBT des autres modèles de la courbure statique. L'un d'eux se fonde sur la prédiction que la rupture du squelette dans l'un des brins de l'ADN devrait relaxer la courbure des fragments contenant des "A-tracts". Pour vérifier cette prédiction, une série d'expériences et de calculs a été effectuée en parallèle et les résultats, très encourageants, sont en cours de rédaction.
En employant l'approche ICMD, nous avons montré que les transitions réversibles entre les formes A et B de l'ADN peuvent être obtenues pendant une dynamique moléculaire de fragments de l'ADN immergés dans une gouttelette d'eau contenant des ions Na+. La dynamique des ces transitions correspond bien à leur caractère coopératifs. Le contrôle des transitions A ↔ B a été effectué in silico par des variations de la taille de la gouttelette de solvant. Le nombre de molécules d'eau d’hydratation estimé à mi-parcours de la transition est en accord avec l'expérience. Nous avons aussi étudié la dépendance de ces transitions sur la taille de l'ADN. Il se trouve que la transition B → A devient progressivement plus difficile quand la longueur de l'ADN correspond à moins d'un tour de la double hélice. Nous avons trouvé qu'une concentration élevée en NaCl ne provoque pas de transition B → A mais, au contraire, stabilise la forme B et qu'on peut même observer une cristallisation du sel dans les sillons de l'ADN.
Nos résultats montrent que la transition B → A de l'ADN sous hydratation faible est provoqué par les ions Na+ qui s'accumulent entre les deux brins phosphodiester dans le grand sillon et qu'elle est gouvernée par les interactions électrostatiques de moyenne portée. Le rôle de la couche d'eau s'explique par l'augmentation de la concentration des contre-ions. L'analyse des résultats expérimentaux montre que ce mécanisme est probablement aussi responsable pour le polymorphisme A/B de l'ADN dans d'autres conditions.
Nous avons terminé un travail portant sur la structure et la mécanique des ADN contenant des sites abasiques. Ces travaux, qui ont impliqué des études de déformation induite avec JUMNA et de dynamique moléculaire en solution avec AMBER, ont permis de mieux comprendre l'impact de la perte d'une base sur le comportement de la double hélice de l'ADN. Il s'avère que non seulement la nature de la base excisée, mais aussi la séquence qui l'entoure sont importantes. Dans la plupart des cas, la perte d'une pyrimidine (thymine ou cytosine), qui laisse une purine (adénine ou guanine) non appariée, produit peu de déformation de la double hélice. Au contraire, la perte d'une purine, pour certaines séquences environnantes, peut conduire à des structures ayant la base non appariée à l'extérieure de la double hélice et provoquant ainsi une forte courbure locale. Contrairement aux idées reçues dans ce domaine, nos études de la mécanique des ADN contenant des sites abasiques suggèrent que, au moins pour certaines séquences de bases, il y a peu d'augmentation de la flexibilité de la double hélice. Les résultats obtenus par ces études théoriques ont pu être corrélés avec des informations obtenues par la RMN au LEDSS et serviront dans la conception de nucléases artificielles ciblant de telles lésions de la double hélice. Nous avons poursuivi nos études de la déformation de la double hélice de l'ADN en abordant le mécanisme d'ouverture des bases de l'ADN. De telles déformations sont très importantes biologiquement puisqu'elles constituent une étape préalable aux modifications chimiques de l'ADN sous contrôle protéique. Elles sont ainsi un élément clé de plusieurs processus allant de la réparation de l'ADN au contrôle de l'expression génétique. Les ouvertures de base apparaissent spontanément à température ambiante à l'échelle des millisecondes. Il est donc impossible de les observer lors de trajectoires de dynamique moléculaire qui ne durent que quelques nanosecondes. Grâce à la contrainte que nous avons mise au point (voir section D1.1), il est néanmoins devenu possible d'étudier l'ouverture par étapes, échantillonnant les conformations du soluté et du solvant pour chaque angle d'ouverture. Les résultats (qui ont figuré sur la couverture du ChemPhysChem) nous ont permis de décrire, pour la première fois, la surface d'énergie libre correspondant l'ouverture des bases vers les deux sillons de la double hélice.
Ces courbes sont divisées en deux domaines, un domaine presque quadratique correspondant à la déformation élastique de la paire de base (jusqu'à environ 30° de rotation), suivi par un domaine quasi-linéaire correspondant à la cassure des liaisons d'hydrogène et à la perte des interactions d'empilement. Le fait que ces courbes sont presque symétriques pour des rotations positives et négatives des bases indique que l'ouverture est possible vers les deux sillions. Dans le cas de la purine des encombrements stériques conduisent néanmoins à une préférence pour une ouverture vers le grand sillon. Nous avons aussi constaté que l'ouverture des bases est associée avec des changements locaux des angles dièdres et du plissement des sucres constituant le brin de la double hélice, mais n'est pas directement couplée aux changements d'un angle unique, comme il a été proposé par d'autres auteurs. Nous avons étendu ces études vers l'étude des paires guanine-cytosine et vers l'ouverture extrême des bases, communément appelée "base flipping". Les conformations de l'ADN qui résultent du "flipping" ont été isolées lors de l'étude cristallographique des complexes de l'ADN avec des protéines qui modifient chimiquement les bases, comme, par exemple, les méthyletransferases. Dans ce cas, la base se trouve complètement à l'extérieur de la double hélice. Nos études de "flipping" au sein de la séquence de bases correspondante à la cible de la méthyletransferase-C5 (GCGC) montrent des différences très nettes entre le chemin d'ouverture à travers le petit sillon et celui à travers le grand sillon. Même si ces chemins se ressemblent énergétiquement, les conformations obtenues après l’ouverture sont très différentes. Dans le cas du chemin grand sillon, l'ouverture de la base entraîne la rotation du sucre désoxyribose conduisant à une conformation très proche de celle observée cristallographiquement. En revanche, l'ouverture petit sillon laisse le sucre en place. Ces résultats suggèrent, premièrement, que compte tenu de l'énergie libre nécessaire pour le "base flipping" ce processus doit être activement stimulé par une protéine et, deuxièmement, que le chemin préférentiel d'ouverture passe par le grand sillon de la double hélice. Nous avons aussi abordé certains effets de la séquence de base et de la conformation de l'ADN sur le processus de l'ouverture de bases. Dans le premier cas nous avons étudié plus particulièrement l'influence de suites de paires AT sur l'ouverture de la thymine. De telles séquences (A-tracts) sont bien connues pour leur pouvoir d'induire une courbure de l'axe de la double hélice. Malgré le faible changement de géométrie impliqué par la courbure, ces changements se reflètent dans la stabilisation des paires AT, la vitesse d'échange des protons imino de la thymine étant ralentie par presque deux ordres de grandeur. Des calculs d'énergie libre de l'ouverture de la thymine nous ont permis de comprendre cet effet qui s'avère être lié à la rigidité accrue de la double hélice, aussi bien en terme de largueur du petit sillon qu'en terme d'une courbure vers le petit sillon. Des études de l'ouverture des paires AT au sein d'une double hélice de type ARN-A ont fourni des résultats très différents. Dans ce cas le changement de conformation par rapport à une hélice de type B est très important, l'ARN ayant notamment un grand sillon très étroit. Malgré ces changements, il n'y a pas d'effet significatif sur l'ouverture des paires de bases. Nos simulations ont à nouveau permis de comprendre ces résultats en montrant que le grand sillon de la forme A est très flexible et qu'il peut s’ouvrir pour laisser passer une base sans une dépense énergétique significative.
Une analyse détaillée de l’influence des ions sur la conformation de l’ADN n’a montré aucune évidence claire d'une telle dépendance. En particulier nous n'avons pas trouvé de corrélation entre la présence des ions dans le petit sillon et la largeur de ce sillon, même si certaines techniques d’analyse peuvent donner cette impression.
Tableau 1
Les 136 tétranucléotides uniques peuvent être assemblés au sein de
39 oligomères de séquence répétitive.
Compte tenu de l'amélioration de la qualité des simulations des fragments d'ADN par dynamique moléculaire et de l'augmentation de la vitesse des ordinateurs, il nous a semblé intéressant de tenter de combler le manque de données expérimentales par un ensemble cohérent de simulations dynamiques. Une analyse des pas tetranucléotidiques montre qu'il est possible d'obtenir des informations sur leurs propriétés en les assemblant au sein de seulement 39 oligomères ayant des séquences répétitives (voir tableau 1). Malgré cette démarche, le nombre de simulations à effectuer reste trop important pour un seul laboratoire. Ainsi, lors d'une réunion à Ascona (Suisse) en 2001 portant sur la modélisation des polymères et des films, John Maddocks (EPFL Lausanne) et Richard Lavery ont proposé de constituer un consortium de laboratoires pour constituer la base de données correspondante. Neuf laboratoires spécialisés dans les études de la dynamique des macromolécules ont accepté de participer à ce consortium, quatre en Europe (F. Lankas à I'Institut Heyrovsky en République Czech, R. Lavery à l'IBPC en France, J. Maddocks à l'EPFL en Suisse et H. Sklenar à MDC en Allemagne,) et cinq aux Etats-Unis (D. Beveridge à Wesleyan University, D. Case à l'Institut Scripps, T. Cheatham à l'Université de Utah, R. Osman à Mount Sinai College of Medicine et M. Young à Berkeley). Ce regroupement porte le nom "ABC" (Ascona B-DNA Consortium). Pendant environ six mois les laboratoires en question ont débattu de la meilleure façon d'effectuer les calculs (choix de la longueur des oligomères, problèmes des effets des extrémités, choix du champ de force, nombre de molécules de solvant et de contre ions à prendre en compte, ...) et les détails des protocoles à mettre en oeuvre. Notre laboratoire et, en particulier, Peter Varnai et Emmanuel Giudice, ont joué un rôle actif pendant ces discussions, notamment en préparant les scripts informatiques utilisés par l'ensemble des laboratoires pour effectuer les simulations. Les simulations (comportant au moins 15 ns de simulation pour chacun des 39 oligomères composés de 15 paires de bases) ont été terminées au début de l'année 2003 et les participants se sont réunis à Lausanne en avril 2003 pour discuter des résultats des premières analyses. Un article collectif est désormais en préparation. L'ensemble des simulations effectuées par les membres d'ABC constitue plus de 0.6 ms de dynamique sur des systèmes comportant environ 25,000 atomes et représente à notre connaissance la plus importante série de simulations effectuées sur les macromolécules biologiques à ce jour (l'équivalent de 12.5 années de temps de calcul monoprocesseur). L'analyse structurale et dynamique en cours (portant sur environ 400 Goctets de données) commence à fournir une vue détaillée des effets de séquence au sein de la double hélice d'ADN. Néanmoins, les résultats signalent aussi l'existence de changements de conformation lents pour certaines séquences qui ne pourront pas être échantillonnés correctement sans des simulations encore plus longues.
Complexes multi-brins d'ADN
Le motif-i est une structure tétramérique d'ADN, formée de l'intercalation antiparallèle de deux duplexes parallèles. Il se forme sur des séquences de cytosines, par protonation de ces cytosines, qui peuvent alors établir des liaisons hydrogènes entre elles. L'étude du motif-i a montré qu'il existait sous deux topologies, 3'E et 5'E, suivant que les extremités 3' ou 5' des brins d'ADN étaient externes. Une étude systématique des tétramères [d(Cn)]4 pour n allant de 2 à 6 a montré que, pour n > 3, les deux topologies étaient également stables. Par contre, la topologie 3'E de [d(C2)]4 est beaucoup plus stable que sa topologie 5'E, et est la seule espèce observée en solution. Pour pouvoir proposer une explication, nous avons effectué par dynamique moléculaire une comparaison des deux topologies, pour [d(C2)]4 et [d(C4)]4. Les simulations de dynamique moléculaire ont été effectuées à l'aide du programme AMBER 6.0, avec le champ de force parm98. Les structures déterminées par RMN et rayons X des motifs i [dC2]4 en topologie 3'E et [dC4]4 en topologie 5'E ont été utilisées pour les simulations. Deux séries de simulations ont été conduites, l'une sans contraintes, l'autre en contraignant les sucres en conformation C3'-endo et les distances inter-phosphate. Ces contraintes ont été déterminées comme celles pour lesquelles les conformations de [d(C2)]4 vérifient les contraintes NOEs pendant la simulation de dynamique moléculaire. Les structures des conformères explorées durant les simulations ont été analysées en calculant certains paramètres caractéristiques de l'ADN (twist et rise), et en les comparant aux paramètres mesurés sur une structure cristallographique de l'ADN. Ceci permet de mettre en évidence une corrélation entre les valeurs de twist et de rise: quand les valeurs de twist des deux brins phosphodiesters sont négatifs ou très différents, la valeur de rise augmente, et la structure est moins stable, car l'empilement des bases est moins bon. C'est en particulier le cas pour la topologie 5'E de [dC2]4, ce qui est en accord avec l'observation expérimentale que cette topologie n'est pas stable. Des calculs d'énergie libre ont été effectués sur les instantanés ("snapshots") enregistrés après la première nanoseconde de chaque dynamique moléculaire. La méthode MMGBSA a été utilisée pour calculer les énergies et comparer les deux topologies 3'E et 5'E. La partie électrostatique de l'énergie de solvatation a été calculée à l'aide de la méthode de Born généralisée, qui modélise le solvant comme un milieu continu, et la partie hydrophobe de l'énergie de solvatation obtenue à l'aide de la surface accessible au solvant du soluté. Le terme d'énergie montrant la plus grande différence en pourcentage entre les deux topologies est le terme de van der Waals. Un calcul de la différence d'aire des surfaces accessibles entre la topologie 3'E et 5'E, réalisé pour chaque type d'atome du motif i, montre que cette différence d'énergie de van der Waals provient de la différence d'interaction dans les deux topologies, entre les sucres des brins d'ADN voisins. Ces simulations de dynamique moléculaire permettent de proposer une explication aux différences de stabilité observées pour les topologies 3'E et 5'E du motif i. En effet, la stabilité du motif i est en partie due aux effets d'empilement des Cytosines. Pour que cet empilement ait lieu, il est nécessaire que le brin phosphodiester soit légèrement twisté; ce twist n'est visiblement pas atteint pour [dC2]4 en topologie 5'E, ce qui est probablement dû à un manque d'interaction de van der Waals entre les sucres. En effet, dans la structure [dC2]4 en topologie 5'E, pour chaque paire de brins, une seule paire de sucres interagit. Pour toutes les autres structures considérées, le nombre d'interactions est supérieur ou égal à 2.
Pendant plusieurs années nous avons caractérisé et décrit les structures des différents modes d’assemblages d’hélices en forme B. Ces travaux nous ont apporté une vision détaillée des croisements gauches et droits d'ADN. Sur la base de ces résultats, nous avons pu proposer un modèle d’interaction entre des croisements d'ADN et la topoisomérase II ainsi qu’avec la protéine MutS. Ces modèles nous ont amené à proposer l’idée d’une évolution convergente des protéines de la famille de MutS et des topoisomérases II. Ce travail a également mis en évidence l’existence d’une nouvelle famille de protéines pouvant reconnaître à la fois des croisements d’ADN et des jonctions Holliday empilées Cette propriété les distingue des enzymes participant à la recombinaison spécifique qui se fixent exclusivement sur des jonctions Holliday ouvertes.
La formation des triples hélices est une des voies adoptées pour interférer avec l’expression génétique. Des recherches continuent pour trouver les oligomères qui peuvent former des triples hélices spécifiques avec l'ADN. Il a été monté que l'utilisation des nucléotides rigidifiés par une liaison cyclic 2’-O,4’-C-methylene, "linked locked nucleic acids" (LNA), offre une possibilité intéressante. Cette cyclisation bloque le sucre dans la conformation C3'-endo, comme dans des ARN naturels en hélice, et la rend résistante aux enzymes de dégradation. Les résultats expérimentaux sont très intéressants, mais une partie des données n’est pas encore comprise. Une incorporation partielle de LNA facilite d’une façon importante la formation des triples hélices, tandis que l’utilisation de LNA sur toute la longueur de l'oligonucléotide donne des résultats négatifs. Afin de comprendre ces résultats et trouver des séquences optimales pour les triples hélices nous avons effectué une étude par modélisation. Nous avons montré que LNA a une conformation du sucre très plissée avec une amplitude 50% plus importante que dans l'ADN ou l'ARN standards. La nécessité d’accommoder ce sucre mène à une augmentation du rise et entraîne une réduction des interactions d’empilement entre les bases et le déplacement des paires de bases vers le petit sillon. Pour les oligonucléotides alternant les nucléosides standard et LNA, l’énergie de déformation du troisième brin est beaucoup plus basse que celle avec ADN ou LNA pur. Nous avons trouvé que la substitution d’un nucléotide sur deux ou trois par un LNA est optimale et que l’utilisation des dérivés 5-methylcytosine est conseillée dans les conditions du pH neutre. Une autre conclusion de cette étude est la possibilité d'utiliser d’un pont plus long pour bloquer la conformation du sucre, qui pourrait réduire son amplitude de plissement sans changer la conformation désirée 3’endo.
Malgré sa petite taille, la protéine RecA est un acteur clé du mécanisme de recombinaison homologue chez les prokaryotes. Sa forme active est un filament nucléoprotéique hélicoïdal, formé de façon coopérative en présence d'ATP autour d'un simple brin d'ADN étiré par un facteur 1.5. Ce filament est capable d'intégrer et étirer un double brin d'ADN, d'aligner les séquences homologues des deux oligonucléotides et d'induire un échange de brins. Les mécanismes de la reconnaissance et de l'échange de brins sont encore largement méconnus du fait de l'instabilité des composés intermédiaires. Nous avons montré précédemment que, dans les conditions d’étirement/déroulement présentes dans le filament de RecA/ATP, le duplex d’ADN peut accommoder un simple brin dans son petit sillon, formant ainsi une triple hélice d'un type nouveau, ADN-ST. Des études plus poussées sur le triplex ST montrent qu’il s'agit d'une forme métastable qui peut se stabiliser de façon notable, à étirement constant, par échange interne d’appariement L’échange est facilité par une position propice des bases du simple brin par rapport aux bases du duplex et a pu être simulé en faisant tourner les bases du brin complémentaire du duplex autour de son squelette phosphodiester. Le résultat est une nouvelle triple hélice où le simple brin échangé occupe le grand sillon du duplex. De type connu (forme R), cette triple hélice parallèle se compresse et s’enroule lorsqu’on simule une déprotéination en supprimant les contraintes d’étirement. Ses caractéristiques sont celles d’une triple hélice isolée expérimentalement dans des conditions où le départ du brin échangé est empêché. Finalement, nous avons montré que la triple hélice ST est un vecteur plausible pour une recherche rapide d’homologie de séquence. La reconnaissance de séquence peut se produire partiellement pendant la formation de la triple hélice mais doit être complétée lors de l’échange d’appariement, défavorable aux triplets de bases présentant un mésappariement. Ceci est en accord avec des résultats sur la cinétique de l'association et de l'échange de brins en fonction du degré d'homologie, obtenus par le groupe de notre collaborateur M. Takahashi (Bazemore et al., PNAS USA 1997, 94:11863). Mécanismes de reconnaissance de l'ADN
Nous avons appliqué la méthodologie ADAPT à la recherche des sites d'interaction de la protéine TBP avec l'ADN. En tant que composant du facteur de transcription TF11D, la liaison de la TBP ("TATA-box binding protein") avec l'ADN constitue la première étape de la formation du complexe de transcription. Sa cible, qui contient la séquence TATA plus trois autres paires de bases riche en A/T, se trouve environ 35 paires de bases en amont du site de démarrage de la transcription. La liaison de la TBP induit une forte déformation de l'ADN, ouvrant le petit sillon et créant une courbure d'environ 90°. Les études combinatoires des séquences interagissant avec la TBP, prenant en compte uniquement l'énergie de déformation de l'ADN, ont permis de dégager une séquence consensus proche des résultats expérimentaux. Ceci confirme que la TBP reconnaît sa cible principalement grâce aux propriétés mécaniques locales de la double hélice d'ADN. En effet, les structures cristallographiques disponibles des complexes TBP-ADN montrent que seulement deux paires de bases au sein du consensus peuvent être reconnues grâce à la formation de liaisons d'hydrogène spécifiques avec les chaînes latérales de la protéine. Récemment, nous avons pu raffiner notre approche en ajoutant l'énergie d'interaction protéine-ADN lors de nos études (voir la section D3.1). Ceci nous permet d'aborder l'ensemble de complexes protéine-ADN pour lesquelles il existe des informations structurales (nécessaires pour les calculs avec ADAPT). Nous venons de compléter une étude de 18 complexes impliquant la plupart des familles de protéine capable de se lier avec l'ADN de façon spécifique (doigts de zinc, nucléases, hélice-boucle-hélice, bZIP, ....). Pour chaque complexe nous avons calculé les énergies d'interaction protéine-ADN et les énergies de déformation d'ADN lors de la complexation, pour l'ensemble des séquences possibles au sein de chaque complexe. Les résultats montrent qu'à partir de ces énergies, nous sommes capables de prédire correctement la séquence consensus pour toutes les protéines étudiées (voir Figure 8).
Pour mieux comprendre le mécanisme de reconnaissance employé par chaque protéine, nous avons aussi mis au point des indices quantitatifs. Dans la littérature on parle depuis quelques années de deux types de reconnaissance distincts : la reconnaissance dite "directe" basée sur la formation d'interactions spécifiques (liaisons d'hydrogène ou contacts stériques) entre la protéine et les bases de l'ADN, et la reconnaissance dite "indirecte" basée sur l'adaptation structurale de l'ADN lors de la complexation. Nous pouvons associer ces deux modes de reconnaissance respectivement aux variations d'énergie d'interaction protéine-ADN et aux variations d'énergie de déformation de l'ADN en fonction de la séquence de bases. Ces informations sont disponibles à partir des résultats obtenus avec ADAPT. Nous avons donc pu définir deux indices pour quantifier les deux modes de reconnaissance. Ces indices, Lint et Ldef, une fois normalisés dans une gamme 0→1 (en divisant par la longueur totale du complexe), permettent de placer n'importe quel complexe sur un graphe à deux dimensions. Les résultats pour les complexes que nous avons étudiés sont montrés dans Figure 9. Pour chaque complexe, Lint décrit la contribution des effets "directs" à la reconnaissance, tandis que Ldef décrit les effets "indirects". Nous pouvons constater que la fixation des complexes comme celui des doigts de zinc est déterminée presque exclusivement par le mécanisme direct (Lint ≈ 1, Ldef ≈ 0), tandis que la fixation des TBP dépend presque exclusivement du mécanisme indirect (Ldef ≈ 1, Lint ≈ 0).
Figure 9 décèle une autre information originale qui étend notre compréhension de mécanismes de reconnaissance. L'axe liant les points (Ldef = 0, Lint = 0) et (Ldef = 1, Lint = 1), indiqué dans la figure, permet de classifier les complexes suivant l'accord ou le désaccord qui existent entre les composantes directes et indirectes de la reconnaissance. Pour la plupart des complexes, ces deux modes de reconnaissance fonctionnent en harmonie ("concordant recognition"), favorisant la complexation avec les mêmes séquences de bases. Néanmoins, pour certaines protéines, comme la Trp repressor ou CAP, les séquences favorisées par les interactions de type directe et indirecte sont incompatibles ("discordant recognition") et les séquences finalement reconnues dépendent de la dominance des variations énergétiques de l'un des deux termes.
Les CpG méthylés de l'ADN participent à la régulation de l'expression génétique et constituent des points chauds de mutagenèse. L'influence de la méthylation des cytosines sur la structure de l'ADN n'est cependant pas encore bien comprise. Nous avons révélé l’existence de liaisons hydrogènes C-H...O entre les C5-methyl cytosines et le groupement phosphate d’autres hélices d’ADN ou avec les molécules d'eau. Ces travaux ont montré que la 5-méthyl cytosine est mieux hydratée que son homologue non modifié. Nos résultats ont également montré que la méthylation stabilise des structures très altérées de l'ADN en agissant sur l'hydratation. Sur la base de nos travaux sur le rôle de la structure de l’ADN dans la fidélité de la réplication, nous avons montré que les CpG méthylés qui adoptent des structures particulières au sein des doubles hélices en forme A, peuvent altérer le sites actifs des polymérases et induire des erreurs de synthèse de l’ADN. De fait, nous avions démontré qu’en atténuant considérablement les variations structurales "séquence-dépendentes" de l'ADN, la forme A de l'ADN participe activement à la fidélité de la réplication. Au contraire, la forme B, plus flexible favorise la formation de mutations. Il restait donc à expliquer comment les formes A de l’ADN pouvaient également induire des erreurs de synthèse. Etude de complexes spécifiques d'ADN
Le besoin pratique de trouver des ligands agissant comme agents antitumoraux ou comme des enzymes artificielles nécessitent une bonne compréhension des mécanismes de ces interactions. Pour ce type d'étude la chimie théorique s'avère être la méthode de choix. Nous avons abordé l'étude de trois types de ligands - une porphyrine métallisée, qui agi comme une nucléase artificielle, un ligand de la famille des phénylpropanoïdes glycosides (PPG) actif dans la réparation de l'ADN et un peptide, dérivé d'une protéine de la famille HMG-I ("High Mobility Group") et participant au contrôle d'expression génétique. Ces trois ligands interagissent dans le petit sillon de l'ADN, qui est parfaitement adapté à les recevoir, même quand il s'agit d'un ligand aussi grand que l'oxyl/hydroxyl Mn(IV) méso-tetrakis(4-N-methylpyridinium)porphyrine (TmPyP). Le fait que de tels ligands n'induisent que de petites déformations de la conformation de la double hélice est un point très important pour la conception de médicaments assistée par l'ordinateur où les changements de la conformation de la cible peuvent poser de graves problèmes. Dans le cas de TmPyP, nous avons montré que le choix d'un HC5' (attaché au carbone secondaire) comme site d'attaque n'est pas d'origine stérique car HC4' (tertiaire) est également accessible. Nos résultats suggèrent que l'espèce active, responsable pour la coupure des brins de l'ADN n'est pas le dérivé oxyl/hydroxyl, comme c'est généralement admis, mais probablement le dérivé oxyl/oxyl. La famille de phénylpropanoides glycosides (PPG) possède des propriétés intéressantes du point de vue biologique et pharmaceutique. Notamment, ils agissent en tant qu'antioxidantes et elle peuvent réparer l’ADN endommagé par les radicaux hydroxyles. Ils ont également des propriétés antitumorales et ils peuvent induire des transformations inverses dans les cellules cancéreuses. Des études expérimentales ont montré un double rôle pour cette famille, la protection des bases de l’ADN par l'élimination des radicaux d’ions superoxide et hydroxyle et la réparation rapide de l’ADN endommagé. Afin de développer de nouveaux dérivés efficace, il est important de comprendre leur mécanismes d’action. Les études expérimentales actuels sont limitées aux études physico-chimiques des bases isolées ou aux études des cellules tumorales. L’étape manquante est l’étude des ADN isolés. Grâce à la modélisation, nous avons pu proposé un mécanisme pour la création des radicaux de la guanine au sein de l’ADN. Nous avons également proposé un mécanisme original de la réparation de l'ADN par la PPG impliquant un transfert d'électron entre une guanine radicale et le ligand situé dans le petit sillon. Ce mécanisme implique une double tautomérisation de la guanine. Nous avons montré par les calculs quantiques et la mécanique moléculaire que le mécanisme proposé est raisonnable de point de vue stérique et énergétique. Dans une extension de cette étude nous avons montré que le cistanoside C peut aussi interagir avec l’ADN télomèrique et former les complexes avec une géométrie bien adaptée au transfert d’un électron. Les calculs effectués sur différents membres de la famille PPG ont donné des résultats en bon accord avec les études expérimentales concernant la cinétique de la réparation d’ADN. Le troisième ligand que nous avons étudié est un modèle simplifié d'une protéine HMG I et correspond à son domaine de liaison à l'ADN, la protéine entière étant trop faiblement structurée pour une étude théorique fiable. Nous avons modélisé la complexation de ce peptide avec deux séquences cibles de l'ADN. Nous avons montré que la localisation du ligand et les détails de l'interaction dépendait de la séquence cible en accord avec les données expérimentales et que ces résultats pouvaient s'appliquer aussi à la protéine native. Nous avons aussi proposé un modèle du complexe de ce peptide avec deux hélices parallèles de l'ADN pour expliquer sa capacité à induire une condensation ordonnée d'ADN. Notre dernière étude des interactions ligand-ADN a porté sur la bleu de méthylène qui peut fonctionner comme photosensibilisateur dans le traitement des cancers de la peau. Ce ligand peut s'intercaler entre deux paires de bases successives de la double hélice, mais peut aussi se lier dans le petit sillon de la double hélice. En collaboration avec le groupe de H. Sklenar (Institut Max Delbrück, Berlin) nous avons pu expliquer les données spectroscopiques concernant ce ligand et aussi mieux définir l'impact de la séquence de bases sur son mode de complexation.
La protéine p53 est un acteur clé dans le processus de l'apoptose, la mort cellulaire programmée. La perturbation des interactions ADN-p53 sont responsables pour la majorité des cancers humains. La p53 interagit avec l'ADN en forme de tétramère mais, malheureusement, nous ne possédons que la structure d'un complexe comportant un seul monomère. Grâce au logiciel CONTACT (voir section D1.1), nous avons pu bâtir un modèle du dimère de p53 avec l'ADN en optimisant l'interface entre les deux monomères en fonction de la courbure de la double hélice. L'angle de courbure optimale correspond bien aux mesures expérimentales de la courbure induite par la fixation de p53 et suggère que ce modèle peut servir de base pour la construction et l'étude du complexe tétramèrique. Ces deux études ont impliqué la minimisation en coordonnées internes couplée avec une représentation très simple de solvant (une fonction diélectrique dépendent de la distance séparant les charges atomiques), suivie par des calculs Poisson-Boltzmann pour tenir compte de la forme de l'interface soluté-solvant et des effets de désolvatation. Compte tenu des bons résultats obtenus avec de telles approches, notre laboratoire s'intéresse activement au développement des modèles de type Born généralisé qui sont capables de reproduire les résultats Poisson-Boltzmann, mais aussi sont suffisamment rapides pour être intégrés dans des études d'optimisation d'énergie ou de dynamique moléculaire.
La protéine NF-kB est un des facteurs qui contrôle l'expression d'une grande variété de gènes, dont ceux du VIH-1 intégré au génome de l’hôte. La forme active de NF-kB est un hétérodimère formé par les sous-unités P50 et P65. La structure cristallographique du complexe P50-P65 montre que l'interaction a lieu par l'intermédiaire de 5 longues boucles de la protéine liées dans le grand sillon de l'ADN. La structure de l’ADN est globalement très peu perturbée. Il est juste noté une courbure douce vers le grand sillon, estimée à 15° dans les cristaux et à environ 30° en solution. Nous avons utilisé des modélisations très poussées (mécanique moléculaire avec JUMNA, calculs des énergies de solvatation et des champs électrostatique avec DelPhi (B. Honig, Columbia University, USA) et enfin dynamique moléculaire) confortées par des expériences RMN pour étudier i) l'oligomère natif CTGGGGACTTTCCAGG (soulignée : la séquence contactée par la protéine) ii) l'oligomère CTGCTCACTTTCCAGG, muté sur trois paires de bases (en italique), qui n'est pas du tout reconnu par NF-kB. Nous avons ainsi pu montrer que c'est tout l'ensemble des caractéristiques statiques, dynamiques et électrostatiques qui font que la séquence mutée est dissuasive pour NF-kB. La spécificité du fragment natif s'exprime essentiellement par le comportement des groupements phosphate des pas CpA.TpG situés hors de la zone de contact. Ceux-ci présentent une forte propension à adopter une conformation BII, laquelle confère à la séquence consensus un ensemble de propriétés favorables à l'arrimage de la protéine, en particulier l'exposition des bases dans le grand sillon et une courbure identique à celle observée dans le co-cristal.
OR1 et OR2 sont deux sites de 12 paires de bases qui contiennent un motif commun formé par deux demi-sites ACAA.TTGC, contactés dans leur grand sillon par le motif hélice-tour-hélice du répresseur. Ils diffèrent par les 4 paires de bases qui séparent ces demi-sites, et qui ne sont jamais en contact direct avec la protéine. Dans les complexes, OR1 et OR2 sont courbés de 30° environ vers le petit sillon. En dépit d'une très forte homologie de séquence, OR1 est mieux reconnu que OR2. De plus, la longueur et la composition en bases de la séquence qui sépare OR1 de OR2 modulent les constantes d'affinités. Nous avons étudié par dynamique moléculaire en solvant explicite un fragment de l'ADN du phage 434, long de 50 paires de bases et contenant les sites OR1 et OR2 séparés par 8 paires de bases. Nous montrons que OR1 présente un grand sillon peu profond, qui expose les atomes des bases. Ce fragment est légèrement courbé vers le petit sillon, comme dans le complexe. Les déviations standards des paramètres structuraux sont faibles, et en conséquence, la structure de OR1 est bien définie au cours du temps. OR2 ne présente pas ces particularités. C'est un fragment qui apparaît plus proche d'un ADN-B canonique et plus malléable que son homologue OR1. La structure libre d’OR1 est donc plus proche de la structure complexée que la structure libre de OR2. Les différences observées entre OR1 et OR2 sont dues à la nature des 4 bases centrales et à leurs dynamiques associées: la zone centrale de OR1 est particulièrement favorable aux conformations BII du brin. En conséquence, la structure de tout le fragment s'en trouve légèrement rigidifiée, puisque les conformations BII sont associées à des paramètres hélicoïdaux peu variables. La différence de la dynamique des brins phosphodiester des zones non contactées par la protéine rend donc compte des différences d’affinité entre les deux opérateurs. Quant au fragment qui sépare OR1 de OR2, il apparaît comme particulièrement rigide, et adopte des caractéristiques d'une forme A. En particulier le grand sillon devient très étroit et profond, ce qui ne donne aucune chance à la fixation d'un répresseur. D'autre part, il présente une courbure notable, qui pourrait tout à fait jouer un rôle dans la coopérativité des répresseurs, en les orientant favorablement l'un par rapport à l'autre.
Des dynamiques moléculaires en solvant explicite ont été menées sur deux séquences naturelles : CGCACCGACGTCGGTGCG qui présente une haute affinité pour E2, et CGCACCGAAACCGGTGCG, d’affinité très médiocre. Nous montrons que les demi-sites des deux séquences convergent vers une même structure, extrêmement proche de celle observée sur des deux ADN liés à E2. Les structures des fragments centraux sont également proches de l'ADN lié dans le complexe d'affinité moyenne, mais fort éloignées de l'ADN lié dans le complexe de haute affinité. Les deux séquences libres diffèrent spectaculairement par la dynamique des brins des quatre paires de bases centrales : dans la première séquence, les phosphates du pas CpG.CpG central sont caractérisés par d’incessantes transitions BI/BII non corrélées sur les brins en vis-à-vis. Ce comportement instable n’est observé nulle part ailleurs dans les séquences. Ces mouvements du brin permettent à l’oligomère de haute affinité d'atteindre une zone de l'espace conformationnel qui ressemble par bien des paramètres à ceux qui caractérisent l'ADN du complexe de haute affinité (déplacement des paires de bases dans les sillons et courbure). De ces résultats, nous pouvons proposer un schéma du mécanisme de reconnaissance. Les demi-sites offrent à la fois le bon motif électrostatique et une structure adaptée à la protéine. Ils n’auront aucun mal à recruter E2 pour la formation d’un complexe de stabilité moyenne, que nous qualifierions de pré-complexe. Mais le verrouillage final qui conduit au complexe de haute affinité demande une séquence flexible, qui permet l’adaptation fine des deux partenaires.
Nous avons étudié le fragment d'ADN de 50 paires de bases que nous avions aussi observé libre (voir section E4.4), mais contacté par les répresseurs, sous forme de deux fois deux dimères fixés dans les grands sillons des deux sites OR1 et OR2. Ces dynamiques moléculaires en présence d'eau et de contre-ions explicites ont été réalisées par le groupe de L. Harris. Nous disposons ici de données expérimentales, sous la forme de deux co-cristaux, l'un de OR1/répresseur, l'autre de OR2/répresseur. Les structures que nous obtenons par simulations se stabilisent à 1.5 Å de leurs correspondants cristallographiques, ce qui nous montre l'excellence de la simulation. Les répresseurs agissent différemment sur OR1 et OR2: la flexibilité de OR1 est accrue par rapport à celle de son état libre, alors que celle de OR2 est diminuée. Lors de la complexation, le changement d'entropie paraît donc favoriser OR1. D'autre part, la fixation des répresseurs altère essentiellement la dynamique des brins de l'ADN (sucres et groupements phosphate) sans pour autant être directement relié à la neutralisation des atomes chargés du brin par les protéines. En plein accord avec notre analyse statistique de la banque cristallographique dont j'ai précédemment parlé, nous observons un accroissement du pourcentage de la conformation nord des sucres, corrélée à une diminution du pourcentage des formes BII des phosphates. Cette double modification dans le brin fait penser à un espace conformationnel plus proche de celui d'une forme A que d'une forme B de l'ADN. Sans pour autant adopter toutes les caractéristiques d'une forme A, OR1 comme OR2 peuvent ainsi adopter des twists très faibles, nécessaires à l'adaptation des deux partenaires. La dynamique moléculaire du complexe, comparées à celle du même ADN sans ses protéines, a fourni une explication complète à la différence de reconnaissance entre les deux sites OR1 et OR2. Mais elle a aussi permit d'observer que la présence d'une protéine sur son site a pour principal effet de modifier la dynamique du brin phosphodiester, qui permet d'assister et de moduler l'adaptation des partenaires du complexe.
La poursuite de notre travail sur le mécanisme d'échange de brins d'ADN au sein du filament de RecA implique la prise en compte explicite de la protéine, intervenant dans notre modèle initial uniquement par ses effets sur la structure de l'ADN. Nous disposons pour cela de la structure cristallographique du filament de RecA/ADP, correspondant à l'étape de la réaction suivant l'échange de brins. Nous avons donc étudié l'amarrage à ce filament de la triple hélice de type R, résultant dans notre modèle de l'échange. La difficulté essentielle tenait au fait que deux boucles situées sur la surface interne du filament de RecA ont une structure indéterminée en absence d'ADN. Il fallait donc déterminer leur conformation simultanément à l'amarrage de la triple hélice. Nous avons pour cela mis au point une nouvelle méthodologie, implémentée dans le logiciel MC2 d'amarrage flexible de macromolécules (décrit en section D3.2). Les premiers résultats de l'assemblage du système RecA/ADN-R sont très prometteurs puisqu'ils prédisent, parmi les acides aminés en interaction avec l'ADN, des résidus cruciaux pour l'activité recombinatoire de RecA et ceux identifiés par des études expérimentales de pontage ADN/RecA.
Propriétés conformationnelles et mécaniques des protéines
Nous avons abordé l'étude de la dynamique interne de peptides, via l'analyse quantitative de la relaxation homonucléaire observée en ROESY hors-résonance (ROESY HR). Ces méthodes sont les seules à permettre une mesure quantitative des paramètres de relaxation homonucléaire, indépendamment de tout modèle de mouvement et sans information a priori sur la structure 3D de la molécule étudiée. Par ailleurs, il avait été montré dans la littérature que la mesure des temps de relaxation hétéronucléaire T1 et T2 15N permettait de déterminer le tenseur de diffusion rotationnelle d'une molécule, et par là-même, sa forme. Cette détermination s'effectue via l'analyse de l'histogramme des valeurs T1/T2, qui joue ainsi un rôle équivalent à celui des spectres de poudre en RMN du solide.
Ainsi, nous
avons mis au point une méthode de traitement des paramètres de
relaxation homonucléaire, qui permet de déterminer un histogramme
analogue à celui des rapports T1/T2 et ensuite, le tenseur de diffusion
rotationnelle de la molécule, et sa forme. Une telle méthode présente
l'avantage de pouvoir donc déterminer la forme en solution d'un peptide
directement à partir de mesures RMN, y compris dans le cas où un trop
petit nombre d'effects Overhauser nucléaires ne permet pas de déterminer
sa structure. La méthode proposée a été appliquée aux ROESY HR
enregistrées sur la ranalexine, peptide antimicrobien. Elle a permis de
déterminer la forme moyenne du peptide en solution dans l'eau, où sa
structure n'avait pu être déterminée.
Plusieurs résultats portent à croire que les propriétés mécaniques des protéines ont un réel intérêt biologique. En effet, plusieurs protéines doivent subir ou réagir à des sollicitations mécaniques lors de leur fonctionnement. Dans cette catégorie nous pouvons citer les protéines des fibres musculaires, les protéines moteurs et les protéines constituant des canaux transmembranaires mécanosensibles. Mais nous pouvons supposer que les propriétés mécaniques sont aussi importantes de façon plus générale, par exemple, comme un élément des mécanismes de catalyse enzymatique pour contrôler les propriétés des sites actifs, ou encore, pour moduler le comportement des zones impliquées dans la formation de complexes protéiques spécifiques. A part quelques expériences de micromanipulation effectuées sur des molécules uniques, il existe aujourd'hui très peu d'information sur de telles propriétés mécaniques. Tout ce que nous savons est qu'il n'y a apparemment pas de rapport entre la stabilité thermodynamique et la stabilité mécanique d'une protéine et que les propriétés mécaniques mesurées par l'étirement du brin polypeptidique dépendent de la position des points d'accrochage et de la direction d'étirement (D.J. Brockwell et al. Nat. Struct. Biol. 10, 2003, 731-737, M. Carrion-Vazquez et al. Nat. Struct. Biol. 10, 2003, 738-743). Ainsi, nous avons décidé d’aborder l'étude des propriétés mécaniques des protéines par le biais de la modélisation. Notre premier travail a consisté dans l'étude des propriétés de la myosine par le biais d'un modèle simplifié appelé GNM (Gaussian Network Model) qui représente une protéine par un ensemble de ressorts reliant les paires d'atomes Ca séparés par moins qu'une distance seuil. En combinant une analyse en modes normaux et une étude des déformations ayant lieu entre différentes formes cristallographiques de la myosine, il a été possible de définir les blocs structuraux qui composent cette protéine moteur, d'analyser l'origine de la rigidité du bras levier (impliqué dans le déplacement de la protéine le long des fibres d'actine) et d’étudier les changements qui accompagnent l'interaction de la protéine avec ses cofacteurs (ATP/ADP). Pour aborder une étude plus fine des liens entre structure et mécanique nous avons tenté de définir un indice permettant de caractériser l'élasticité d'un brin polypeptidique résidu par résidu. De telles informations ne sont pas faciles à obtenir par l'analyse des trajectoires de dynamique moléculaire ou par les calcul des modes normaux. La contrainte que nous avons employée porte sur le moyen des distances Cak-Caj entre le résidu sondé k et l'ensemble des autres résidus j de la chaîne (excluant les résidus k-1 et k+1). La modification de cette distance moyenne permet de calculer la constante de force associée avec le déplacement de chaque Ca par rapport à l'architecture de la protéine et révèle la direction de déplacement montrant la moindre résistance. Ces informations peuvent être utilisées pour dresser une image de la structure mécanique de la protéine, la facilité de différentes déformations et les couplages liés à ces déformations. Un des premiers résultats semble être la possibilité de définir un coeur mécanique, regroupant l'ensemble des résidus associés avec des constants de force élevées. Nous étudions aussi la possibilité d'obtenir les mêmes informations à partir des modèles simplifiés tels que l'approche GMN cité ci-dessus.
Les protéines prions attirent beaucoup d'attention aujourd’hui à cause du nombre croissant des maladies reconnues comme liées aux transformations pathogéniques de ces protéines et de l'importance sociale et économique de ces maladies. Depuis quelques temps nous participons à un des projets expérimentaux qui vise à clarifier les mécanismes moléculaires de ces transformations et peut être trouver des moyens pour les renverser. Nous essayons d'utiliser les avantages de l'ICMD pour aider les expérimentateurs dans leurs études structurales des peptides d'origine prion et leurs complexes avec d'autres molécules.
Dans une première étape, les propriétés conformationelles d'un peptide linéaire synthétique, dérivé de la partie globulaire de la protéine prion du mouton, ont été étudiées par résonance magnétique nucléaire (RMN). Le peptide étudié contenait la région 142-166 (numérotation chez l'homme) de la protéine prion du mouton. Dans la forme non pathogène de la protéine cette région est principalement structurée en hélice a. A partir de l'analyse des signaux NOE observés à 5°C dans des conditions physiologiques de solvatation, 169 contraintes ont été établies pour les distances inter-protons. Ces distances ont été utilisées dans le calcul de raffinement structurel, utilisant l'ICMD et le recuit simulé dans l'espace des angles de torsion. Ces calculs incluaient plusieurs cycles de repliement à partir des conformations initiales aléatoires. Ainsi quelques centaines des conformations ont été obtenues et classées selon leurs correspondances aux contraintes expérimentales. Les meilleures structures manifestaient toutes le même motif de type épingle b avec très peu de variations structurelles au centre du peptide. Ceci ne correspond pas à la structure de ce peptide au sein de la forme non pathogène de la protéine et indique peut être une des premières étapes structurales entraînant les maladies liées au prion.
La gigantécine est un long acide gras de 34 atomes de carbone, appartenant à une famille de substances présentant un fort potentiel anticancéreux. Ces substances interagissent spécifiquement avec la "NADH-oxidase" des membranes plasmiques des cellules cancéreuses, mais pas avec celle des cellules normales. De plus, elles ont montré une activité inhibitrice importante de cellules cancéreuses résistantes à l'adriamycine. La "NADH-oxidase" de la surface cellulaire accepte le mononucléotide flavine (FMN) comme cofacteur et est active sous forme dimérique avec une stoechiométrie d'association 1:1 avec la flavine. Partant de la structure cristallographique de la NADH oxidase (Protein Data Bank, code 1nox), nous avons étudié le mode possible d'interaction de la gigantécine avec cette protéine à l'aide du programme de "docking" moléculaire Dock 4.0.1 (Leach and Kuntz, J. Comput. Chem. 1992, 13:730). Nous avons proposé un modèle pour l'interaction de la gigantécine avec la NADH oxidase, dont les principales caractéristiques sont les suivantes : (i) la gigantécine est placée dans une crevasse située entre les deux monomères de la protéine, (ii) le système g-lactone et l'hydroxyle en C-4 de la gigantécine interagissent fortement avec des résidus du site de complexation de la FMN, par un réseau de liaisons hydrogène et d'interactions hydrophobes, et (iii) la chaîne aliphatique est repliée de façon à enfouir les groupements polaires à l'intérieur du ligand où ils forment des liaisons hydrogènes. La partie exposée de la chaîne, principalement hydrophobe, est en contact étroit avec des résidus de la protéine de même type.
La protéine ribosomique L20 (118 résidus) s'attache directement à l'ARN ribosomique 23S et est essentielle aux premières étapes de l'assemblage de la sous-unité 50S. Son site de fixation à l'ARN 23S est connu et le contrôle post-transcriptionnel de son propre gène s'effectue par l'intermédiaire d'un repliement particulièrement complexe de l'ARN (Chiaruttini et al., 1996, 1997). En collaboration avec le groupe de M. Springer qui se concentre sur la biochimie et la génétique de cette protéine, nous avons entamé l’étude structurale de cette protéine. Des cristaux de la L20 de Aquifex Aeolicus native et substituée (sélénium) ont été obtenus. Ces cristaux diffractent à 3Å de résolution et cristallisent dans le groupe d’espace P1 (a=44.0 Å, b=44.4 Å, c=65.8 Å, a=104.0°, b=106.2°, g=97.8°). L’enregistrement des données à la ligne BM30A de l’ESRF (Grenoble) nous a permis d’obtenir de nombreux jeux de données à différentes longueurs d’onde que nous exploitons actuellement pour la résolution de la structure par SAD et MAD. Les fonctions de self-rotation nous ont montré que six monomères s’organisent en deux trimères en relation par un axe 2 non cristallographique dans l’unité asymétrique.
Nous venons de résoudre la structure cristallographique d’un duplex d’ARN contenant le motif GAAA. Ce motif lui confère la propriété de s’auto cliver en présence de Mn2+. Cette structure a été résolue par multiwavelength anomalous dispersion (MAD) en utilisant le brome d’une 5-bromo uridine comme diffuseur anomal. La résolution de cette structure a été rendue très difficile par la nature du groupe d’espace P1 (absence de symétrie) et la photolyse du brome au cours des enregistrements au synchrotron (ESRF). Nous avons cependant surmonté ces difficultés en améliorant la qualité des cristaux et en enregistrant chaque longueur d’onde sur différents cristaux. L’affinement de la structure à 1.4 Å de résolution est actuellement terminé. La carte de densité montre, sans ambiguïté, la manière dont cette séquence fixe les ions monovalents et divalents et indique comment le contexte moléculaire peut influencer la structure secondaire de l’ARN.
|
|
|