Début

Introduction

Identification des homologues

Localisation intracellulaire

Domaines transmembranaires

Modèles structuraux

Sites de phosphorylation et d'ancrage de phosphatidyl inositol

Discussion

Matériel supplémentaire

Bibliographie

 

Matériel supplémentaire

Localisation intracellulaire

Domaines transmembranaires

Recherche de domaines

Prédictions de structures de protéines par analyse comparative

Swiss-Model

3D-JIGSAW

Alignement des structures 3D prédites

Breton et al. ont utilisé des approches expérimentales et bioinformatiques afin de déterminer la fonction des protéines COR413. Ils ont ainsi pu analyser leur régulation, identifier les homologues, déterminer la localisation cellulaire, vérifier la structure topologique, trouver des sites de phosphorylation et d'ancrage de phosphatidylinositols glycosylés. Les auteurs présentent également les alignements multiples de la protéine TaVRT-1 ainsi que des résultats expérimentaux, mais ne vont pas plus loin dans leurs analyses bioinformatiques et ne s'aventurent pas dans la prédiction de sa structure 3D.

Nous avons donc soumis la séquence de la protéine TaVRT-1 à différents outils de prédiction utilisés pour caractériser cor413 et nous présentons les résultats en les comparant à ceux de COR413-PM et COR413-TM. Nous avons cru bon de compléter ces analyses par une approche de prédiction de la structure tridimensionnelle de la protéine COR413-PM1.

Localisation intracellulaire

PSORT : http://psort.nibb.ac.jp/

Logiciel qui prédit la localisation des protéines dans la cellule. Afin de diriger les protéines aux bons sites les signaux de triage cellulaire obéissent à certaines règles connues(charges, hydrophobicité et patrons) . PSORT applique ces règles à la séquence candidate et détermine la possibilité que la protéine soit localisée à chacun des sites potentiels. Les sites potentiels sont la mitochondrie, le peroxisome, le chloroplaste, le noyau, le réticulum endoplasmique et les régions transmembranaires.

iPSORT : http://psort.nibb.ac.jp/

Prédit la localisation cellulaire en détectant les signaux de triage cellulaire N-terminal soient : Signal Peptide (SP), Mitochondrial Targeting Peptide(mTP), ou Chloroplast Transit Peptide (cTP). iPSORT vérifie si la protéine a certaines propriétés particulières , charges des acides aminés et patrons.

TargetP : http://www.cbs.dtu.dk/services/TargetP/

Prédit la localisation cellulaire soit secrétion (SP), Mitochondrial Targeting Peptide(mTP), Chloroplast Transit Peptide (cTP) ou autres à l'aide d'un réseau de neurones.

SignalP : http://www.cbs.dtu.dk/services/SignalP-2.0/

Prédit la présence de signal peptide et signal d'ancrage à l'aide d'un réseau de neurones et de HMM.

Tableau 4. Signaux cibles et localisation cellulaire.

 

PSORT

IPSORT

TargetP

SignalP-NN

SignalP-HMM

COR413-PM

c.t.m. (0.752)

p.m (0.600)

----

----

 

non

Signal anchor

0.987

COR413-TM

e.r.(0.685)

p.m.(0.640)

cTP

 

cTP

0.932

 

oui

Signal pept.

0.578

VRT-1

Noyau(0.760)

----

----

 

non

0.00

Les prédictions des auteurs sont bien répétées pour COR413-PM et COR413-TM. La seule prédiction pour VRT-1 est celle de PSORT qui prédit une localisation nucléaire ce qui est en accord avec la fonction proposée de facteur de transcription.

Haut de page

Domaines transmembranaires

Protscale : http://www.expasy.org/cgi-bin/protscale.pl

Permet de représenter le profil d'une protéine selon différentes propriétés physiques et chimiques des acides aminés telles: hydrophobicité, poids moléculaire, polarité, encombrement et plusieurs paramètres structuraux .

TMHMM : http://www.cbs.dtu.dk/services/TMHMM/

Prédit la présence d'hélices transmembranaires dans une protéine. Comme son nom l'indique l'outil fait appel aux modèles de Markov cachés.

 

Figure 7. Hydropathie et prédictions des domaines transmembranaires.

Les résultats pour COR413-PM et COR413-TM correspondent à ceux des auteurs. Les prédictions indiquent clairement la présence de cinq domaines transmembranaires pour COR413-PM. Par contre pour VRT-1 il ne semble pas y avoir de domaines transmembranaires.

Haut de page

Recherche de domaines

ScanPROSITE : http://www.expasy.org/tools/scanprosite/

Cherche un patron ou profil reconnu dans la base de données de Prosite.

Tableau 5. Résultats de ScanProsite

COR413-PM

COR413-TM

VRT-1

 

*Protein kinase C phosphorylation site [pattern]

 

*Protein kinase C phosphorylation site [pattern]

 

*Protein kinase C phosphorylation site [pattern]

*N-myristoylation site [pattern]

 

*N-myristoylation site [pattern]

 

*cAMP- and cGMP-dependent protein kinase phosphorylation site [pattern]

* Leucine zipper pattern [pattern]

*N-glycosylation site [pattern]

 

*Casein kinase II phosphorylation site [pattern]

 

 

*Bipartite nuclear targeting sequence [rule]

 

 

MADS-box domain signature [pattern].

 

 

MADS-box domain [profile].

 

( * [Warning: rule with a high probability of occurrence])

Les auteurs n'ont pas considéré les patrons avec haute probabilité d'occurrence, donc pour COR413-PM et COR413-TM on ne trouve rien d'intéressant . Pour VRT-1 on trouve un patron et un profil correspondant au domaine MADS-box, ce qui n'est pas surprenant.

RPS-BLAST : http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi

Identifie dans notre séquence les domaines conservés de deux collections soient Smart et Pfam.

Figure 8. Alignements produits par RPS-Blast.

Comme pour ScanProsite aucun résultats probants pour COR413-PM et TM, mais reconnaissance du domaine MADS-box.

Haut de page

Prédictions de structures de protéines par analyse comparative

La structure 3D des protéines, les coordonnées 3D de tous leurs atomes, est importante à une meilleure connaissance de leur fonction. Elle permet également le design de composés pouvant être utilisés pour leur inhibition en pharmacologie. Les méthodes expérimentales utilisées dans la détermination des structures 3D sont techniquement ardues et couteuses. De plus, de nombreuses protéines ne cristallisent pas facilement (diffraction de rayons-X) ou ne sont pas obtenues en quantités assez importantes (structure par RMN). En date du 6 avril 2004, la base de données de structures des protéines PDB ne contenaient que 25004 structures. Étant donné le nombre de gènes connus, la totalité des structures ne représente qu'un infime partie des connaissances potentielles.

Nous avons donc soumis la séquence de la protéine COR413-PM1 à deux outils de prédiction, soient Swiss-Model ( http://www.expasy.org/swissmod/SWISS-MODEL.html ) et 3D-JIGSAW ( http://www.bmm.icnet.uk/servers/3djigsaw/ ). Ces outils basent leurs prédictions sur des similarités des séquences soumises avec des protéines de structures connues. Malheureusement, les deux outils n'ont pu prédire de structure à cause d'une absence d'identité avec d'autres protéines.

Nous avons donc utilisé les résultats d'une autre publication du groupe de Fathey Sarhan (Daniluk et al., 2003) afin de procéder à des prédictions de structures 3D. Cette publication caractérise une protéine de vernalisation du blé, TaVRT-1. Les auteurs utilisent des outils semblables à ceux présentés dans le plus haut dans le travail afin d'arriver à leurs résultats. Ceux-ci prédisent que la protéine est homologues aux membres de la famille de facteurs de transcription MADS-box et que son expression est négativement corrélée à celle des protéines COR.

La prédiction de structures de protéines par analyse comparative génère des modèles 3D de protéines à partir de la séquence de leurs acides aminés. Le succès de la prédiction demande la connaissance d'au moins une protéine similaire de structure connue. Toutes les méthodes de prédiction par similarité suivent quatre étapes :

  • La sélection du patron
  • L'alignement entre le patron et la séquence soumise
  • La construction du modèle
  • Une évaluation du résultat

Ces étapes peuvent être répétées itérativement jusqu'à l'obtention d'un modèle satisfaisant.

Haut de page

Swiss-Model

Swiss-Model ( http://swissmodel.expasy.org ) est un serveur automatisé de prédiction de structures de protéines par analyse comparative. Il a été mis sur pied en 1993 et est le serveur de prédiction le plus utilisé sur le web. Les structures sont prédites en suivant les étapes décrites plus haut.

Afin de sélectionner un patron pertinent, le serveur travaille à partir d'une librairie de patrons de la base de données PDB. Une recherche est menée afin de déterminer si le patron couvre plus d'une région de la séquence soumise. Si c'est le cas, le processus de prédiction est séparé en unités indépendantes.

Jusqu'à cinq patrons sont superposés par un algorithme des moindres carrés itératif. L'alignement strutural après filtrage des patrons incompatibles. Un alignement local entre la séquence cible et les patrons est calculée, suivie par une heuristique qui améliore les alignements pour optimiser le modèle structural.

Un score est ensuite assignés aux patrons selon leur similarité avec la cible. Comme il est impossible de prédire la structure s'il y a des insertions et des délétions, ces régions sont reconstruites par programmation en espace contraint (constraint space programming, CSP). Le modèle d'abord reconstruit à partir des résidus conservés, puis complété par une étape de minimisation d'énergie.

Le serveur Swiss-Model évalue ensuite les résultats par un C-score, qui donne une estimation de la variabilité des patrons à une position donnée. Une description plus en profondeur du mode de fonctionnement est disponible en lisant Schwede et al. 2003.

Haut de page

3D-JIGSAW

3D-JIGSAW (http://www.bmm.icnet.uk/servers/3djigsaw/ ) est également un serveur automatisé de prédiction de structures de protéines par analyse comparative. Son mode de fonctionnement est similaire à Swiss-Model (figure 9). Il comporte un mode automatique et un mode interactif, afin d'utiliser les informations structurales sommaires que l'usager peut posséder sur la séquence soumise.

Figure 9. Organigramme du fonctionnement de 3D-JIGSAW. (Tiré de http://speedy.embl-heidelberg.de/gtsp/flowchart2.html ).

A

B

Figure 10. Structure de la protéine TaVRT-1 telle que prédite par A) Swiss-Model et B) 3D-JIGSAW.

Les prédictions mettent en évidences deux hélices alpha (Hélices 1 et 2, figure 10), ainsi qu'un feuillet bêta. Le domaine MADS-box se retrouve au début de l'hélice 1. Par contre, il semble que le feuillet bêta soit absent de la prédiction de 3D-JIGSAW. L'allure générale de la protéine est toutefois conservée dans cette région.

Haut de page

Alignement des structures 3D prédites

Afin d'évaluer les similarités et les différences des structures prédites par Swiss-Model et 3D-JIGSAW, nous avons utilisé l'outil en ligne CE ( http://cl.sdsc.edu/ce.html ). Il utilise un algorithme d'extension combinatoire d'un chemin d'alignement défini par des fragments de paires alignées (AFP). Les AFPs constituent des paires de fragments, un pour chaque protéines comparées, qui confèrent une similarité structurale. Les AFPs se basent sur la géométie locale plutôt que sur des structures globales. Une combinaison des AFPs, représentant des chemins possibles d'alignements, sont sélectivement étendus par extension combinatoire du chemin maximal ou rejetés pour finalement menés à un unique chemin optimal. Une description plus détaillée est disponible dans l'article de Shindyalov et Bourne, 1998. Les résultats de cet alignement sont présentés à la figure 11.

A)

B)

Figure 11. Alignements structuraux entre les prédictions de Swiss-Model et 3D-JIGSAW calculés avec l'outil en ligne CE. A) Alignement brut. B) Alignement en colorant la structure prédite par 3D-JIGSAW en jaune afin de faire ressortir les différences.

Il est intéressant de remarquer la similarité globale des prédictions des deux outils. En effet, ils prédisent tous deux une longue structure en hélice alpha et une plus courte à l'autre extémité de la protéine (figure 11, structures en rouge). Par contre, les feuillets bêta prédits par Swiss-Model ne sont pas retrouvés par 3D-JIGSAW (figure 11, structures en bleu). Cependant, la structure prédite par 3D-JIGSAW dans la région des feuillet bêta correspond à celle de Swiss-Model. Il existe également des différences dans la plus courte hélice alpha, celle prédite par Swiss-Model ayant deux tours, tandis que celle de 3D-JIGSAW n'en contient qu'un seul. N'étant pas des spécialistes de la structure tridimensionnelle des protéines nous ne nous aventurerons pas dans la signification biologique de ces prédictions.

Haut de page