Sites de phosphorylation et d'ancrage de phosphatidyl inositol Discussion |
Discussion Il est intéressant de constater qu'à partir de données de séquençage, il est possible par l'utilisation d'outils bioinformatiques d'identifier et de caractériser une nouvelle famille de protéines transmembranaires chez les plantes. Des recherches dans les bases de données existantes ont permis de trouver que la famille COR413 est composée de deux sous-groupes distincts, COR413-PM et COR413-TM. Les différences entre ces deux groupes se retrouvent au niveaux de la localisation cellulaire, la topologie structurale et des sites de phosphorylation et d'ancrage de phosphatidylinositols glycosylés potentiels. Il faut également noter que de nouveaux outils émergent continuellement afin d'affiner les prédictions. Par exemple, le programme TMHMM a été utilisé pour la prédiction des domaines transmembranaires, pour sa capacité d'entrainement à reconnaître précisément de tels domaines. En effet, il semble présentement impossible d'établir de règles consensus claires de prédictions des régions transmembranaires des protéines (Goder et Spiess, 2001). Ainsi, des algorithmes d'apprentissage machine, tels que les modèles de Markov cachés, prennent ici tout leur sens, en détectant de subtiles différences des acides aminés ne pouvant être détectées par des moyens plus conventionnels. Cependant, de tels outils doivent être préparés en utilisant un groupe d'entrainement représentatif. Lorsqu'utilisés sur une nouvelle famille de protéines, leur utilisation peut être problématique par la restriction de facto du groupe d'entrainement. Leurs prédictions devraient s'améliorer avec la découverte de nouvelles protéines. Notons également l'utilisation d'un outil de prédiction à base de réseaux de neurones, NetPhos. Il est utilisé pour la prédiction de sites de phosphorylation potentiels des résidus sérine, thréonine et tyrosine d'une séquence de protéine. La version 2.0, utilisée pour le présent travail, a été entrainée sur un grand nombre de sites de phosphorylation connus et vérifiés expérimentalement. Il est particulièrement utile puisque les déterminants de sites de phosphorylation ne sont probablement composés que de dix résidus. Ainsi, les outils traditionnels d'alignement tels que BLAST et FASTA, ne peuvent facilement les détecter sans trouver un grand nombre de sites faux positifs. Un réseau de neurones, quant à lui, peut classifier des séquences biologiques complexes et non-linéaires où les corrélations entre les positions des résidus sont importantes. Le réseau peut généraliser et reconnaître des profils semblables mais non identiques. |