Rapport
BIF7002
Analyse de
recombinaisons et de transferts horizontaux de gènes chez SARS-CoV-2
Stéphane Samson et Vladimir Makarenkov
Université du Québec à Montréal
Présenté par:
Omar Al Rifai
21-2-2023
Table of Contents
4- La fonctionnalités de recherche de site
Le transfert horizontal des gènes (HGT) est le
transfert de matériel génétique entre deux espèces différentes. C'est un
processus important pour acquérir du nouveau matériel génétique et pour évoluer
vers de nouveaux aspects génétiques. Ce processus se produit à travers trois
mécanismes différents: la transformation, la conjugaison et la transduction [1].
La transformation est le processus par lequel les bactéries (cellules
réceptrices) prennent de l'ADN libre neuf, la conjugaison est le
processus par lequel les bactéries transfèrent leur matériel génétique à
d'autres cellules, et la transduction est le processus par lequel un virus de
bactériophage transfère du matériel génétique entre des cellules. Le processus
de HGT a été décrit pour la première fois en 1951 dans le bacille de Klebs-Löffler, où le gène toxique responsable de sa pathogénicité
peut être transféré des bactéries pathogènes à des bactéries non pathogènes [2].
Il peut impliquer le transfert de matériel génétique entre différentes espèces,
telles que les bactéries, les virus et les cellules eucaryotes. Par exemple, l’HGT
est un processus par lequel certaines bactéries peuvent acquérir une résistance
aux antibiotiques et développer de nouvelles souches, comme la souche CC398 de
Staphylococcus aureus. Des études récentes ont montré l'existence de transfert
de gènes entre des cellules virales et des cellules eucaryotes, tandis que le
transfert de gènes d'eucaryotes à des virus se produit deux fois plus
fréquemment. L’HGT implique des virus à ADN double brin, en particulier les
NCLDV (virus à ADN nucléocytoplasmique de grande taille), ainsi que les herpèsvirus, les rétrovirus et les bactériophages [3].
Le syndrome respiratoire aigu sévère coronavirus 2
(SARS-CoV-2) est une maladie infectieuse respiratoire apparue à la fin de
l'année 2019. Sa transmissibilité très élevée a entraîné sa propagation
pandémique dans le monde entier. La pandémie a été appelée pandémie de
COVID-19. Ce dernier n'était pas le seul coronavirus du XXIe siècle, en 2002 et
2012, SARS-CoV et MERS-CoV sont apparus chez
l'humaine respectivement. SARS-CoV-2 appartient à la famille des
bêta-coronavirus, il partage 96% de similarité avec le coronavirus de la
chauve-souris RatG23 et 90% de similarité avec les coronavirus de pangolin [4].
SARS-CoV-2 partage six régions avec les bêta-coronavirus, l'ORF1a, l'ORF1b, la
protéine Spike (S), l'enveloppe (E), la membrane (M) et le nucléocapside (N),
ainsi que 7 ORF codant pour des protéines accessoires (Figure 1) [5, 6].
Figure 1- Les composants qui constituent la structure du virus
comprennent la protéine de spike, l'enveloppe, la membrane, ainsi que des
composants internes tels que l'ARN monocaténaire viral et les protéines de
nucléocapside.
Une caractéristique spécifique du SARS-CoV-2 est la
présence d'un motif de base (PRRA), qui est un site de clivage de la furine de la proprotéine
convertase. Ce motif relie les sous-unités spike S1 et S2 [5].
Un motif très similaire ne contenant pas (PAA), les résidus d'acides aminés de
base (RR) ont été trouvé dans le coronavirus RmYN02 dérivé de la chauve-souris [7].
Ces données suggèrent que le SARS-CoV-2 est très probablement apparu
naturellement. Trois hypothèses différentes ont été proposées pour expliquer
l'évolution du SARS-Cov2. La première est l'évolution parallèle où les
différences génétiques entre les souches de virus pourraient être acquises par
des mutations naturelles survenues lors des passages et de l'évolution du
virus. La deuxième hypothèse suggère la divergence de GD pangolin Cov et de SARS Cov2 à partir d'une ascendance similaire. La
troisième hypothèse propose une possibilité de transfert génétique et de
recombinaison intergénique dans le génome du virus SARS Cov
chez l'espèce hôte. Cette recombinaison nécessite une espèce donneuse et une
autre accepteuse. Elle conduit à un nouveau virus avec une structure génique en
mosaïque où chaque fragment de gène est dérivé d'une évolution différente du
virus. Pour répondre à la question de savoir si le transfert horizontal de
gènes contribue au mécanisme par lequel le SARS-CoV-2 se développe et diverge,
Makarenkov et al. ont développé l'algorithme SimPlot pour enquêter sur les
origines du virus en détectant et en évaluant les événements de transfert
horizontal de gènes et de recombinaison en utilisant la séquence de différentes
souches de virus SARS-CoV.
SimPlot++ est une
application open source gratuite qui est implémentée en Python et qui offre une
gamme d'outils pour l'analyse de séquences. Elle est utilisée pour visualiser
et analyser les relations entre les séquences de nucléotides ou d'acides
aminés. Elle peut afficher des arbres phylogénétiques, des alignements de
séquences et des diagrammes de similarité, qui montrent le degré de similarité
entre des paires de séquences à chaque position sur leur longueur. De plus, Elle peut identifier les événements de recombinaison intergéniques et intragéniques à l'aide des tests Phi, χ2, NSS et
Proportion. SimPlot++ prend également en charge le multitraitement et fournit
des diagnostics en calculant des distances. Les autres fonctionnalités incluent
la création et l'enregistrement de séquences consensus, l'exécution d'une
analyse BootScan, l'identification de sites
informatifs et l'analyse de réseaux de similarité de séquences.
La page de création de groupe dans Simplot ++ accepte plusieurs fichiers de séquence dans différents formats tels que Fasta, Nexus, Pir, Phylip, Stochholm ou Clustal. Ces séquences sont organisées manuellement dans le groupe, SimPlot ++ générera une séquence consensus pour chaque groupe. Cette séquence consensus dépend du seuil déterminé par l'utilisateur. L'analyse du consensus est essentielle pour l'analyse Simplot supplémentaire telle que le bootscan et l'analyse de similarité de réseau.
Figure 2- Démonstration de la création de groupe
Grâce au navigateur de fichiers, les utilisateurs peuvent télécharger leur séquence d'ADN ou d'acides aminés (AA) dans le format accepté (Figure 2). L'ID de séquence apparaîtra dans la section de séquence non groupée où ils peuvent être ajoutés à un groupe spécifique. Lorsque les groupes sont prêts, il est recommandé de les enregistrer au format Nexus pour éviter de recréer le groupe à nouveau. La création de groupe est requise avant de commencer l'analyse à l'aide des fonctionnalités de SimPlot ++.
L'analyse Simplot génère une matrice de distance de l'alignement de séquences multiples (Figure 3). Il est essentiel de déterminer la fenêtre de distance d'analyse et la taille du pas. Cette matrice est visualisée à travers un graphique de similarité qui aidera à détecter d'éventuels événements de recombinaison. Pour utiliser les outils d'analyse Simplot, il est important de choisir un paramètre qui correspond aux objectifs de l'analyse. Cela comprend la détermination de la longueur de la fenêtre, la taille du pas, la bande GAP, le modèle de distance et précise l'utilisation ou non du multitraitement qui permet l'exécution simultanée d'analyses multiples sur un grand ensemble de données.
Figure 3- Démonstration de l’analyse SimPlot
SimPlot ++ a une fonction de contrôle qualité supplémentaire pour visualiser les données liées aux écarts. De plus, Simplot ++ a la fonction d'analyse du réseau de similarité de séquence, une représentation interactive d'une analyse SimPlot, où chaque groupe est représenté comme un nœud dans un réseau, connecté par un bord basé sur la similarité globale ou locale (Figure 4). En ajustant le seuil minimum de similarité, les relations entre les groupes peuvent être analysées. Les tableaux de données montrent les régions de similarité les plus importantes et les résultats du test de proportion. Le graphique peut être enregistré sous forme de fichier HTML et la visualisation peut être enregistrée sous forme de fichiers .png ou .svg à partir de la boîte à outils du fichier HTML.
Figure 4- Démonstration de l'analyse du réseau de similarité de séquence
La fonctionnalité Bootscan est un pipeline d'analyse de fenêtres glissantes composé de quatre étapes principales (Figure 5). Tout d'abord, les sous-séquences sont isolées des groupes consensus et amorcées N fois. Deuxièmement, une matrice de distance est générée pour chacun des N sous-MSA bootstrapés. Troisièmement, pour chaque matrice de distance, un arbre phylogénétique est généré soit en utilisant Neighbor-Joining ou UPGMA. Les signaux phylogénétiques conflictuels sont quantifiés en pourcentage de chaque séquence au voisin le plus proche de la séquence de référence dans l'arbre. Bootscan a un paramètre similaire à l'analyse Simplot, tel que le paramètre des fonctionnalités d'analyse et la visualisation des tracés, en plus du modèle d'arbre et du format de sortie multiple.
Figure 5- Démonstration de l'analyse du Bootscan
Les fonctionnalités de recherche du site localisent les sites de recombinaison en fournissant deux séquences supplémentaires provenant de chacun des sites parentaux et une séquence provenant d'un groupe différent (Figure 6). Enfin, la fonction de recombinaison permet de détecter les événements de recombinaison et de déterminer leur signifiance sur la base des tests Phi, Phi-profile, Max χ2 et NSS disponibles dans le package PhiPack développé par Trevor Bruen et al. (Figure 7) [8].
Figure 6- Démonstration de recherche de site
Figure 7- Démonstration de recombination
L'analyse SimPlot de 25 génomes CoV a révélé que les génomes Wuhan SARS-CoV-2 et RaTG13 partagent 96,14 % de l'identité du génome entier, tandis que les génomes Wuhan SARS-CoV-2 et GD Pangolin sont identiques à 90,34 % (Figure 8) [9]. Cela indique que les chauves-souris sont probablement le réservoir d'origine du SARS-CoV-2, étant donné la ressemblance étroite entre le SARS-CoV-2 et le RaTG13, comme ce fut le cas lors des précédentes épidémies de CoV.
Figure 8- Similitude du génome et analyse phylogénétique du SRAS-CoV-2 et des virus apparentés : (a) une analyse de l'évolution des modèles de similarité de séquence par SimPlot entre : le génome de référence Wuhan SARS-CoV-2 2020 avec le génome RatTG13 CoV (vert), GD Pangolin CoV (rouge), GX Pangolin CoV (orange), Bat CoVZ (violet) et Bat SL-VoC (gris). (b) Analyse phylogénie du génome de 25 organismes SARS-CoV et au SARS-CoV-2. Les groupes d'espèces sont indiqués à droite. Les scores bootstrap sont indiqués sur les nombres sur le branches internes, ceux qui sont inférieur à 60% ont été effondrées.
Une analyse gène par gène a été effectuée en comparant les séquences génétiques du Wuhan SARS-CoV-2 avec les séquences des groupes RaTG13, GD Pangolin CoV et Bat CoVZ. L'analyse a révélé que certaines régions du domaine RB, ORF3a, M ORF7a et N du SARS-CoV-2 étaient plus similaires au GD Pangolin CoV qu'au RaTG13, suggérant des événements de recombinaison entre les deux (Figure 9). De plus, dans certaines régions géniques continues d'ORF1ab, ORF3a, M et N, le SARS-CoV-2 s'est trouvé plus similaire aux virus bat CoV ZC45 et ZXC21 qu'auxGD Pangolin CoV et parfois même au RaTG13 [9].
Figure 9- Analyse de similarité SimPlot pour comparer les séquences de gènes ORF1ab, S, ORF3a, M, ORF7a et N du génome de référence Wuhan SARS-CoV-2 2020 avec celles du génome RatTG13 (vert), GD Pangolin CoV (rouge) et Bat CoVZ (violet).
Makarenkov et al, ont effectué une analyse détaillée pour détecter les similitudes du gène Wuhan SARS-Cov-2 avec les séquences du groupe RaTG13, du groupe GD Pangolin CoV et du groupe Bat CoVZ. Cette analyse a révélé queleSRAS-CoV-2 présente des similitudes plus élevées avec le virus GD Pangolin que les régions RaTg13 dans le domaine RB, ORF3a, M, ORF7a et N suggérant qu'un événement de recombinaison multiple s'est produit entre le virus GD Pangolin et le virus RatG13 CoC. Pour valider davantage ces données, Makarenkov et al. ont effectué un test d'analyse de recombinaison gène par gène Φ-test pour évaluer l'importance de la recombinaison entre les espèces orthologues de SARS-CoV-2, RaTG13, GD Pangolin 1 Cov, GD Pangolin P2S CoV, bat CoV Virus ZC45 et bat CoV ZXC21 (Tableau 1). Ce test révèle une recombinaison significative au niveau des ORF1ab, S, ORF3a, ORF7a, ORF8, N et de l'ensemble du génome [9].
Region |
Φ-test result |
Recombination detected (yes/no) |
Window size |
Gene ORF1ab |
2.23 × 10–3 |
Yes |
150 |
RB domain |
Too short |
– |
|
Gene S |
8.60 × 10–3 |
Yes |
200 |
Gene ORF3a |
1.13 × 10–5 |
Yes |
100 |
Gene E |
0.56 |
No |
200 |
Gene M |
0.226 |
No |
100 |
Gene ORF6 |
Too short |
– |
|
Gene ORF7a |
0.00155 |
Yes |
200 |
Gene ORF7b |
Too short |
– |
|
Gene ORF8 |
0.0453 |
Yes |
200 |
Gene N |
0.024 |
Yes |
50 |
Gene ORF10 |
Too short |
– |
|
Whole genomes |
0.0156 |
Yes |
200 |
Tableau 1- Φ-test pour les évènements de recombinaison
Le génome de SARS-CoV-2 est composé de 2 gènes codant pour 2 protéines non structurelles ORF1a et ORF1 b, 4 gènes codant pour 4 protéines structurales (S, E, M, N) et 5 gènes codant pour 5 protéines accessoires (ORF3, ORF6, ORF7a, ORF7b, ORF8, ORF10). ORF1ab est traduit de ORF1a (11826–13425 nt) et ORF1b (7983–8157 nt) [10, 11] . Le gène S code pour la protéine de Spike qui a une structure en forme de spike. La protéine de pointe est une glycoprotéine de type 1 essentielle pour la liaison au récepteur, la fusion et l'entrée du virus. Le gène E est commun à tous les CoV, le gène M est important pour l'assemblage de nouvelles particules virales. La protéine de nucléocapside est codée par le gène N et c'est un composant structurel essentiel du SRAS-CoV. Il est responsable de l'encapsulation du génome viral. ORF3a, ORF6, ORF7a et 7b, ORF8 et ORF10 sont des protéines accessoires qui ne se trouvent pas dans tous les SARS-CoV. Ils jouent un rôle dans la régulation des gènes, dans l'apoptose et dans l'interaction avec MHC1. Le tableau suivant résume les événements de recombinaison identifiés par Makarenkov et al à travers les différents gènes SARS-Cov2 parmi les différentes espèces (Tableau 2) [9].
Gene |
Possibility
of HGT |
Region |
Species |
Bootscan score |
ORF1ab |
Partial |
[1-11630] |
Bat
CoVZ and the cluster including the RaTG13 and SARS-CoV-2 viruses |
61.50% |
|
Complete |
- |
Bat RF1
CoV to bat BtCoV 279 2005 |
84.60% |
|
Partial |
[16326-17626] |
Cluster
of the bat BTKY72 and BM48 31 BGR 2008 coronaviruses and the cluster
involving SARS-CoV-2, RaTG13 and GD Pangolin CoVs |
61.50% |
|
Deep
phylogeny |
[1249-1421] |
CoV
organisms from the bottom part of the tree to the cluster of GX Pangolins
CoVs |
97.90% |
S |
Partial |
[1-881] |
Bat
CoVZ group and the cluster of GD Pangolin CoVs |
64.40% |
|
Partial |
[1215-1425] |
GD
Pangolin CoVs to SARS-CoV-2 |
59.70% |
|
Partial |
[1311-1361]
[1511-1561] |
RaTG13
to GX Pangolin CoVs |
61.50% |
|
Partial |
- |
Bat
CoVZ group and the cluster including BtCoV 273 2005, Rf1, HKU3-12, HKU3-6 and
BtCoV 279 2005 |
- |
ORF3a |
Full |
- |
Cluster
of SARS-CoV-2, RaTG13 and GD Pangolin CoVs, and the group of Bat CoVZ viruses |
80.80% |
|
Partial |
[251-371] |
Lower
part of the tree (i.e. SARS-like 2003–2013 viruses), excluding bat viruses
from Kenya and Bulgaria (i.e. BtKY72 and BM48 31 BGR 2008), and the GX
Pangolin CoVs |
61.50% |
|
Deep
phylogeny |
- |
CoVs
from the previous SARS outbreak |
- |
E |
- |
[71-171] |
CoVs
from the previous SARS outbreak |
- |
M |
Complete |
Rs367 |
Rf1,
BtCoV 273 2005 |
92.30% |
|
Partial |
[251-461] |
SARS-CoV-2,
RaTG13 CoVs, Bat CoVZ |
53.90% |
|
Partial |
[569-669] |
GD
Pangolin CoVs |
50% |
ORF6 |
Complete |
- |
Bat
CoVZ and the cluster ofSARS-CoV-2, RaTG13 CoVs |
69.20% |
|
Partial |
[111-185] |
HKU3-12
CoV, SARS-CoV cluster |
67.70% |
ORF7a/b |
- |
[21-131] |
Bat
CoVs related to the previous SARS outbreak. Lower part of the tree,excluding Kenyan and Bulgarian bats and GX Pangolin
CoVs |
53.80% |
ORF8 |
Complete |
Bat
CoVZ |
SARS-CoV-2,
RaTG13, GX Pangolin CoVs and the Bat Viruses of the SARS-CoV group |
84.60% |
N |
Partial |
[534-727] |
GD
Pangolin CoVs, SARS-CoV-2 |
58.60% |
|
Partial |
[756-864] |
RaTG13,
GD Pangolin CoVs |
53.80% |
|
Partial |
[551-721] |
BtCoV
273 2005, Rf1, HKU CoVs |
61.00% |
ORF10 |
Complete |
- |
Bat
CoVZ and SARS-CoV-2, RaTG13, GD Pangolin CoVs |
79.50% |
RB
domain |
- |
[131–186] |
GD
Pangolin CoVs to SARS-CoV-2 |
57.70% |
|
- |
[41–141] |
BtCoV
273 2005, Rf1, HKU3-12, HKU3-6, BtCoV |
65.40% |
|
Complete |
Unknown |
Murine
CoVs and HKU1-related viruses |
88.50% |
|
Partial |
Unknown |
Murine
CoVs and HKU1-related viruses |
59.80% |
|
Partial |
Unknown |
Equine
CoV and Human OC43 and Enteric CoVs |
63.50% |
|
Partial |
Unknown |
Rabbit
HKU14 CoV and Enteric human CoV and three bovine CoVs |
65.40% |
|
Partial |
Unknown |
Human
OC43 CoV and Bovine OH440 CoV |
57.70% |
|
Partial |
Unknown |
Human
Enteric CoV and Bovine AH187 CoV |
84.60% |
Tableau 2- les événements de recombinaison identifié
L'article présente une étude sur le rôle de la recombinaison dans la diversité des virus, y compris le SRAS-CoV-2 et d'autres bêtacoronavirus. La recombinaison est un processus qui permet aux virus de s'adapter à de nouveaux hôtes et environnements en surmontant la pression sélective. Makarenkov et al. ont effectué une analyse approfondie du transfert horizontal de gènes et de la recombinaison gène par gène des virus liés au SRAS-CoV-2. Cette analyse a révélé de multiples événements de transfert horizontal de gènes et de recombinaison parmi les organismes coronavirus.
Le plus frappant parmi ces événements de recombinaison était les transferts de gènes statistiquement significatifs du Guangdong Pangolin CoV au SARS-CoV-2 trouvés dans le gène S et le gène N, ce qui suggère que le SARS-CoV-2 est une chimère résultant de la recombinaison du RatTG13 et du Guangdong Pangolin Génomes du CoV, dans la région du domaine RB et la position du gène N [534-727]. Les événements de recombinaisons confirmées dans les gènes S et N ainsi que l'analyse de recombinaison SimPlot des gènes S, ORF3a, M, ORF7a et N suggèrent que le pangolin du Guangdong est un hôte intermédiaire probable du SRAS-CoV-2, sur sa voie de transmission à partir des chauves-souris aux humains.
Makarenkov et al. ont rapporté une recombinaison de gènes multiples entre le cluster comprenant les virus de chauve-souris CoVZC45 et CoVZXC21, et le cluster comprenant les souches SARS-CoV-2 et RatTG13. Certaines de ces recombinaisons étaient statistiquement significatives dans 6 gènes sur 11, des événements de transfert de gène-recombinaison entre ces grappes de CoV ont été trouvés dans 6 des 11 gènes de coronavirus, ORF1ab, ORF3a, M, ORF6, ORF8 et ORF10. Ces données confirment que RatTG13 et GD Pangolin CoVs ne contribuent pas seuls à l'évolution du SARS-CoV-2, mais aussi les coronavirus de chauve-souris CoVZC45 et CoVZXC21 ou leur ancêtre commun. Makarenkov et al. ont mené une analyse approfondie de la recombinaison intergénique sur la phylogénie des coronavirus de 46 espèces. Cette analyse a révélé des événements de transfert de gènes statistiquement significatifs affectant la partie inférieure de la phylogénie du coronavirus. Ce transfert comprend un transfert de gène complet dans le gène ORF3a affectant le cluster de MERS-CoV S et deux coronavirus de chauve-souris (HKU-4 et HKU-5. De plus, Makarenkov et al. n'ont trouvé aucun transfert de gène supplémentaire lors de l'ajout de SARS- Cov-2 génome à leur ensemble de données Cela pourrait s'expliquer par l'augmentation du taux de similitude entre le SARS-CoV-2 disponible. Dans l'ensemble, cette étude souligne l'importance de la recombinaison dans la diversification du génome viral et sa contribution à leur évolution, elle met également en évidence l’hôte intermédiaire très probablement impliqué dans la transmission du SRAS-CoV-2 à l'homme.
Les alphavirus sont un ensemble de 26 virus transmis par les
moustiques et responsables de diverses maladies chez l'homme. Ceux trouvés dans
le Nouveau Monde provoquent généralement une encéphalite, tandis que ceux de
l'Ancien Monde provoquent généralement de la fièvre, des éruptions cutanées et
des douleurs articulaires. Le génome de ces virus est constitué d'une molécule
d'ARN simple brin non segmentée d'une longueur d'environ 11 700 nucléotides et
de polarité positive. Les génomes de divers alphavirus
ont été séquencés, et ces séquences démontrent qu'ils ont évolué à partir d'un
ancêtre commun par une évolution divergente.
Récemment, la
séquence d'ARN du virus de l'encéphalite équine occidentale (WEEV) du New World
Alphavirus a été déterminée, révélant qu'il s'agit
d'un virus recombinant. La comparaison des séquences de nucléotides et d'acides
aminés de WEEV avec celles d'autres alphavirus
indique qu'il est issu d'un événement de recombinaison entre un virus de type
EEEV et un virus de type Sindbis [12]. La protéine de capside et les 80 nucléotides 3'-terminaux non traduits
de WEEV sont similaires à ceux du virus de l'encéphalite équine orientale
(EEEV) du New World Alphavirus, tandis que les
glycoprotéines E2 et E1 de WEEV sont plus étroitement liées à celles d'un virus
de l'Ancien Monde, virus Sindbis. Le WEEV a donc
acquis les propriétés encéphalogènes du VEEE et la
spécificité antigénique du virus Sindbis (Figure
10).
Figure 10 – Recombination event
concluded from Hahn et al. [12] .
À l'aide de SimPlot++, comparaison de l'ADN génomique du virus de l'encéphalite équine occidentale (WEEV McMillan : GQ287640.1 et BFS1703 : KJ554968.1), avec l'ARN génomique du virus de l'encéphalite équine orientale (EEEV : KP282670.1) et du virus Sindbis (virus Sindbis : NC_001547.1) n'a pas conduit à une conclusion claire que la souche WEEV a une séquence N-terminale similaire à EEEV et une séquence C-terminale similaire à SIN (Figures 10 et 11). Simplot montre une valeur de similarité négative tout au long de la comparaison des gènes, mais nous pouvons encore voir des GAP aux positions approximatives 5100, 8100 et 9100. Une analyse plus approfondie est nécessaire pour valider ces données, pour des raisons de longueur du rapport, je n'ai pas effectué toute analyse complémentaire. J'ai essayé d'inclure des séquences d'ARN supplémentaires de différentes souches de la même espèce, mais cela n'a pas amélioré le résultat, les séquences (WEEV McMillan : GQ287640.1 et BFS1703 : KJ554968.1), avec l'ARN génomique du virus de l'encéphalite équine orientale (EEEV : MK028842.1 ; AY722102.1 ; KT153581.1 ; KR260717.1 ; KP282670.1) et Sindbis (virus Sinbis : NC_001547.1 ; AF429428.1 ; J02363.1)
Figure 11 – Simplot analysis of WEEV McMillan : GQ287640.1 and WEEV BFS1703: KJ554968.1 ,
with the genomic RNA of the EEEV: KP282670.1 and Sindbis virus:
NC_001547.1
1- Amelioration possible au SimPlot++
L'exécution de cette
analyse met en évidence certaines fonctionnalités à améliorer dans la version
SimPlot++. Tout d'abord, nous ne pouvons pas télécharger la séquence fasta séparément, car elle disparaît lors de la création
des groupes. Pour résoudre ce problème, la séquence différente doit être
incluse dans un fichier fasta. Cela nécessite un
travail supplémentaire pour organiser la séquence dans un seul fichier au lieu
de les télécharger un par un.
1. Burmeister,
A.R., Horizontal Gene Transfer. Evol
Med Public Health, 2015. 2015(1): p.
193-4.
2. Filip, E.
and L. Skuza, Horizontal Gene Transfer
Involving Chloroplasts. Int J Mol Sci, 2021. 22(9).
3. Irwin,
N.A.T., et al., Systematic evaluation of
horizontal gene transfer between eukaryotes and viruses. Nat Microbiol,
2022. 7(2): p. 327-336.
4. Zhou, P.,
et al., A pneumonia outbreak associated
with a new coronavirus of probable bat origin. Nature, 2020. 579(7798): p. 270-273.
5. Coutard,
B., et al., The spike glycoprotein of the
new coronavirus 2019-nCoV contains a furin-like cleavage site absent in CoV of
the same clade. Antiviral Res, 2020. 176:
p. 104742.
6. Jamison,
D.A., Jr., et al., A comprehensive
SARS-CoV-2 and COVID-19 review, Part 1: Intracellular overdrive for SARS-CoV-2
infection. Eur J Hum Genet, 2022. 30(8):
p. 889-898.
7. Zhou, H.,
et al., A Novel Bat Coronavirus Closely
Related to SARS-CoV-2 Contains Natural Insertions at the S1/S2 Cleavage Site of
the Spike Protein. Curr Biol, 2020. 30(11):
p. 2196-2203 e3.
8. Bruen,
T.C., H. Philippe, and D. Bryant, A
simple and robust statistical test for detecting the presence of recombination.
Genetics, 2006. 172(4): p. 2665-81.
9. Makarenkov,
V., et al., Horizontal gene transfer and
recombination analysis of SARS-CoV-2 genes helps discover its close relatives
and shed light on its origin. BMC Ecol Evol, 2021. 21(1): p. 5.
10. Graham,
R.L., et al., SARS coronavirus replicase
proteins in pathogenesis. Virus Res, 2008. 133(1): p. 88-100.
11. Woo, P.C.Y.,
et al., Coronavirus genomics and
bioinformatics analysis. Viruses, 2010. 2(8): p. 1804-1820.
12. Hahn, C.S., et al., Western
equine encephalitis virus is a recombinant virus. Proc Natl Acad Sci U S A,
1988. 85(16): p. 5997-6001.