Rapport BIF7002

Analyse de recombinaisons et de transferts horizontaux de gènes chez SARS-CoV-2

 

Stéphane Samson et Vladimir Makarenkov

Université du Québec à Montréal

 

Présenté par:

Omar Al Rifai

 

21-2-2023

 

Table of Contents

 

I-  Introduction. 3

II- Méthode. 4

1-     La création de groupe. 4

2-     L'analyse Simplot 5

3-     La fonctionnalité Bootscan. 7

4-     La fonctionnalités de recherche de site. 7

III- Results: 9

IV- Discussion. 13

V-  Data analysis. 13

VI- References. 15

 

I-            Introduction

Le transfert horizontal des gènes (HGT) est le transfert de matériel génétique entre deux espèces différentes. C'est un processus important pour acquérir du nouveau matériel génétique et pour évoluer vers de nouveaux aspects génétiques. Ce processus se produit à travers trois mécanismes différents: la transformation, la conjugaison et la transduction [1]. La transformation est le processus par lequel les bactéries (cellules réceptrices) prennent de l'ADN libre neuf, la conjugaison est le processus par lequel les bactéries transfèrent leur matériel génétique à d'autres cellules, et la transduction est le processus par lequel un virus de bactériophage transfère du matériel génétique entre des cellules. Le processus de HGT a été décrit pour la première fois en 1951 dans le bacille de Klebs-Löffler, où le gène toxique responsable de sa pathogénicité peut être transféré des bactéries pathogènes à des bactéries non pathogènes [2]. Il peut impliquer le transfert de matériel génétique entre différentes espèces, telles que les bactéries, les virus et les cellules eucaryotes. Par exemple, l’HGT est un processus par lequel certaines bactéries peuvent acquérir une résistance aux antibiotiques et développer de nouvelles souches, comme la souche CC398 de Staphylococcus aureus. Des études récentes ont montré l'existence de transfert de gènes entre des cellules virales et des cellules eucaryotes, tandis que le transfert de gènes d'eucaryotes à des virus se produit deux fois plus fréquemment. L’HGT implique des virus à ADN double brin, en particulier les NCLDV (virus à ADN nucléocytoplasmique de grande taille), ainsi que les herpèsvirus, les rétrovirus et les bactériophages [3].

Le syndrome respiratoire aigu sévère coronavirus 2 (SARS-CoV-2) est une maladie infectieuse respiratoire apparue à la fin de l'année 2019. Sa transmissibilité très élevée a entraîné sa propagation pandémique dans le monde entier. La pandémie a été appelée pandémie de COVID-19. Ce dernier n'était pas le seul coronavirus du XXIe siècle, en 2002 et 2012, SARS-CoV et MERS-CoV sont apparus chez l'humaine respectivement. SARS-CoV-2 appartient à la famille des bêta-coronavirus, il partage 96% de similarité avec le coronavirus de la chauve-souris RatG23 et 90% de similarité avec les coronavirus de pangolin [4]. SARS-CoV-2 partage six régions avec les bêta-coronavirus, l'ORF1a, l'ORF1b, la protéine Spike (S), l'enveloppe (E), la membrane (M) et le nucléocapside (N), ainsi que 7 ORF codant pour des protéines accessoires (Figure 1) [5, 6].

figure 1

 

Figure 1- Les composants qui constituent la structure du virus comprennent la protéine de spike, l'enveloppe, la membrane, ainsi que des composants internes tels que l'ARN monocaténaire viral et les protéines de nucléocapside.

 

 

 

Une caractéristique spécifique du SARS-CoV-2 est la présence d'un motif de base (PRRA), qui est un site de clivage de la furine de la proprotéine convertase. Ce motif relie les sous-unités spike S1 et S2 [5]. Un motif très similaire ne contenant pas (PAA), les résidus d'acides aminés de base (RR) ont été trouvé dans le coronavirus RmYN02 dérivé de la chauve-souris [7]. Ces données suggèrent que le SARS-CoV-2 est très probablement apparu naturellement. Trois hypothèses différentes ont été proposées pour expliquer l'évolution du SARS-Cov2. La première est l'évolution parallèle où les différences génétiques entre les souches de virus pourraient être acquises par des mutations naturelles survenues lors des passages et de l'évolution du virus. La deuxième hypothèse suggère la divergence de GD pangolin Cov et de SARS Cov2 à partir d'une ascendance similaire. La troisième hypothèse propose une possibilité de transfert génétique et de recombinaison intergénique dans le génome du virus SARS Cov chez l'espèce hôte. Cette recombinaison nécessite une espèce donneuse et une autre accepteuse. Elle conduit à un nouveau virus avec une structure génique en mosaïque où chaque fragment de gène est dérivé d'une évolution différente du virus. Pour répondre à la question de savoir si le transfert horizontal de gènes contribue au mécanisme par lequel le SARS-CoV-2 se développe et diverge, Makarenkov et al. ont développé l'algorithme SimPlot pour enquêter sur les origines du virus en détectant et en évaluant les événements de transfert horizontal de gènes et de recombinaison en utilisant la séquence de différentes souches de virus SARS-CoV.

II-          Méthode

 

            SimPlot++ est une application open source gratuite qui est implémentée en Python et qui offre une gamme d'outils pour l'analyse de séquences. Elle est utilisée pour visualiser et analyser les relations entre les séquences de nucléotides ou d'acides aminés. Elle peut afficher des arbres phylogénétiques, des alignements de séquences et des diagrammes de similarité, qui montrent le degré de similarité entre des paires de séquences à chaque position sur leur longueur. De plus, Elle peut identifier les événements de recombinaison intergéniques et intragéniques à l'aide des tests Phi, χ2, NSS et Proportion. SimPlot++ prend également en charge le multitraitement et fournit des diagnostics en calculant des distances. Les autres fonctionnalités incluent la création et l'enregistrement de séquences consensus, l'exécution d'une analyse BootScan, l'identification de sites informatifs et l'analyse de réseaux de similarité de séquences.

 

1-    La création de groupe

 
               La page de création de groupe dans Simplot ++ accepte plusieurs fichiers de séquence dans différents formats tels que Fasta, Nexus, Pir, Phylip, Stochholm ou Clustal. Ces séquences sont organisées manuellement dans le groupe, SimPlot ++ générera une séquence consensus pour chaque groupe. Cette séquence consensus dépend du seuil déterminé par l'utilisateur. L'analyse du consensus est essentielle pour l'analyse Simplot supplémentaire telle que le bootscan et l'analyse de similarité de réseau.

 

 

group page gif

Figure 2- Démonstration de la création de groupe
 
 
               Grâce au navigateur de fichiers, les utilisateurs peuvent télécharger leur séquence d'ADN ou d'acides aminés (AA) dans le format accepté (Figure 2). L'ID de séquence apparaîtra dans la section de séquence non groupée où ils peuvent être ajoutés à un groupe spécifique. Lorsque les groupes sont prêts, il est recommandé de les enregistrer au format Nexus pour éviter de recréer le groupe à nouveau. La création de groupe est requise avant de commencer l'analyse à l'aide des fonctionnalités de SimPlot ++.
 

2-    L'analyse Simplot

 
               L'analyse Simplot génère une matrice de distance de l'alignement de séquences multiples (Figure 3). Il est essentiel de déterminer la fenêtre de distance d'analyse et la taille du pas. Cette matrice est visualisée à travers un graphique de similarité qui aidera à détecter d'éventuels événements de recombinaison. Pour utiliser les outils d'analyse Simplot, il est important de choisir un paramètre qui correspond aux objectifs de l'analyse. Cela comprend la détermination de la longueur de la fenêtre, la taille du pas, la bande GAP, le modèle de distance et précise l'utilisation ou non du multitraitement qui permet l'exécution simultanée d'analyses multiples sur un grand ensemble de données.

 

Simplot analysis

Figure 3- Démonstration de l’analyse SimPlot
 
               SimPlot ++ a une fonction de contrôle qualité supplémentaire pour visualiser les données liées aux écarts. De plus, Simplot ++ a la fonction d'analyse du réseau de similarité de séquence, une représentation interactive d'une analyse SimPlot, où chaque groupe est représenté comme un nœud dans un réseau, connecté par un bord basé sur la similarité globale ou locale (Figure 4). En ajustant le seuil minimum de similarité, les relations entre les groupes peuvent être analysées. Les tableaux de données montrent les régions de similarité les plus importantes et les résultats du test de proportion. Le graphique peut être enregistré sous forme de fichier HTML et la visualisation peut être enregistrée sous forme de fichiers .png ou .svg à partir de la boîte à outils du fichier HTML.

similarity network

Figure 4- Démonstration de l'analyse du réseau de similarité de séquence

3-    La fonctionnalité Bootscan

 
               La fonctionnalité Bootscan est un pipeline d'analyse de fenêtres glissantes composé de quatre étapes principales (Figure 5). Tout d'abord, les sous-séquences sont isolées des groupes consensus et amorcées N fois. Deuxièmement, une matrice de distance est générée pour chacun des N sous-MSA bootstrapés. Troisièmement, pour chaque matrice de distance, un arbre phylogénétique est généré soit en utilisant Neighbor-Joining ou UPGMA. Les signaux phylogénétiques conflictuels sont quantifiés en pourcentage de chaque séquence au voisin le plus proche de la séquence de référence dans l'arbre. Bootscan a un paramètre similaire à l'analyse Simplot, tel que le paramètre des fonctionnalités d'analyse et la visualisation des tracés, en plus du modèle d'arbre et du format de sortie multiple.

Bootscan gif

Figure 5- Démonstration de l'analyse du Bootscan
 

4-    Les fonctionnalités de recherche du site

 
               Les fonctionnalités de recherche du site localisent les sites de recombinaison en fournissant deux séquences supplémentaires provenant de chacun des sites parentaux et une séquence provenant d'un groupe différent (Figure 6). Enfin, la fonction de recombinaison permet de détecter les événements de recombinaison et de déterminer leur signifiance sur la base des tests Phi, Phi-profile, Max χ2 et NSS disponibles dans le package PhiPack développé par Trevor Bruen et al. (Figure 7) [8].

 

Findsite

Figure 6- Démonstration de recherche de site

recombination

Figure 7- Démonstration de recombination

 

 

 

 

 

III-    Results:

 

               L'analyse SimPlot de 25 génomes CoV a révélé que les génomes Wuhan SARS-CoV-2 et RaTG13 partagent 96,14 % de l'identité du génome entier, tandis que les génomes Wuhan SARS-CoV-2 et GD Pangolin sont identiques à 90,34 % (Figure 8) [9]. Cela indique que les chauves-souris sont probablement le réservoir d'origine du SARS-CoV-2, étant donné la ressemblance étroite entre le SARS-CoV-2 et le RaTG13, comme ce fut le cas lors des précédentes épidémies de CoV.

 

A picture containing chart

Description automatically generated

Figure 8- Similitude du génome et analyse phylogénétique du SRAS-CoV-2 et des virus apparentés : (a) une analyse de l'évolution des modèles de similarité de séquence par SimPlot entre : le génome de référence Wuhan SARS-CoV-2 2020 avec le génome RatTG13 CoV (vert), GD Pangolin CoV (rouge), GX Pangolin CoV (orange), Bat CoVZ (violet) et Bat SL-VoC (gris). (b) Analyse phylogénie du génome de 25 organismes SARS-CoV et au SARS-CoV-2. Les groupes d'espèces sont indiqués à droite. Les scores bootstrap sont indiqués sur les nombres sur le branches internes, ceux qui sont inférieur à 60% ont été effondrées.
 

 

 

 

               Une analyse gène par gène a été effectuée en comparant les séquences génétiques du Wuhan SARS-CoV-2 avec les séquences des groupes RaTG13, GD Pangolin CoV et Bat CoVZ. L'analyse a révélé que certaines régions du domaine RB, ORF3a, M ORF7a et N du SARS-CoV-2 étaient plus similaires au GD Pangolin CoV qu'au RaTG13, suggérant des événements de recombinaison entre les deux  (Figure 9). De plus, dans certaines régions géniques continues d'ORF1ab, ORF3a, M et N, le SARS-CoV-2 s'est trouvé plus similaire aux virus bat CoV ZC45 et ZXC21 qu'aux GD Pangolin CoV et parfois même au RaTG13 [9].

 

Histogram

Description automatically generated

Figure 9- Analyse de similarité SimPlot pour comparer les séquences de gènes ORF1ab, S, ORF3a, M, ORF7a et N du génome de référence Wuhan SARS-CoV-2 2020 avec celles du génome RatTG13 (vert), GD Pangolin CoV (rouge) et Bat CoVZ (violet). 

 

               Makarenkov et al, ont effectué une analyse détaillée pour détecter les similitudes du gène Wuhan SARS-Cov-2 avec les séquences du groupe RaTG13, du groupe GD Pangolin CoV et du groupe Bat CoVZ. Cette analyse a révélé que le SRAS-CoV-2 présente des similitudes plus élevées avec le virus GD Pangolin que les régions RaTg13 dans le domaine RB, ORF3a, M, ORF7a et N suggérant qu'un événement de recombinaison multiple s'est produit entre le virus GD Pangolin et le virus RatG13 CoC. Pour valider davantage ces données, Makarenkov et al. ont effectué un test d'analyse de recombinaison gène par gène Φ-test pour évaluer l'importance de la recombinaison entre les espèces orthologues de SARS-CoV-2, RaTG13, GD Pangolin 1 Cov, GD Pangolin P2S CoV, bat CoV Virus ZC45 et bat CoV ZXC21 (Tableau 1). Ce test révèle une recombinaison significative au niveau des ORF1ab, S, ORF3a, ORF7a, ORF8, N et de l'ensemble du génome [9].

 

Region

Φ-test result
(p-value)

Recombination detected (yes/no)

Window size

Gene ORF1ab

2.23 × 10–3

Yes

150

RB domain

Too short

Gene S

8.60 × 10–3

Yes

200

Gene ORF3a

1.13 × 10–5

Yes

100

Gene E

0.56

No

200

Gene M

0.226

No

100

Gene ORF6

Too short

Gene ORF7a

0.00155

Yes

200

Gene ORF7b

Too short

Gene ORF8

0.0453

Yes

200

Gene N

0.024

Yes

50

Gene ORF10

Too short

Whole genomes

0.0156

Yes

200

 
Tableau 1- Φ-test pour les évènements de recombinaison
 
               Le génome de SARS-CoV-2 est composé de 2 gènes codant pour 2 protéines non structurelles ORF1a et ORF1 b, 4 gènes codant pour 4 protéines structurales (S, E, M, N) et 5 gènes codant pour 5 protéines accessoires (ORF3, ORF6, ORF7a, ORF7b, ORF8, ORF10). ORF1ab est traduit de ORF1a (11826–13425 nt) et ORF1b (7983–8157 nt) [10, 11] . Le gène S code pour la protéine de Spike qui a une structure en forme de spike. La protéine de pointe est une glycoprotéine de type 1 essentielle pour la liaison au récepteur, la fusion et l'entrée du virus. Le gène E est commun à tous les CoV, le gène M est important pour l'assemblage de nouvelles particules virales. La protéine de nucléocapside est codée par le gène N et c'est un composant structurel essentiel du SRAS-CoV. Il est responsable de l'encapsulation du génome viral. ORF3a, ORF6, ORF7a et 7b, ORF8 et ORF10 sont des protéines accessoires qui ne se trouvent pas dans tous les SARS-CoV. Ils jouent un rôle dans la régulation des gènes, dans l'apoptose et dans l'interaction avec MHC1. Le tableau suivant résume les événements de recombinaison identifiés par Makarenkov et al à travers les différents gènes SARS-Cov2 parmi les différentes espèces (Tableau 2) [9].

 


Gene

Possibility of HGT

Region

Species

Bootscan score

ORF1ab

Partial

[1-11630]

Bat CoVZ and the cluster including the RaTG13 and SARS-CoV-2 viruses

61.50%

 

Complete

-

Bat RF1 CoV to bat BtCoV 279 2005

84.60%

 

Partial

[16326-17626]

Cluster of the bat BTKY72 and BM48 31 BGR 2008 coronaviruses and the cluster involving SARS-CoV-2, RaTG13 and GD Pangolin CoVs

61.50%

 

Deep phylogeny

[1249-1421]

CoV organisms from the bottom part of the tree to the cluster of GX Pangolins CoVs

97.90%

S

Partial

[1-881]

Bat CoVZ group and the cluster of GD Pangolin CoVs

64.40%

 

Partial

[1215-1425]

GD Pangolin CoVs to SARS-CoV-2

59.70%

 

Partial

[1311-1361] [1511-1561]

RaTG13 to GX Pangolin CoVs

61.50%

 

Partial

-

Bat CoVZ group and the cluster including BtCoV 273 2005, Rf1, HKU3-12, HKU3-6 and BtCoV 279 2005

-

ORF3a

Full

-

Cluster of SARS-CoV-2, RaTG13 and GD Pangolin CoVs, and the group of Bat CoVZ viruses

80.80%

 

Partial

[251-371]

Lower part of the tree (i.e. SARS-like 2003–2013 viruses), excluding bat viruses from Kenya and Bulgaria (i.e. BtKY72 and BM48 31 BGR 2008), and the GX Pangolin CoVs

61.50%

 

Deep phylogeny

-

CoVs from the previous SARS outbreak

-

E

-

[71-171]

CoVs from the previous SARS outbreak

-

M

Complete

Rs367

Rf1, BtCoV 273 2005

92.30%

 

Partial

[251-461]

SARS-CoV-2, RaTG13 CoVs, Bat CoVZ

53.90%

 

Partial

[569-669]

GD Pangolin CoVs

50%

ORF6

Complete

-

Bat CoVZ and the cluster ofSARS-CoV-2, RaTG13 CoVs

69.20%

 

Partial

[111-185]

HKU3-12 CoV, SARS-CoV cluster

67.70%

ORF7a/b

-

[21-131]

Bat CoVs related to the previous SARS outbreak. Lower part of the tree,excluding Kenyan and Bulgarian bats and GX Pangolin CoVs

53.80%

ORF8

Complete

Bat CoVZ

SARS-CoV-2, RaTG13, GX Pangolin CoVs and the Bat Viruses of the SARS-CoV group

84.60%

N

Partial

[534-727]

GD Pangolin CoVs, SARS-CoV-2

58.60%

 

Partial

[756-864]

RaTG13, GD Pangolin CoVs

53.80%

 

Partial

[551-721]

BtCoV 273 2005, Rf1, HKU CoVs

61.00%

ORF10

Complete

-

Bat CoVZ and SARS-CoV-2, RaTG13, GD Pangolin CoVs

79.50%

RB domain

-

[131–186]

GD Pangolin CoVs to SARS-CoV-2

57.70%

 

-

[41–141]

BtCoV 273 2005, Rf1, HKU3-12, HKU3-6, BtCoV

65.40%

 

Complete

Unknown

Murine CoVs and HKU1-related viruses

88.50%

 

Partial

Unknown

Murine CoVs and HKU1-related viruses

59.80%

 

Partial

Unknown

Equine CoV and Human OC43 and Enteric CoVs

63.50%

 

Partial

Unknown

Rabbit HKU14 CoV and Enteric human CoV and three bovine CoVs

65.40%

 

Partial

Unknown

Human OC43 CoV and Bovine OH440 CoV

57.70%

 

Partial

Unknown

Human Enteric CoV and Bovine AH187 CoV

84.60%

 
Tableau 2- les événements de recombinaison identifié

IV-    Discussion

 

               L'article présente une étude sur le rôle de la recombinaison dans la diversité des virus, y compris le SRAS-CoV-2 et d'autres bêtacoronavirus. La recombinaison est un processus qui permet aux virus de s'adapter à de nouveaux hôtes et environnements en surmontant la pression sélective. Makarenkov et al. ont effectué une analyse approfondie du transfert horizontal de gènes et de la recombinaison gène par gène des virus liés au SRAS-CoV-2. Cette analyse a révélé de multiples événements de transfert horizontal de gènes et de recombinaison parmi les organismes coronavirus.
 
               Le plus frappant parmi ces événements de recombinaison était les transferts de gènes statistiquement significatifs du Guangdong Pangolin CoV au SARS-CoV-2 trouvés dans le gène S et le gène N, ce qui suggère que le SARS-CoV-2 est une chimère résultant de la recombinaison du RatTG13 et du Guangdong Pangolin Génomes du CoV, dans la région du domaine RB et la position du gène N [534-727]. Les événements de recombinaisons confirmées dans les gènes S et N ainsi que l'analyse de recombinaison SimPlot des gènes S, ORF3a, M, ORF7a et N suggèrent que le pangolin du Guangdong est un hôte intermédiaire probable du SRAS-CoV-2, sur sa voie de transmission à partir des chauves-souris aux humains.
 
               Makarenkov et al. ont rapporté une recombinaison de gènes multiples entre le cluster comprenant les virus de chauve-souris CoVZC45 et CoVZXC21, et le cluster comprenant les souches SARS-CoV-2 et RatTG13. Certaines de ces recombinaisons étaient statistiquement significatives dans 6 gènes sur 11, des événements de transfert de gène-recombinaison entre ces grappes de CoV ont été trouvés dans 6 des 11 gènes de coronavirus, ORF1ab, ORF3a, M, ORF6, ORF8 et ORF10. Ces données confirment que RatTG13 et GD Pangolin CoVs ne contribuent pas seuls à l'évolution du SARS-CoV-2, mais aussi les coronavirus de chauve-souris CoVZC45 et CoVZXC21 ou leur ancêtre commun. Makarenkov et al. ont mené une analyse approfondie de la recombinaison intergénique sur la phylogénie des coronavirus de 46 espèces. Cette analyse a révélé des événements de transfert de gènes statistiquement significatifs affectant la partie inférieure de la phylogénie du coronavirus. Ce transfert comprend un transfert de gène complet dans le gène ORF3a affectant le cluster de MERS-CoV S et deux coronavirus de chauve-souris (HKU-4 et HKU-5. De plus, Makarenkov et al. n'ont trouvé aucun transfert de gène supplémentaire lors de l'ajout de SARS- Cov-2 génome à leur ensemble de données Cela pourrait s'expliquer par l'augmentation du taux de similitude entre le SARS-CoV-2 disponible. Dans l'ensemble, cette étude souligne l'importance de la recombinaison dans la diversification du génome viral et sa contribution à leur évolution, elle met également en évidence l’hôte intermédiaire très probablement impliqué dans la transmission du SRAS-CoV-2 à l'homme.
               

V-         Data analysis

 

               Les alphavirus sont un ensemble de 26 virus transmis par les moustiques et responsables de diverses maladies chez l'homme. Ceux trouvés dans le Nouveau Monde provoquent généralement une encéphalite, tandis que ceux de l'Ancien Monde provoquent généralement de la fièvre, des éruptions cutanées et des douleurs articulaires. Le génome de ces virus est constitué d'une molécule d'ARN simple brin non segmentée d'une longueur d'environ 11 700 nucléotides et de polarité positive. Les génomes de divers alphavirus ont été séquencés, et ces séquences démontrent qu'ils ont évolué à partir d'un ancêtre commun par une évolution divergente.

 

               Récemment, la séquence d'ARN du virus de l'encéphalite équine occidentale (WEEV) du New World Alphavirus a été déterminée, révélant qu'il s'agit d'un virus recombinant. La comparaison des séquences de nucléotides et d'acides aminés de WEEV avec celles d'autres alphavirus indique qu'il est issu d'un événement de recombinaison entre un virus de type EEEV et un virus de type Sindbis [12]. La protéine de capside et les 80 nucléotides 3'-terminaux non traduits de WEEV sont similaires à ceux du virus de l'encéphalite équine orientale (EEEV) du New World Alphavirus, tandis que les glycoprotéines E2 et E1 de WEEV sont plus étroitement liées à celles d'un virus de l'Ancien Monde, virus Sindbis. Le WEEV a donc acquis les propriétés encéphalogènes du VEEE et la spécificité antigénique du virus Sindbis (Figure 10).

Diagram

Description automatically generated

Figure 10 – Recombination event concluded from Hahn et al. [12] .

               À l'aide de SimPlot++, comparaison de l'ADN génomique du virus de l'encéphalite équine occidentale (WEEV McMillan : GQ287640.1 et BFS1703 : KJ554968.1), avec l'ARN génomique du virus de l'encéphalite équine orientale (EEEV : KP282670.1) et du virus Sindbis (virus Sindbis : NC_001547.1) n'a pas conduit à une conclusion claire que la souche WEEV a une séquence N-terminale similaire à EEEV et une séquence C-terminale similaire à SIN (Figures 10 et 11). Simplot montre une valeur de similarité négative tout au long de la comparaison des gènes, mais nous pouvons encore voir des GAP aux positions approximatives 5100, 8100 et 9100. Une analyse plus approfondie est nécessaire pour valider ces données, pour des raisons de longueur du rapport, je n'ai pas effectué toute analyse complémentaire. J'ai essayé d'inclure des séquences d'ARN supplémentaires de différentes souches de la même espèce, mais cela n'a pas amélioré le résultat, les séquences (WEEV McMillan : GQ287640.1 et BFS1703 : KJ554968.1), avec l'ARN génomique du virus de l'encéphalite équine orientale (EEEV : MK028842.1 ; AY722102.1 ; KT153581.1 ; KR260717.1 ;   KP282670.1) et Sindbis (virus Sinbis : NC_001547.1 ; AF429428.1 ; J02363.1)

Graphical user interface

Description automatically generated

Figure 11 – Simplot analysis of WEEV McMillan : GQ287640.1 and WEEV BFS1703: KJ554968.1 , with the genomic RNA of the EEEV: KP282670.1 and Sindbis virus: NC_001547.1  

1-    Amelioration possible au SimPlot++

 

               L'exécution de cette analyse met en évidence certaines fonctionnalités à améliorer dans la version SimPlot++. Tout d'abord, nous ne pouvons pas télécharger la séquence fasta séparément, car elle disparaît lors de la création des groupes. Pour résoudre ce problème, la séquence différente doit être incluse dans un fichier fasta. Cela nécessite un travail supplémentaire pour organiser la séquence dans un seul fichier au lieu de les télécharger un par un.

 

VI-    References

 

1.         Burmeister, A.R., Horizontal Gene Transfer. Evol Med Public Health, 2015. 2015(1): p. 193-4.

2.         Filip, E. and L. Skuza, Horizontal Gene Transfer Involving Chloroplasts. Int J Mol Sci, 2021. 22(9).

3.         Irwin, N.A.T., et al., Systematic evaluation of horizontal gene transfer between eukaryotes and viruses. Nat Microbiol, 2022. 7(2): p. 327-336.

4.         Zhou, P., et al., A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature, 2020. 579(7798): p. 270-273.

5.         Coutard, B., et al., The spike glycoprotein of the new coronavirus 2019-nCoV contains a furin-like cleavage site absent in CoV of the same clade. Antiviral Res, 2020. 176: p. 104742.

6.         Jamison, D.A., Jr., et al., A comprehensive SARS-CoV-2 and COVID-19 review, Part 1: Intracellular overdrive for SARS-CoV-2 infection. Eur J Hum Genet, 2022. 30(8): p. 889-898.

7.         Zhou, H., et al., A Novel Bat Coronavirus Closely Related to SARS-CoV-2 Contains Natural Insertions at the S1/S2 Cleavage Site of the Spike Protein. Curr Biol, 2020. 30(11): p. 2196-2203 e3.

8.         Bruen, T.C., H. Philippe, and D. Bryant, A simple and robust statistical test for detecting the presence of recombination. Genetics, 2006. 172(4): p. 2665-81.

9.         Makarenkov, V., et al., Horizontal gene transfer and recombination analysis of SARS-CoV-2 genes helps discover its close relatives and shed light on its origin. BMC Ecol Evol, 2021. 21(1): p. 5.

10.       Graham, R.L., et al., SARS coronavirus replicase proteins in pathogenesis. Virus Res, 2008. 133(1): p. 88-100.

11.       Woo, P.C.Y., et al., Coronavirus genomics and bioinformatics analysis. Viruses, 2010. 2(8): p. 1804-1820.

12.       Hahn, C.S., et al., Western equine encephalitis virus is a recombinant virus. Proc Natl Acad Sci U S A, 1988. 85(16): p. 5997-6001.