Cours BIF7002 (Séminaire de Bioinformatique)

 

Hiver 2024



Informations pratiques

Enseignant : Adboulaye Baniré Diallo et Vladimir Makarenkov.

Locaux et horaires : mardi de 17h30 à 20h30. La plupart des séances sont données sur Zoom (voir vos courriels de l’UQAM pour le lien Zoom). Les séances en présentiel sont données au PK-4323.

Page web du cours : http://www.info2.uqam.ca/~makarenkov_v/BIF7002/BIF7002.html.

Courriel : diallo.abdoulaye(at)uqam.ca et makarenkov.vladimir(at)uqam.ca



Fonctionnement du cours

Ce cours sera basé sur des conférences données par des chercheurs dans les disciplines touchant à la bioinformatique : informatique, mathématiques, biologie et biochimie. Le cours comprendra les conférences (voir le calendrier ci-dessous) suivies d’une séance d'exposés par les étudiants.



Évaluation

L'évaluation comportera trois parties : une note de présence et de participation (20%), un rapport sur une conférence (40%) et un exposé (40%).

La note de présence et de participation sera basée sur l'assiduité aux cours et sur l'animation (questions ou discussions pertinentes, ...). Elle comptera pour 20% de la note finale.

Après chaque conférence, une équipe d'étudiants désignée sera chargée de préparer un rapport d'une dizaine de pages, à remettre au plus tard trois semaines après la conférence. Ce rapport, qui devra être remis sous forme d’un article de revue (de 10 à 12 pages), sera évalué à la base des critères suivants : la qualité de la rédaction, la maîtrise des aspects scientifiques du problème, l'apport original (approfondissement des questions soulevées lors des conférences notamment, présentation et critiques de résultats expérimentaux, etc). Il comptera pour 40% de la note finale.

Lors de la dernière séance de la session, chaque équipe d'étudiants effectuera une présentation orale, d'une vingtaine de minutes, de son rapport, qui comptera pour 40% de la note finale. Les principaux aspects pris en compte dans la notation seront la qualité pédagogique et scientifique de l'exposé.

Vous pouvez consulter des exemples des rapports sur la page web suivante :

http://www.info2.uqam.ca/~makarenkov_v/BIF7002/BIF7002_exemples_rapports.html.

 

Calendrier

Mardi 9 janvier

Présentation du cours BIF7002, sélection des conférences.

 

Mardi 16 janvier (sur Zoom)

Abdoulaye Baniré Diallo (Professeur, Département d’Informatique, UQAM)

Titre : Bioinformatics methods for precision farming: examples from dairy

Résumé : Precision agriculture/farming is becoming the main approach to tackle the food needs for the increasing population in the world. Sustainable agriculture is key in addressing the challenges and in unlocking market potential. More precisely, in dairy farming, cattle well-being and longevity are crucial to a sustainable approach. In this presentation, I will illustrate how bioinformatics methods exploiting the power of artificial intelligence are important to integrate heterogeneous data (omics and non-omics) for generating predictive indicators of welfare, longevity, and profitability at different stages of cow’s life from cow milk, blood, and movements. These indicators are derived from ontologies, knowledge graph, data mining, genomics, metabolomics, computer vision and spatio-temporal deep learning techniques.

 

Mardi 23 janvier (sur Zoom)

Zahia Aouabed (Bioinformaticienne, Institut universitaire en santé mentale Douglas et l’UQAM)

 

Titre : Modèles basés sur l’apprentissage automatique et l’apprentissage profond pour l’analyse des données du microbiome : défis et perspectives

 

Résumé : Ces dernières années, un certain nombre de grands consortiums collectent et profilent plusieurs types de données de séries chronologiques sur le microbiome et la génomique. Les études longitudinales du microbiome combinées à des mesures multi-omiques intégrées offrent des opportunités sans précédent pour étudier la dynamique des communautés microbiennes, à la fois structurellement et fonctionnellement. Dans un futur proche, la place sera pour la modélisation dynamique, pour les méthodes d'analyses longitudinales et pour les méthodes intégratives de données provenant de différentes sources. Le but est de fournir une meilleure compréhension de la dynamique communautaire, notamment : l'observation des tendances, l'inférence de causalité et la prédiction du comportement de la communauté. Nous présenterons, dans un premier temps, différentes méthodes d’apprentissage machine et d’apprentissage profond, développées et appliquées à l'analyse des données du microbiome, afin d’avoir un aperçu du développement dans le domaine avec toutes les réalisations mais aussi les défis qui restent à relever. Ensuite, nous discuterons des stratégies émergentes applicables aux études longitudinales sur le microbiome allant des mesures multi-omiques systématiques, de l'intégration de données à la modélisation. Nous aborderons les limites des modèles complexes d'apprentissage automatique et des avancées technologiques récentes dans l'intégration de données multi-omiques.

 

Présentation de Zahia Aouabed

 

Mardi 30 janvier (sur Zoom)

17:30 Rencontre avec l’agent de stage et la direction du DESS en Bioinformatique (pour les étudiants du DESS en Bioinformatique qui doivent faire leur stage cette été)

suivie (à parti de 18:30) par la présentation de :

Stéphane Samson et Vladimir Makarenkov (Département d'informatique, UQAM)

Titre : Analyse de recombinaison et de transferts horizontaux de gènes chez SARS-CoV-2

Résumé : La pandémie de SARS-CoV-2 fait partie des maladies infectieuses les plus dangereuses qui soient apparues dans l’histoire récente. L’hypothèse a été émise dans le passé que les souches humaines de coronavirus des épidémies de SARS aient passées des chauves-souris à l’homme par l’entremise d’hôtes intermédiaires tels les civettes (SARS-CoV) et les chameaux (MERS-CoV). Des études récentes suggèrent que le génome du SARS-CoV-2 est très similaire au coronavirus de certaines chauves-souris pour la plupart de ses gènes et, à certaines souches de coronavirus de pangolins malaisiens pour le domaine receptor binding (RB) de la protéine de pointe (spike protein). Dans cet exposé, nous présenterons les résultats d’une analyse de détection d’évènements de recombinaison ainsi que de transferts horizontaux de gènes sur les 11 gènes principaux du SARS-CoV-2 afin de mieux comprendre les mécanismes derrière son émergence chez les humains et le rôle de ces hôtes intermédiaires potentiels. Nous présenterons également notre nouveau logiciel SimPlot++ permettant de mesurer et visualiser la similarité génétique entre différentes espèces (ou groupes d’espèces) étudié(e)s.

 

Présentation de Stéphane Samson

 

Article de Makarenkov, Mazoure, Rabusseau et Legendre (BMC Ecology and Evolution, 2021) sur l’évolution des gènes du SARS-CoV-2

 

Lien vers le logiciel SimPlot++

 

Mardi 6 février (sur Zoom)

Laurent Cappadocia (Département de chimie, UQAM)

Titre : Utilisation de la biologie structurale computationnelle pour accélérer la recherche sur les protéines.

Résumé : En à peine quelques années, l’intelligence artificielle (IA) s’est rapidement immiscée dans les différentes sphères de la recherche scientifiques. Son application en biologie est à l’origine de nombreuses percées, incluant tout particulièrement la capacité de prédire avec grande justesse la structure tridimensionnelle des protéines. Témoignant de l’importance de ce domaine de recherche, la prédiction de structure des protéines au moyen de l’IA a été nommée "percée de l’année 2021" par le prestigieux magazine Science et "méthode de l’année 2021" par le non moins prestigieux Nature Methods. À travers des exemples choisis, nous reviendrons aux origines de cette révolution et découvrirons comment cette technologie peut être utilisée pour des applications en biopharmaceutique et en biotechnologie végétale.

 

Lundi 19 février (sur Zoom) – séminaire annulé !

Arnaud Droit (Centre de recherche du CHU de Québec, Université Laval)

Titre :

Résumé :

 

Mardi 20 février (sur Zoom)

Étienne Lord (Agriculture and Agri-Food Canada)

Titre : Utilisation de l’apprentissage profond en agriculture pour relier la phénomique à la génomique

Résumé : Dans le contexte actuel des travaux sur l'apprentissage profond (deep learning), notamment avec l'essor de nouveaux algorithmes et réseaux pour la reconnaissance des images et l’analyse de séries temporelles, il est intéressant d'explorer les possibilités offertes par ces approches pour mieux comprendre la phénomique des plantes. La phénomique est un domaine d’étude interdisciplinaire qui combine la génétique, la génomique et les facteurs environnementaux pour étudier les liens causaux entre le génotype et le phénotype d’un organisme vivant. Ceci permet de mieux comprendre les relations complexes entre gènes, environnement et traits afin d'améliorer la résilience des plantes, la gestion des cultures et les efforts de conservation. Dans cette présentation, nous examinerons les possibilités offertes par l’apprentissage profond pour le suivi des caractères phénotypiques chez les plantes à travers la création et l'analyse d'immenses jeux de données. De plus, nous présenterons la programmation de modèles simples en utilisant l’API Keras pour faire l’analyse de séquences génétiques. 

 

Mardi 27 février

La semaine de relâche !

 

Mardi 5 mars (sur Zoom)

Jacques Corbeil (Centre de recherche du CHU de Québec, Université Laval)

Titre : Metabolomique

Résumé : À venir

 

Mardi 12 mars (sur Zoom)

Thomas Gisiger (McGill University)

Titre : Approches d’pour étudier les états émotionnelles chez le bovin.

Résumé : à venir

 

Mardi 19 mars (sur Zoom)

Lekha Sleno (Professeure, Département de chimie, UQAM)

 

Titre : Les défis de traitement de données en analyse métabolomique et protéomique par spectrométrie de masse

Résumé : À venir

 

Mardi 26 mars (sur Zoom)

Vladimir Makarenkov (Professeur, Département d'informatique, UQAM)

Titre : Le criblage à haut débit : détection et élimination efficaces du biais systématique

Résumé : Le criblage à haut débit (HTS - High-Throughput Screening, en anglais) est une technologie moderne de recherche de nouveaux médicaments. La procédure de criblage doit être largement automatisée pour pouvoir être applicable (plus de 100 000 composés chimiques sont souvent analysés par jour). La qualité des mesures est primordiale pour la recherche de composés prometteurs (i.e., hits), qui sont des candidats éventuels pour devenir de nouveaux médicaments. Lors de la prise des mesures, plusieurs biais, aléatoires ou systématiques, peuvent se produire. Ils peuvent être dus à des erreurs de manipulation, à des capteurs défectueux, au vieillissement des composés, etc. Les méthodes que nous avons proposées, appelées Background correction et Well correction, cherchent à corriger le biais systématique pour diminuer son impact sur les mesures expérimentales. Nous avons créé le logiciel HTS Corrector qui implémente ces méthodes et présente les résultats de manière chiffrée et graphique pour mieux visualiser les effets de biais systématiques. Divers essais des méthodes proposées ont été réalisés sur des données réelles et simulées en vue de prouver leur efficacité.

Présentation de Vladimir Makarenkov

Tableau blanc

Article de Malo et al. 2006 (Nature Biotechnology)

Article de Caraus et. 2015 (Briefings in Bioinformatics)

Le logiciel HTS Corrector (Makarenkov et al. 2006, Bioinformatics)

 

Mardi 2 avril (sur Zoom)

Zoé Joly-Lopez (Professeure, Département de chimie, UQAM)

Titre : Approche intégrative pour caractériser des nouveaux enhancers actifs chez le riz

Résumé : Chez les animaux, la découverte que les enhancers peuvent transcrire des molécules d’ARN non codantes appelées enhancer RNA (eRNA) suggère qu’il pourrait s’agir d’une caractéristique des enhancers actifs. Les eRNA sont relativement courts, instables et transcrits de manière bidirectionnelle et jouent une série de rôles dans la transcription active. Nous avons récemment démontré l’existence des eRNA dans le riz (Orysa sativa) mais l’analyse de leur profil qualitatif et quantitatif en n’a jamais été explorée. Notre groupe de recherche utilise une approche de biologie des systèmes, en utilisant tout d’abord des techniques complémentaires de génomique fonctionnelle (PRO-seq, ATAC-seq, MethylC-seq, RNA-seq) pour dresser un profil des eRNAs et de leur environnement génomique ainsi qu’un algorithme de détection d’éléments régulateurs. Ensuite, nous intégrons ces données avec une méthode d’architecture 3D de la chromatine (Pore-C, Oxford Nanopore) pour identifier des gènes potentiellement régulés par ces candidats enhancers. Finalement, nous utilisons l’édition ciblée du génome pour valider le rôle des enhancers actifs de façon spatio-temporels chez le riz.

Mardi 9 avril (sur Zoom)

Jerome Waldispuhl (Professeur, Computer science, McGill)

Titre : Leveling Up Citizen Science

Résumé : Over the past decade, citizen science computer games have become a popular practice for engaging the public in research activities. This methodology had a noticeable impact in molecular and cell biology, where millions of online volunteers contributed to the classification and annotation of scientific data, but also to solve advanced optimization problems requiring human supervision. Yet, despite promising results, the deployment of citizen science initiatives through academic/professional web pages faces serious limitations. Indeed, the volume of human attention needed to process massive data sets and make state-of-the-art scientific contributions rapidly outpaces the participation and availability of online volunteers. To overcome this challenge, citizen science must transcend its “natural habitat” and reach out to the entire gaming communities. Therefore, one solution is to build partnerships with commercial video game companies that already assembled large communities of gamers.

In this talk, we describe how this approach can transform the impact of citizen science in genomics. We discuss our experience from Phylo, an online puzzle for gene alignment, to Borderlands Science, a massively multiplayer online game for microbiome data analysis. We show how to embeds citizen science tasks into a virtual universe to engage new user bases. These principles have profound implications for future citizen science initiatives seeking to meet the growing demands of biology.

 

Mardi 16 et 23 avril

Les exposés des étudiants