Cours
BIF7002 (Séminaire de Bioinformatique)
Hiver
2024
Informations
pratiques
Enseignant : Adboulaye Baniré Diallo et
Vladimir Makarenkov.
Locaux et horaires : mardi de
17h30 à 20h30. La plupart des séances sont données sur Zoom (voir vos courriels
de l’UQAM pour le lien Zoom). Les séances en présentiel sont données au
PK-4323.
Page web du cours : http://www.info2.uqam.ca/~makarenkov_v/BIF7002/BIF7002.html.
Courriel : diallo.abdoulaye(at)uqam.ca et makarenkov.vladimir(at)uqam.ca
Fonctionnement
du cours
Ce cours sera
basé sur des conférences données par des chercheurs dans les disciplines
touchant à la bioinformatique : informatique,
mathématiques, biologie et biochimie. Le cours comprendra les conférences (voir
le calendrier ci-dessous) suivies d’une séance d'exposés par les étudiants.
Évaluation
L'évaluation
comportera trois parties : une note de présence et de participation (20%), un
rapport sur une conférence (40%) et un exposé (40%).
La note de présence et de
participation sera basée sur l'assiduité aux cours et sur l'animation
(questions ou discussions pertinentes, ...). Elle comptera pour 20% de la note
finale.
Après chaque conférence, une
équipe d'étudiants désignée sera chargée de préparer un rapport d'une dizaine
de pages, à remettre au plus tard trois semaines après la conférence. Ce
rapport, qui devra être remis sous forme d’un article de revue (de 10 à 12
pages), sera évalué à la base des critères suivants : la qualité de la
rédaction, la maîtrise des aspects scientifiques du problème, l'apport original
(approfondissement des questions soulevées lors des conférences notamment,
présentation et critiques de résultats expérimentaux, etc).
Il comptera pour 40% de la note finale.
Lors de la dernière séance de
la session, chaque équipe d'étudiants effectuera une présentation orale, d'une
vingtaine de minutes, de son rapport, qui comptera pour 40% de la note finale.
Les principaux aspects pris en compte dans la notation seront la qualité
pédagogique et scientifique de l'exposé.
Vous pouvez
consulter des exemples des rapports sur la page web suivante :
http://www.info2.uqam.ca/~makarenkov_v/BIF7002/BIF7002_exemples_rapports.html.
Calendrier
Mardi 9 janvier
Présentation du
cours BIF7002, sélection des conférences.
Mardi 16 janvier
(sur Zoom)
Abdoulaye Baniré Diallo
(Professeur, Département d’Informatique, UQAM)
Titre :
Bioinformatics
methods for precision farming: examples from dairy
Résumé :
Precision agriculture/farming is becoming the main approach to tackle the food
needs for the increasing population in the world. Sustainable agriculture is
key in addressing the challenges and in unlocking market potential. More
precisely, in dairy farming, cattle well-being and longevity are crucial to a
sustainable approach. In this presentation, I will illustrate how
bioinformatics methods exploiting the power of artificial intelligence are
important to integrate heterogeneous data (omics and non-omics) for generating
predictive indicators of welfare, longevity, and profitability at different
stages of cow’s life from cow milk, blood, and movements. These indicators are
derived from ontologies, knowledge graph, data mining, genomics, metabolomics,
computer vision and spatio-temporal deep learning
techniques.
Mardi 23 janvier (sur Zoom)
Zahia Aouabed (Bioinformaticienne,
Institut universitaire en santé mentale Douglas et l’UQAM)
Titre : Modèles basés sur l’apprentissage automatique et l’apprentissage profond
pour l’analyse des données du microbiome : défis et
perspectives
Résumé : Ces dernières années, un certain nombre de
grands consortiums collectent et profilent plusieurs types de données de séries
chronologiques sur le microbiome et la génomique. Les études longitudinales du
microbiome combinées à des mesures multi-omiques
intégrées offrent des opportunités sans précédent pour étudier la dynamique des
communautés microbiennes, à la fois structurellement et fonctionnellement. Dans
un futur proche, la place sera pour la modélisation dynamique, pour les
méthodes d'analyses longitudinales et pour les méthodes intégratives de données
provenant de différentes sources. Le but est de fournir une meilleure
compréhension de la dynamique communautaire, notamment : l'observation des
tendances, l'inférence de causalité et la prédiction du comportement de la
communauté. Nous présenterons, dans un premier temps, différentes méthodes
d’apprentissage machine et d’apprentissage profond, développées et appliquées à
l'analyse des données du microbiome, afin d’avoir un aperçu du développement
dans le domaine avec toutes les réalisations mais aussi les défis qui restent à
relever. Ensuite, nous discuterons des stratégies émergentes applicables aux
études longitudinales sur le microbiome allant des mesures multi-omiques systématiques, de l'intégration de données à la
modélisation. Nous aborderons les limites des modèles complexes d'apprentissage
automatique et des avancées technologiques récentes dans l'intégration de
données multi-omiques.
Présentation
de Zahia Aouabed
Mardi 30 janvier
(sur Zoom)
17:30 Rencontre
avec l’agent de stage et la direction du DESS en Bioinformatique
(pour les étudiants du DESS en Bioinformatique qui
doivent faire leur stage cette été)
suivie
(à parti de 18:30) par la présentation de :
Stéphane Samson et Vladimir Makarenkov (Département
d'informatique, UQAM)
Titre : Analyse de recombinaison et de
transferts horizontaux de gènes chez SARS-CoV-2
Résumé : La pandémie de
SARS-CoV-2 fait partie des maladies infectieuses les plus dangereuses qui
soient apparues dans l’histoire récente. L’hypothèse a été émise dans le passé
que les souches humaines de coronavirus des épidémies de SARS aient passées des
chauves-souris à l’homme par l’entremise d’hôtes intermédiaires tels les
civettes (SARS-CoV) et les chameaux (MERS-CoV). Des
études récentes suggèrent que le génome du SARS-CoV-2 est très similaire au
coronavirus de certaines chauves-souris pour la plupart de ses gènes et, à
certaines souches de coronavirus de pangolins malaisiens pour le domaine receptor binding (RB) de la protéine de pointe (spike protein). Dans cet exposé, nous présenterons les résultats
d’une analyse de détection d’évènements de recombinaison ainsi que de
transferts horizontaux de gènes sur les 11 gènes principaux du SARS-CoV-2 afin
de mieux comprendre les mécanismes derrière son émergence chez les humains et
le rôle de ces hôtes intermédiaires potentiels. Nous présenterons également notre
nouveau logiciel SimPlot++ permettant de mesurer et visualiser la similarité
génétique entre différentes espèces (ou groupes d’espèces) étudié(e)s.
Présentation
de Stéphane Samson
Article
de Makarenkov, Mazoure, Rabusseau
et Legendre (BMC Ecology and Evolution,
2021) sur l’évolution des gènes du SARS-CoV-2
Lien vers le logiciel
SimPlot++
Mardi 6 février
(sur Zoom)
Laurent Cappadocia (Département de chimie, UQAM)
Titre : Utilisation
de la biologie structurale computationnelle pour accélérer la recherche sur les
protéines.
Résumé : En à peine
quelques années, l’intelligence artificielle (IA) s’est rapidement immiscée
dans les différentes sphères de la recherche scientifiques. Son application en
biologie est à l’origine de nombreuses percées, incluant tout particulièrement
la capacité de prédire avec grande justesse la structure tridimensionnelle des
protéines. Témoignant de l’importance de ce domaine de recherche, la prédiction
de structure des protéines au moyen de l’IA a été nommée "percée de
l’année 2021" par le prestigieux magazine Science et "méthode de
l’année 2021" par le non moins prestigieux Nature Methods. À travers des
exemples choisis, nous reviendrons aux origines de cette révolution et
découvrirons comment cette technologie peut être utilisée pour des applications
en biopharmaceutique et en biotechnologie végétale.
Lundi 19 février (sur
Zoom) – séminaire annulé !
Arnaud
Droit (Centre de recherche du CHU de Québec, Université Laval)
Titre :
Résumé :
Mardi 20 février (sur Zoom)
Étienne
Lord (Agriculture and Agri-Food Canada)
Titre : Utilisation de l’apprentissage profond en agriculture pour
relier la phénomique à la génomique
Résumé : Dans le
contexte actuel des travaux sur l'apprentissage profond (deep
learning), notamment avec l'essor de nouveaux
algorithmes et réseaux pour la reconnaissance des images et l’analyse de séries
temporelles, il est intéressant d'explorer les possibilités offertes par ces
approches pour mieux comprendre la phénomique des
plantes. La phénomique est un domaine d’étude
interdisciplinaire qui combine la génétique, la génomique et les facteurs
environnementaux pour étudier les liens causaux entre le génotype et le
phénotype d’un organisme vivant. Ceci permet de mieux comprendre les relations
complexes entre gènes, environnement et traits afin d'améliorer la résilience
des plantes, la gestion des cultures et les efforts de conservation. Dans cette
présentation, nous examinerons les possibilités offertes par l’apprentissage
profond pour le suivi des caractères phénotypiques chez les plantes à travers
la création et l'analyse d'immenses jeux de données. De plus, nous présenterons
la programmation de modèles simples en utilisant l’API Keras
pour faire l’analyse de séquences génétiques.
Mardi 27 février
La semaine
de relâche !
Mardi 5 mars (sur Zoom)
Jacques
Corbeil (Centre de recherche du CHU de Québec, Université Laval)
Titre : Metabolomique
Résumé : À venir
Mardi 12 mars (sur Zoom)
Thomas
Gisiger (McGill University)
Titre : Approches
d’pour étudier les états émotionnelles chez le bovin.
Résumé : à venir
Mardi 19 mars (sur Zoom)
Lekha Sleno
(Professeure, Département de chimie, UQAM)
Titre : Les défis de traitement de données en
analyse métabolomique et protéomique par spectrométrie de masse
Résumé : À venir
Mardi 26 mars (sur Zoom)
Vladimir
Makarenkov (Professeur, Département d'informatique, UQAM)
Titre : Le criblage à haut débit :
détection et élimination efficaces du biais systématique
Résumé : Le criblage à haut débit (HTS - High-Throughput Screening, en anglais) est une technologie
moderne de recherche de nouveaux médicaments. La procédure de criblage doit
être largement automatisée pour pouvoir être applicable (plus de 100 000
composés chimiques sont souvent analysés par jour). La qualité des mesures est
primordiale pour la recherche de composés prometteurs (i.e., hits), qui sont des candidats éventuels
pour devenir de nouveaux médicaments. Lors de la prise des mesures, plusieurs
biais, aléatoires ou systématiques, peuvent se produire. Ils peuvent être dus à
des erreurs de manipulation, à des capteurs défectueux, au vieillissement des
composés, etc. Les méthodes que nous avons proposées, appelées Background correction et Well correction, cherchent à corriger le
biais systématique pour diminuer son impact sur les mesures expérimentales.
Nous avons créé le logiciel HTS Corrector
qui implémente ces méthodes et présente les résultats de manière chiffrée et
graphique pour mieux visualiser les effets de biais systématiques. Divers
essais des méthodes proposées ont été réalisés sur des données réelles et
simulées en vue de prouver leur efficacité.
Présentation
de Vladimir Makarenkov
Mardi 2 avril (sur Zoom)
Zoé Joly-Lopez (Professeure, Département
de chimie, UQAM)
Titre : Approche intégrative pour caractériser des nouveaux enhancers
actifs chez le riz
Résumé : Chez les
animaux, la découverte que les enhancers peuvent
transcrire des molécules d’ARN non codantes appelées enhancer
RNA (eRNA) suggère qu’il pourrait s’agir d’une
caractéristique des enhancers actifs. Les eRNA sont relativement courts, instables et transcrits de
manière bidirectionnelle et jouent une série de rôles dans la transcription
active. Nous avons récemment démontré l’existence des eRNA
dans le riz (Orysa sativa) mais l’analyse de leur
profil qualitatif et quantitatif en n’a jamais été explorée. Notre groupe de
recherche utilise une approche de biologie des systèmes, en utilisant tout
d’abord des techniques complémentaires de génomique fonctionnelle (PRO-seq, ATAC-seq, MethylC-seq, RNA-seq) pour
dresser un profil des eRNAs et de leur environnement
génomique ainsi qu’un algorithme de détection d’éléments régulateurs. Ensuite,
nous intégrons ces données avec une méthode d’architecture 3D de la chromatine
(Pore-C, Oxford Nanopore) pour identifier des gènes potentiellement régulés par
ces candidats enhancers. Finalement, nous utilisons
l’édition ciblée du génome pour valider le rôle des enhancers
actifs de façon spatio-temporels chez le riz.
Mardi 9 avril (sur Zoom)
Jerome
Waldispuhl (Professeur, Computer science, McGill)
Titre :
Leveling Up Citizen
Science
Résumé : Over the
past decade, citizen science computer games have become a popular practice for
engaging the public in research activities. This methodology had a noticeable
impact in molecular and cell biology, where millions of online volunteers
contributed to the classification and annotation of scientific data, but also
to solve advanced optimization problems requiring human supervision. Yet,
despite promising results, the deployment of citizen science initiatives
through academic/professional web pages faces serious limitations. Indeed, the
volume of human attention needed to process massive data sets and make
state-of-the-art scientific contributions rapidly outpaces the participation
and availability of online volunteers. To overcome this challenge, citizen
science must transcend its “natural habitat” and reach out to the entire gaming
communities. Therefore, one solution is to build partnerships with commercial
video game companies that already assembled large communities of gamers.
In this talk, we describe how this approach can
transform the impact of citizen science in genomics. We discuss our experience
from Phylo, an online puzzle for gene alignment, to
Borderlands Science, a massively multiplayer online game for microbiome data
analysis. We show how to embeds citizen science tasks into a virtual universe
to engage new user bases. These principles have profound implications for
future citizen science initiatives seeking to meet the growing demands of
biology.
Mardi 16 et 23
avril
Les exposés des étudiants