logomagistere entetesite logomagistere
 
Accueil
Le séminaire du MMS
Présentation
Les enseignements
Les mémoires
Les stages
Liens
Les 20 ans du MMS
Modèles markoviens et markoviens cachés dans l’analyse des génomes

Conférencier :

Bernard PRUM, Professeur à l’université d’Evry (page perso)

Bernard Prum

Résumé :

On sait qu’une part essentielle de l’information transmise de génération en génération est portée par les chromosomes, longues chaînes où se succèdent quatre types de molécules notés t, c, a, g. Chaque jour, plus de 40 millions de ces lettres arrivent dans les banques de données et le défi lancé au statisticien est d’aider le biologiste à extraire l’information pertinente de cette immense quantité de données.

Une partie de cette information est “locale”, c’est à dire contenue dans des mots courts, voire des “motifs” (mots dégénérés) courts. Chercher ceux dont la fréquence (très élevée ou très rare) dénote un rôle biologique ne peut se faire qu’en prenant en compte les fréquences des lettres, ou mieux des mots de 2, 3, etc. lettres, c’est à dire en travaillant conditionnellement à la statistique exhaustive des modèles markoviens d’ordre 0, 1, 2, etc.

Mais une telle modélisation suppose une homogénéité des séquences, alors que celles-ci consistent en des régions aux significations biologiques fort différentes : gènes, segments inter-géniques, signaux divers. Cette diversité est non seulement prise en compte mais analysée par les modèles de chaînes de Markov cachées : ils s’avèrent être une aide primordiale à “l’annotation” des génomes (détermination par le calcul de la position des gènes et autres signaux).

Cette démarche demande donc la conception de modèles de type markovien (modèles dérivants, parcimonieux, MTD, …), la mise au point de procédures statistiques et leur implémentation efficace sur machine. En particulier, cet exposé présentera l’approche, due à G. Nuel : fondée sur les Automates Finis, celle-ci se montre beaucoup plus efficace que les méthodes déjà disponibles.

Transparents des conférences

PDF - 763.8 ko
Exposé de Bernard Prum

retour à la liste des conférences


 
Nous contacter
SPIP