Recherche de gènes et régions codantes





télécharger 480.38 Kb.
titreRecherche de gènes et régions codantes
page1/15
date de publication13.02.2018
taille480.38 Kb.
typeRecherche
d.20-bal.com > droit > Recherche
  1   2   3   4   5   6   7   8   9   ...   15
Introduction

Sommaire

Historique et situation française

Tableau I Étapes-clés dans l'histoire de la bioinformatique

Qu'est-ce que la Bioinformatique ?

Les différentes facettes de la bioinformatique

Nature des données biologiques à traiter et de l’information contenue à l’intérieur

Représentation de l’information contenue dans les données de type séquences

L'approche par modélisation

 Introduction

Historique

Les banques généralistes

Les banques spécialisées

La base de facteurs de transcription TFD

La base de motifs protéiques BLOCK

La diffusion et l'utilisation des banques de données

Conclusion

Fonctions générales d'édition et de transfert

Les formats

Les outils de conversion de formats

Introduction

La notion de similarité, d’identité et d’homologie

Le choix du matériel à comparer : ADN ou protéine ?

Les principes de base pour identifier la ressemblance entre 2 séquences

Les principaux logiciels et programmes de comparaison avec les banques de séquences

Le logiciel FASTA

FASTA

FASTA

FASTA

Le logiciel BLAST

BLAST

BLAST

BLAST

BLAST

L’alignement multiple

Définition de "motif" et "pattern"

Les différents types de motifs

Recherche de gènes et régions codantes

Les autres motifs nucléiques

La recherche de motifs contenus dans les bases de données

 L’analyse physico-chimique

La recherche d’éléments fonctionnels et/ou structuraux : motifs et domaines

Introduction

Quelques définitions

Méthodes de reconstruction à partir de séquences

Les outils et programmes

La Bioinformatique est la discipline de l'analyse de l'information biologique, en majorité sous la forme de séquences génétiques et de structures de protéines. C'est une branche théorique de la Biologie, largement antérieure à la récente "révolution génomique". Malgré son nom, la "bioinformatique" ne doit pas être confondue avec une simple application aux données biologiques des concepts et des outils de l'informatique traditionnelle.


Historique et situation française

Le terme de " Bioinformatics " n'est apparu dans la littérature scientifique qu'au tout début des années 90. Cependant, ce domaine de recherche ne vient pas d'émerger. Bien avant que cette discipline ne soit mise sous les feux de la rampe par l'essor de la génomique, quelques dizaines de laboratoires dans le monde travaillaient depuis longtemps en " biomathématique ", une discipline constituée pour répondre aux besoins précoces (dès 1965 !) de la phylogénie moléculaire. Le tableau I retrace les grandes étapes de la bioinformatique, et montre à quel point cette discipline a accompagné et souvent précédé le développement des concepts biologiques et des outils informatiques sur laquelle elle est fondée.

Tableau I Étapes-clés dans l'histoire de la bioinformatique



1951 Première séquence protéique (Insuline, Sanger)

1960 Lien entre séquence & structure (Globines, Perutz)

1965 Premier Ordinateurs IBM/360

1965 "Evolutionary divergence and convergence in Proteins" (Zuckerkandl & Pauling)

1967 "Construction of Phylogenetic Trees" Fitch & Margoliash.

1968 Atlas of Protein Sequences (M. Dayhoff, Georgetown)

1968 mini-ordinateur DEC PDP-8

1970 "A general method applicable to the search for similaries in sequences of two proteins" (Needleman & Wunsch).

1971 Premier travaux sur le repliement des ARNs (J. Ninio)

1972 Premier microprocesseur Intel 8008

1973 "Génie Génétique" (Cohen et al.)

1974 "Prediction of Protein Conformation" (Chou & Fasman)

1975 Intel 8080, kit Altair

1977 mini-ordinateur DEC-VAX.

Micro-ordinateurs (Apple, Commodore, Radioshack

Séquençage d'ADN (Sanger, Maxam, Gilbert)

1977 Premier "package" Bioinformatique (Staden)

1978 Bases de données: ACNUC, PIR, EMBL, GenBank

1980 Accès téléphonique à la base de données PIR

1981 IBM-PC (8088), 16-32kb

1981 Los Alamos-GenBank: 270 séquences, 370.000 nucléotides

Programme d'alignement local (Smith-Waterman)

1983 IBM-XT Disque DUR (10 Mbytes)

1984 MacIntosh : interface graphique & souris

1985-88 Programme "Fasta" (Pearson-Lipman)

1989 INTERNET succède à ARPANET et BITNET

1990 Programme "Blast" (Altschul et al.)

1990 Clonage positionnel et séquençage de NF-1

1991 "Grail", programme performant pour localiser les gènes (Mural et al.)

1991 Étiquettes d'ADNc "EST" (Venter et al., Matsubara et al.)

1992 Séquençage complet du chromosome III de levure

1995 Première séquence complète d'un micro-organisme (Venter et al.; H. influenza)

1996 Séquence complète de la levure (consortium européen)

1997 Programme "Gapped Blast" (Alschul et al.)

1997 11 génomes bactériens disponibles

1998 2 Mbase/jour de nouvelles séquences publiques

2001 Séquence ("premier jet") complète du génome humain.

Une partie du retard pris en Europe continentale (et en France) dans ce domaine (la bioinformatique, publique ou privée, est à 90% anglosaxonne) peut être attribué à une méconnaissance de l'origine et de l'histoire déjà longue des biomathématiques, et à la confusion associée au nouveau terme de " Bioinformatique ". Les quelques actions en faveur de cette discipline ont été exercées dans un contexte multidisciplinaire Informatique/Biologie, qui n'a jamais collé à la réalité d'un domaine de recherche déjà bien structuré autour de concepts et techniques spécifiques.
Nous sommes actuellement en face d'un quasi monopole américain dans le domaine de l'accès à la bibliographie et aux banques de données. Ce déséquilibre a, entre autre, forcé l'adhésion de l'Europe continentale à la "convention des Bermudes" qui impose la publication immédiate des séquences, et favorise objectivement le processus américain de valorisation industrielle.

Une circonstance fortuite donne pourtant à la France l'occasion de combler ce retard. L'explosion de l'industrie génomique et biotechnologique aux USA et en Angleterre, a eu l'effet paradoxal d'y détruire le tissu universitaire en bioinformatique. En effet, les laboratoires " académiques " n'ont pas résisté à la défection des nombreux bioinformaticiens qui ont répondu aux campagnes de recrutements massifs menés par Smithkline-Beecham, Glaxo, Merck, etc., et par une multitudes de plus petites entreprises comme Millennium, Incyte, Human Genome Science, etc.

La mise en place rapide de nouvelles filières universitaires s'appuyant sur les laboratoires existants, et un effort de recrutement ciblé par les organismes de recherche, permettrait à la France de combler ce vide, tout en offrant de réels débouchés aux étudiants. Plusieurs milliers de nouveaux ingénieurs et chercheurs bioinformaticiens seront en effet nécessaires à l'interprétation des données générées (au rythme de plusieurs millions de nucléotides /jour) au cours des 5 prochaines années.

Pour les anglo-saxons, le terme de " bioinformatics " distingue la discipline spécifiquement consacrée à l'étude des séquences et des structures, du terme générique de " biocomputing " (traitement sur ordinateur des données biologiques). De fait, les " computer scientists " anglo-saxons n'ont pas d'affinité particulière avec la " bioinformatics ". En français, au contraire, le terme " bioinformatique " a suggéré qu'une implication forte des informaticiens dans cette discipline était naturelle et nécessaire.))
Qu'est-ce que la Bioinformatique ?

La bioinformatique est constituée par l'ensemble des concepts et des techniques nécessaires à l'interprétation de l'information génétique (séquences) et structurale (repliement 3-D). C'est le décryptage de la " bio-information " (" Computational Biology " en anglais). La bioinformatique est donc une branche théorique de la Biologie. Son but, comme tout volet théorique d'une discipline, est d'effectuer la synthèse des données disponibles (à l'aide de modèles et de théories), d'énoncer des hypothèses généralisatrices (ex. : comment les protéines se replient ou comment les espèces évoluent), et de formuler des prédictions (ex. : localiser ou prédire la fonction d'un gène).

Depuis son origine, la Bioinformatique a accompagné et/ou précédé l'acquisition de l'information génétique. Elle n'est donc pas un " produit " de la génomique mais, comme la biologie moléculaire, elle en est un domaine fondateur. La bioinformatique a aussi accompagné et encouragé l'utilisation des ordinateurs en biologie depuis leur origine. La bioinformatique n'est pas pour autant dérivée de la " science " informatique ; elle n'est (comme l'aéronautique, la banque ou la physique) qu'utilisatrice des ordinateurs et de leurs langages. Un véritable " bioinformaticien " n'est donc pas le simple croisement d'un biologiste et d'un informaticien (pas plus qu'un neurochirurgien n'est celui d'un psychiatre et d'un anatomiste). Il manipule et conçoit des notions originales et doit être familier avec certains domaines mathématiques liés à l'origine de l'informatique (théorie de l'information, théorie des graphes, probabilités et processus stochastiques). En statistiques, par exemple, la bioinformatique a contribué à l'essor de l'approche bayésienne et à celle de l'analyse des valeurs extrêmes.

Le suffixe " Informatique " doit donc être compris comme renvoyant à l'interprétation de " l'information " biologique, et non pas à l'utilisation de l'ordinateur. Le bioinformaticien qui formule des prédictions fonctionnelles ou structurales, joue ainsi un rôle croissant dans l'argumentaire des demandes de brevets (ex : " ce gène partage tel motif avec tel autre, a donc telle fonction probable, et peut donc être à la base de telle application pharmacologique ").
La génomique utilise aussi l'informatique traditionnelle pour l'acquisition des données (instrumentation, robotique), leur archivage (bases de données) ou leur consultation (interface utilisateurs). Ces technologies ne sont pas spécifiques et ne sont pas liées à l'émergence de concepts nouveaux issus de la Biologie. Ces applications de l'ordinateur n'appartiennent donc pas à la bioinformatique telle qu'elle est définie ici. Bien que la confusion soit courante, la bioinformatique ne recouvre donc pas tous les domaines d'utilisation des ordinateurs en Biologie. Les domaines respectifs de la bioinformatique et de l'informatique peuvent être décrits comme suit :

  1   2   3   4   5   6   7   8   9   ...   15

similaire:

Recherche de gènes et régions codantes iconRecherche année 2009/2010 Titre du stage
«Flux des (trans-)gènes et impact sur la biodiversité» ‘gmbioImpact’ (2007-2010)

Recherche de gènes et régions codantes icon«Titre de l’étude»
«indiquer la nature des prélèvements (sang, urine, moelle,adn, etc)» et notamment le fait qu’il s’agit d’étudier «les modifications...

Recherche de gènes et régions codantes iconLe transfert aux régions des biens immobiliers de l’Afpa appartenant...

Recherche de gènes et régions codantes iconRecherche L’alphabet français semble mieux convenir à la fonction...

Recherche de gènes et régions codantes iconRecherche L’alphabet français semble mieux convenir à la fonction...

Recherche de gènes et régions codantes iconRecherche L’alphabet français semble mieux convenir à la fonction...

Recherche de gènes et régions codantes iconLa Recherche Scientifique
...

Recherche de gènes et régions codantes iconRecherche à visée médicale: L'article 23 de l'actuel projet de loi,...
«autorisation implicite» et «favoriser les besoins de l'industrie de la procréation»

Recherche de gènes et régions codantes iconLa loi n° 2015-29 du 16 janvier 2015 relative à la délimitation des...

Recherche de gènes et régions codantes iconDecentralisation de l’action sociale et protection de l’enfance
«relative aux droits et libertés des communes, des départements et des régions»






Tous droits réservés. Copyright © 2016
contacts
d.20-bal.com