La SFGH
Organisation contacter la SFGH Vie de la société Partenaires
Webmaster - Infos
|
Articles scientifiques - à lire de Marc Fellous et Eric Seboun
Recherche de gènes de prédisposition aux maladies multifactorielles par des études d’association pangénomique : évolution ou révolution ? Eric Seboun, Professeur, UPMC & INSERM U525 ; 91 Bd de l’Hôpital, 75013 Paris Courriel : seboun@ccr.jussieu.fr Marc Fellous, Professeur émérite, Université Paris 7 Institut Cochin Inserm 567 Paris Courriel : fellous@cochin.inserm.fr Au milieu des années 90, la recherche de gènes de prédisposition responsables de maladies multifactorielles combinant criblage anonyme du génome de familles et analyses de liaison non paramétriques n’avait pas donné les résultats escomptés. Plusieurs raisons à cela : l’effet extrêmement faible des gènes recherchés, les méthodes de liaison non paramétriques moins puissantes que la méthode des LOD scores, la difficulté à établir des collections de plusieurs centaines ou de milliers de familles de paires de germains atteints pour cartographier ces gènes par la méthode des paires de germains, et enfin le coût très élevé du génotypage de marqueurs microsatellites pour un criblage anonyme. . Devant le peu de succès de cette stratégie, dans un article princeps, Neil Risch et Kathleen Merikangas montrèrent en 1996 que les études d’association pangénomique (Genome-wide association) seraient particulièrement adaptées à la cartographie et l’identification de gènes de prédisposition sur des collections relativement « petites » de patients (quelques centaines à quelques milliers) à condition de disposer d’environ 500 000 marqueurs (5 marqueurs par gène et un nombre de gènes estimé à l’époque de 100 000) faisant l’hypothèse que le variant testé est un variant de prédisposition et que le coût du génotypage soit faible. Les limites pour mettre en oeuvre cette stratégie ne seraient donc que techniques. Les études d’association consistent à comparer la distribution des allèles ou des génotypes d’un marqueur entre une collection de patients (cas) et de personnes ne souffrant pas de cette pathologie (témoins). L’augmentation statistiquement significative de la fréquence d’un allèle du marqueur indique que le variant testé (effet direct) ou qu’un variant en déséquilibre de liaison avec le marqueur testé (effet indirect) prédispose à la maladie. Le déséquilibre de liaison peut être défini comme la combinaison non aléatoire des allèles à deux ou plusieurs locus. Les différentes méthodes de normalisation de son estimateur, D= f(AB) – f(A)f(B), ont données naissance à plusieurs index dont le plus connu est D’. Le déséquilibre de liaison peut être la conséquence du mélange récent de populations (métissage), de la sélection, de la dérive génétique (s’observe dans les petites populations où un sous-ensemble du pool d’allèles présents chez les parents sera transmis à la descendance) et de mutations. Le déséquilibre de liaison est maximal lorsque la fréquence de l’allèle de maladie et celle de l’allèle associé au locus marqueur sont identiques. Le séquençage du génome humain a permis le développement de nouveaux marqueurs bi-alléliques, les SNPs (single nucleotide polymorphism). Ils révèlent des variations ponctuelles polymorphes en moyenne toutes les 300 pb et dont certaines correspondent, parfois, à des variations fonctionnelles situées dans les gènes (cSNP). La très grande fréquence des SNPs au sein du génome compense leur faible polymorphisme. Plus de 11 millions de SNP ont été découverts dans quatre populations étudiées (Yoruba, la principale population du Niger, Japonaise, Chinoise et Américaines dont les ancêtres sont d’originaires d’Europe du nord et de l’ouest). Pour la première fois, le génome d’une personne unique, James Watson et Craig Venter, a été séquencé. La séquence du génome de James Watson –qui tient sur un CD- est interrogeable en ligne ; parmi les variants identifiés, 133 ont pu être relié à la base de données OMIM qui contient ~18000 entrées. L’analyse du génome de Craig Venter a montré que parmi plus de 4,1 millions de variants identifiés, un peu moins de 1,3 millions d’entre eux sont des nouveaux qui n’avaient pas été identifiés auparavant. L’analyse de la séquence a aussi mis en évidence un certain nombre de facteurs de risques, notamment d’arrêt cardiaque, dont le père de Craig Venter est décédé, une demi-surprise... Enfin, une soixantaine de CNV (copy number variant) ont été mis en évidence. L’étude du déséquilibre de liaison sur des régions de quelques centaines de Kb a montré que les allèles des SNP rapprochés recombinent très peu et tendent à rester groupés lors de la transmission héréditaire : ils forment des blocs haplotypiques de tailles variables dont la diversité est relativement limitée dans la population. En revanche, les recombinaisons se produisent principalement entre ces blocs. L’objectif du projet HapMap fut d’identifier et de définir ces blocs haplotypiques au sein des différentes populations déjà étudiées. Bien qu'un bloc haplotypique puisse contenir de nombreux SNPs, les SNPs d’un bloc étant fortement corrélés, le génotypage de quelques SNPs (Tag-SNP) au sein d’un bloc haplotypique suffit pour connaître la nature de la variation génétique de cette région. Ces blocs sont très utiles en cartographie fine. Affymetrix et Illumina ont développé et commercialisent des puces avec plus d’un million de SNPs. Leurs prix ayant considérablement baissé, le génotypage à hauts débits sur plusieurs centaines voire plusieurs milliers de cas et de témoins est à présent possible. Une approche récente basée sur la comparaison de pools d’ADN, bien que moins puissante que le génotypage individuel, permet de réaliser une étude cas-témoins avec un budget très limité ; toutefois les aspects méthodologiques et statistiques se révèlent plus complexes que dans le cas du génotypage individuel d’échantillons d’ADN. Le succès de cette stratégie dépend, entre autres, de la qualité de la quantification de l’ADN mais aussi de l’architecture allélique de la maladie. En fait l’utilisation du déséquilibre en cartographie est relativement ancienne. Elle a déjà été utilisée avec succès avec des marqueurs RFLP du complexe HLA dans les années 1970 dans de nombreuses maladies complexes à médiation immunitaire (sclérose en plaques, polyarthrite rhumatoïde, diabète..). Puis cette méthode fût à nouveau appliquée avec succès dans des pathologies monogéniques (CFTR dans la mucoviscidose, DTDST dans la dysplasie diastrophique…) ou dues à des variants génétiques relativement élevés dont l’effet est mesuré par un rapport de probabilités, l’odd ratio ; O.R. L’O.R. mesure la force de la relation entre deux variables. Il est défini comme le rapport de la probabilité de survenue d’un événement dans un groupe sur la probabilité de survenue dans l’autre groupe. O.R.=p/(1 – p)/q(1 – q)=p(1 –q)/q(1 – p) ; p étant la probabilité de survenue de l’événement dans un groupe et q dans l’autre groupe. C’est le cas par exemple de APOE4 dans la maladie d’Alzheimer ou des facteurs du complément dans les dégénérescences maculaires liée à l'âge. Les possibilités de génotypage à très hauts débits par SNP ont relancé les études d’association par une approche génomique sans hypothèse, alors que dans le passé, les études d’association concernaient des gènes candidats choisis d’après la connaissance de leur fonction et de la physiopathologie. Ces cinq dernières années, de nombreuses études concernant par exemple les diabètes de type 1 ou 2, le cancer de la prostate, la maladie de Crohn, la sclérose en plaques, l’hypertension artérielle ou insuffisance coronaire... ont été publiées et les résultats confirmés dans des études de réplication publiées dans les semaines ou les mois qui ont suivi. Récemment, une étude d’association pan-génomique réalisée par un consortium de cliniciens d’Amérique du Nord et de Suède a été publiée en septembre 2007. 1522 patients atteints de polyarthrite rhumatoïde et 1850 sujets contrôles ont été génotypés avec plus de 300 000 SNP, répartis sur l’ensemble du génome. Une association a été confirmée avec HLADRB (locus PTPN22), le gène TRAF1, localisé sur le chromosome 9 (associé au récepteur du TNF) et le facteur du complément C5 (O.R. = 1,32). D’une manière générale, les différents locus identifiés dans toutes ces études (aussi bien par les approches de liaison non paramétrique que par association) ont tous des O.R. très faibles, souvent inférieures à 1,3 et cumulativement ils n’expliquent qu’une petite partie de la variance phénotypique. Que conclure de ces résultats ? Est-ce que les autres locus contribuant à la prédisposition génétique auraient des O.R. encore plus faibles ? Serions-nous donc en présence d’un modèle génétique avec un nombre « infini » de gènes de prédisposition aux effets encore plus faibles et dont l’identification s’avèrera encore plus difficile ? Hypothèse alternative : sommes-nous en présence d’un modèle dont les locus auraient des effets plus importants mais leur mise en évidence par déséquilibre de liaison pan-génomique serait pénalisée par une très grande hétérogénéité génétique de locus ? Cette situation est tout à fait possible comme le montre le cas de l’autisme, où plusieurs locus à effets forts ont été mis en évidence et plusieurs publications récentes rapportent le rôle des CNV découverts dans la forme de type I de la maladie de Charcot-Marie-Tooth et observés par la suite dans d’autres maladies monogéniques. Ou bien, les marqueurs utilisés ne couvrent pas l’intégralité du génome, les régions y échappant contribueraient de façon plus importante aux phénotypes que les autres régions du génome. Cette dernière hypothèse, bien que peu probable, compte tenu de la couverture du génome humaine en SNP et des résultats d’identification de gènes de prédisposition pour de nombreuses pathologies, ne peut pas être exclue. Il a notamment était observé que globalement, le déséquilibre de liaison entre CNV et SNP voisins était très faible. Cela signifierait que pour un grand nombre de pathologies étudiées, plusieurs gènes de prédisposition non encore identifiés pourraient se situer dans ces régions. En dépit de tous ces nouveaux outils, le modèle génétique, la complexité des interactions entre les produits de ces gènes et les différents mécanismes de régulation rendent la mise en évidence de gènes de prédisposition très difficile mais possible. La découverte de locus de prédisposition s’appuiera sur la mise en commun de collections de patients, stratégie d’ailleurs récemment employée par le Wellcome Trust Case Control Consortium au Royaume-Uni dont la première étude publiée en Juin 2007 dans Nature a porté sur l’étude de 7 maladies, 14000 patients et 3000 contrôles communs. Aux Etats-Unis, le groupe de recherche collaboratif GAIN est né du partenariat entre secteurs académiques et privés. Il a pour objectif de rechercher des facteurs de prédisposition aux maladies communes par des approches d’association pan-génomique. La validation des résultats au niveau statistique nécessitera le partage de collections. Des approches de modélisation fonctionnelle, in vitro ou in silico, de l’effet du variant suspecté pourraient démontrer sa causalité comme dans le cas du gène ATG16L1 impliqué dans l’autophagosome et qui prédisposerait à la maladie de Crohn par exemple. On peut prévoir que de nouveaux gènes de prédisposition et de nouvelles voies biologiques mais aussi des facteurs environnementaux que nos connaissances actuelles n’avaient pas permis d’envisager, seront découverts dans les années à venir. De nouvelles hypothèses quant à la physiopathologie des maladies multifactorielles seront sans doute formulées pour certaines pathologies ouvrant de nouvelles perspectives de prévention ou de traitement. En revanche au vu des publications actuelles, ces résultats auront peu d’impact en termes de diagnostic génétique. Révolution en 2007, évolution dans quelques années lorsque les études cas-témoins seront réalisées sur des génomes séquencés ; la vraie révolution. Nous remercions Josué Feingold et Jacky Beckmann pour la relecture de ce texte Quelques publications récentes sur le sujet : Beckmann J.S. et al. Copy number variants and genetic traits: closer to the resolution of phenotypic to genotypic variability. Nat Rev Genet. 2007 Aug;8(8):639-46. Brenner SE. Common sense for our genomes. Nature. 2007 Oct 18;449(7164):783-4. Burton P. R., M. D. Tobin, J. L. Hopper. Key concepts in genetic epidemiology. Lancet vol. 2005 Sep; 10(366):941-51 Butcher LM, Meaburn E, Knight J, Sham PC, Schalkwyk LC, Craig IW, Plomin R. SNPs, microarrays and pooled DNA: identification of four loci associated with mild mental impairment in a sample of 6000 children. Hum Mol Genet. 2005;14:1315-25. Carson A. R. et al. Strategies for the detection of copy number and other structural variants in the human genome. Human Genomics, 2006 Jun;2(6):403-14. Carter N. P. Methods and strategies for analyzing copy number variation using DNA microarrays. Nat Genet. 2007 Jul;39(7 Suppl):S16-21. Christensen K. & Murray JC. What Genome-wide Association Studies Can Do for Medicine. N Engl J Med. 2007 Mar 15; 356(11):1094-7 Conrad D.F. & M. E. Hurles. The population genetics of structural variation. Nat Genet. 2007 Jul; 39(7 Suppl): S30-6. Cordell H. J. & D. G.Clayton. Genetic association studies. Lancet 2005 Sep 24-30; 366(9491):1121-31. Craig DW, Huentelman MJ, Hu-Lince D, Zismann VL, Kruer MC, Lee AM, Puffenberger EG, Pearson JM, Stephan DA. Identification of disease causing loci using an array-based genotyping approach on pooled DNA. BMC Genomics. 2005;6:138. Daly MJ, Rioux JD, Schaffner SF, Hudson TJ, Lander ES. High-resolution haplotype structure in the human genome. Nat Genet. 2001 Oct;29(2):229-32. Diabetes Genetics Initiative of Broad Institute of Havard and MIT, Lund University, and Novartis Institutes of BioMedical Research. Genome-Wide Association Analysis Identifies Loci Type 2 Diabetes and Triglyceride Levels. Science 2007 Jun 1;316(5829):1331-6. GAIN Collaborative Research Group, Hampe J, et al. A genome-wide association scan of nonsynonymous SNPs identifies a susceptibility variant for Crohn disease in ATG16L1. Nat Genet. 2007 Feb;39(2):207-11. Hästbacka J, de la Chapelle A, Kaitila I, Sistonen P, Weaver A, Lander E. Linkage disequilibrium mapping in isolated founder populations: diastrophic dysplasia in Finland. Nat Genet. 1992 Nov.2(3):204-11. Erratum in: Nat Genet 1992 Dec;2(4):343. Hästbacka J, de la Chapelle A, Mahtani MM, Clines G, Reeve-Daly MP, Daly M, Hamilton BA, Kusumi K, Trivedi B, Weaver A, et al. The diastrophic dysplasia gene encodes a novel sulfate transporter: positional cloning by fine-structure linkage disequilibrium mapping. Cell 1994 Sep 23;78(6):1073-87. Hästbacka J, A Kerrebrock, K Mokkala, G Clines, M Lovett, I Kaitila, A de la Chapelle, ES Lander. Identification of the Finnish founder mutation for diastrophic dysplasia (DTD). Eur J Hum Genet. 1999 Sep;7(6):664-70. Hattersley A. T. & M. I. McCarty.What makes a good genetic association study ? Lancet 2005 Oct 8;366(9493):1315-23. Iafrate, A.J. et al. Detection of large-scale variation in the human genome. Nat. Genet. 2004 Sep;36(9):949-51. International HapMap Consortium. A haplotype map of the human genome. Nature. 2005 Oct 27;437(7063):1299-320. International HapMap Consortium. A second generation human haplotype map of over 3.1 million SNPs. Nature. 2007 Oct 18;449(7164):851-61. Jacquemont, M.L. et al. Array-based comparative genomic hybridization identifies high frequency of cryptic chromosomal rearrangements in patients with syndromic autism spectrum disorders. J. Med. Genet. 2006 Nov;43(11):843-9. Jeffreys AJ, Kauppi L, Neumann R. Intensely punctate meiotic recombination in the class II region of the major histocompatibility complex. Nat Genet. 2001 Oct;29(2):217-22. Kehrer-Sawatzki H. What a difference copy number variation makes. Bioessays Apr 2007, 29(4):311-3. Kukita Y. et al.Genome-wide definitive haplotypes determined using a collection of complete hydatiform moles. Genome Res. 2005 Nov;15(11):1511-8. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, et al. (2007) The diploid genome sequence of an individual human. PLoS Biol 5(10): e254. doi:10.1371/journal.pbio. 0050254 Lupski JR, et al. DNA duplication associated with Charcot-Marie-Tooth disease type 1A. Cell. 1991 Jul 26;66(2):219-32. Maraganore D. M.et al. Hig-Resolution Whole-Genome Association Study of Parkinson Disease. Am J Hum Genet. 2005 Nov;77(5):685-93. Maraganore D. M. et al. Genetic Epidemiology of Parkinson's Disease (GEO-PD) Consortium. Collaborative analysis of alpha-synuclein gene promoter variability and Parkinson disease. JAMA. 2006 Aug 9;296(6):661-70. McCarroll A. & D. M. Altshuler. Copy-number variation and association studies of human disease. Nat Genet. 2007 Jul;39(7 Suppl):S37-42. Meaburn E, Butcher LM, Liu L, Fernandes C, Hansen V, Al-Chalabi A, Plomin R, Craig I, Schalkwyk LC. Genotyping DNA pools on microarrays: tackling the QTL problem of large samples and large numbers of SNPs. BMC Genomics. 2005;6:52. Palmer L. J. & L. R. Cardon. Shaking the tree : mapping complex disease genes with linkage disequilibrium. Lancet 2005 Oct 1;366(9492):1223-34. Papassotiropoulos A, Stephan DA, Huentelman MJ, Hoerndli FJ, Craig DW, Pearson JV, Huynh KD, Brunner F, Corneveaux J, Osborne D, Wollmer MA, Aerni A, Coluccia D, Hanggi J, Mondadori CR, Buchmann A, Reiman EM, Caselli RJ, Henke K, de Quervain DJ. Common Kibra alleles are associated with human memory performance. Science. 2006;314:475-8. Pearson JV, Huentelman MJ, Halperin RF, Tembe WD, Melquist S, Homer N, Brun M, Szelinger S, Coon KD, Zismann VL, Webster JA, Beach T, Sando SB, Aasly JO, Heun R, Jessen F, Kolsch H, Tsolaki M, Daniilidou M, Reiman EM, Papassotiropoulos A, Hutton ML, Stephan DA, Craig DW. Identification of the genetic basis for complex disorders by use of pooling-based genomewide singlenucleotide-polymorphism association studies. Am J Hum Genet. 2007;80:126-39. Plenge RM, et al.TRAF1-C5 as a Risk Locus for Rheumatoid Arthritis – A Genomewide Study. N Engl J Med. 2007 Sep 20;357(12):1199-209 Plenge RM, et al. Two independent alleles at 6q23 associated with risk of rheumatoid arthritis. Nat Genet. 2007 Dec;39(12):1477-82. Pritchard JK & Cox NJ. The allelic architecture of human disease genes: common disease–common variant... or not? Hum. Mol. Genet. 2002 Oct 1;11(20):2417–2423. Redon R.et al. Global variation in copy number in the human genome. Nature. 2006 Nov 23;444(7118):444-54. Reich DE & Lander ES. On the allelic spectrum of human disease. Trends Genet. 2001 Sep;17(9):502–10. Rioux JD, et al. Genome-wide association study identifies new susceptibility loci for Crohn disease and implicates autophagy in disease pathogenesis. Nat Genet. 2007 May;39(5):596-604. Risch N. Linkage strategies for genetically complex traits. I. Multilocus models. Am J Hum Genet. 1990 Feb;46(2):222-8 Risch N. Linkage strategies for genetically complex traits. II. The power of affected relative pairs. Am J Hum Genet. 1990 Feb;46(2):229-41. Risch N. Linkage strategies for genetically complex traits. III. The effect of marker polymorphism on analysis of affected relative pairs. Am J Hum Genet. 1990 Feb;46(2):242-53. Erratum in: Am J Hum Genet. 1992 Sep;51(3):673-5. Risch N, Merikangas K. The future of genetic studies of complex human diseases. Science. 1996 Sep 13;273(5281):1516-7. Scherer S. W. et al. Challenges and standards in integrating surveys of structural variation. Nat Genet. 2007 Jul;39(7 Suppl):S7-15. Sebat, J. et al. Large-scale copy number polymorphism in the human genome. Science 2004, Jul 23;305(5683):525–8. Sebat, J. et al. Strong association of de novo copy number mutations with autism. Science 2007 Apr 20;316(5823):445-9. Sebat J. Major changes in our DNA lead to major changes in our thinking. Nat Genet. 2007 Jul;39(7 Suppl):S3-5. Todd J. A. et al. Robust associations of four new chromosome regions from genome-wide analyses of type 1 diabetes. Nat Genet. 2007 Jul;39(7):857-64. Wellcome Trust Case Control Consortium. Genome-wide association study of 14,000 cases of seven common diseases and 3,000 shared controls. Nature 2007 Jun 7;447(7145):661-78. Zeggini E, et al.; Wellcome Trust Case Control Consortium (WTCCC), McCarthy MI, Hattersley AT. Replication of genome-wide association signals in UK samples reveals risk loci for type 2 diabetes. Science. 2007 Jun 1;316(5829):1336-41. Erratum in : Science. 2007 Aug 24;317(5841):1035-6. Ressources en ligne : http://geneticassociationdb.nih.gov/cgi-bin/index.cgi http://www.ncbi.nlm.nih.gov/projects/genome/guide/human/ http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim http://jimwatsonsequence.cshl.edu/cgi-perl/gbrowse/jwsequence/ Remerciements Les auteurs remercient les Professeurs J. Feingold (Université Paris 7) et J.S. Beckmann (Université de Lausanne, Suisse) pour leurs suggestions et la lecture critique de ce manuscrit.
Date de création : 06/07/2007 @ 17:29 | Actualités
Sites à visiter
Recherche
Calendrier
|

Articles scientifiques
Haut 
