• L’histoire des populations en Europe et en Amérique du Nord

    En utilisant des millions de profils de généalogie en ligne interconnectés, les chercheurs ont créé le plus grand arbre généalogique scientifiquement vérifié à ce jour qui compte plus de 13 millions de personnes.

     

    Un arbre généalogique gigantesque

     

    Dans l'image ci-dessus, un arbre généalogique de 6 000 personnes nettoyé et organisé selon la théorie des graphes. Des individus s'étendant sur 7 générations sont en vert tandis que leurs liens matrimoniaux sont en rouge - Crédit : Columbia University

    Publié dans la revue Science, le nouvel ensemble de données offre un nouvel éclairage sur les 500 dernières années de mariage et de migration en Europe et en Amérique du Nord ainsi que sur le rôle des gènes dans la longévité.

    Grâce au dur labeur de nombreux généalogistes curieux de leur histoire familiale, nous avons externalisé un énorme arbre généalogique pour avoir quelque chose d’unique selon l’auteur principal de l’étude, Yaniv Erlich, informaticien à l’Université de Columbia et MyHeritage, une société de généalogie et de tests ADN qui possède Geni.com, la plate-forme qui héberge les données utilisées dans l’étude. Nous espérons que cet ensemble de données peut être utile aux scientifiques qui étudient un éventail d’autres sujets.

     

    Un arbre généalogique de 13 millions de personnes

    Les chercheurs ont téléchargé 86 millions de profils publics à partir de Geni.com, l’un des plus grands sites web de généalogie collaborative au monde et ils ont utilisé la théorie des graphes mathématiques pour nettoyer et organiser les données. Le résultat est l’apparition d’un arbre unique de 13 millions de personnes couvrant en moyenne 11 générations. S’ils voulaient compléter l’arbre, les chercheurs auraient dû remonter jusqu’à 65 générations pour connaître l’ancêtre commun. Pourtant, l’ensemble de données représente déjà une étape importante en déplaçant les recherches sur l’histoire familiale des nécrologies de journaux et des archives d’églises dans l’ère numérique ce qui permet des enquêtes au niveau de la population. Les chercheurs facilitent également la superposition d’autres ensembles de données pour étudier une gamme de tendances socio-économiques à grande échelle.

    C’est un moment passionnant pour la science citoyenne selon Melinda Mills, une démographe de l’Université d’Oxford qui n’était pas impliquée dans l’étude. Elle démontre comment des millions de personnes ordinaires sous la forme de passionnés de généalogie peuvent faire la différence. Le jeu de données détaille quand et où chaque individu est né et est mort et il reflète la démographie des individus de Geni.com avec 85 % des profils provenant d’Europe et d’Amérique du Nord. Les chercheurs ont vérifié que l’ensemble de données était représentatif du niveau d’éducation général de la population américaine en vérifiant un sous-ensemble de profils de Geni.com par rapport au registre de décès détaillé de l’État.

    Les pedigrees montrent que nous sommes tous liés les uns aux autres selon Peter Visscher, un généticien quantitatif à l’Université du Queensland qui n’a pas été impliqué dans l’étude. Ce fait est connu à partir des principes fondamentaux de l’histoire de la population, mais ce que les auteurs ont réalisé est très impressionnant.

     

    Le mariage et la migration liée à l’industrialisation

    Le mariage, la migration et la génétique liée à l’industrialisation ont profondément modifié le travail et la vie de famille et ces tendances coïncident avec le déplacement des choix matrimoniaux dans les données. Avant 1750, la plupart des Américains trouvaient un conjoint à moins de 10 kilomètres de leur lieu de naissance, mais pour ceux nés en 1950, cette distance avait atteint 100 kilomètres selon les chercheurs. Avant 1850, le mariage dans la famille était commun avec quelqu’un qui était, en moyenne, un quatrième cousin comparé au septième cousin aujourd’hui. Curieusement, les chercheurs ont constaté que de 1800 à 1850, les gens voyageaient plus loin pour trouver un compagnon, près de 19 kilomètres en moyenne, mais ils étaient plus susceptibles d’épouser un quatrième cousin ou plus proche. L’évolution des normes sociales, plutôt que l’augmentation de la mobilité, a peut-être conduit les gens à éviter les proches parents en tant que partenaires du mariage.

    Dans une observation connexe, ils ont constaté que les femmes en Europe et en Amérique du Nord ont migré plus que les hommes au cours des 300 dernières années, mais lorsque les hommes ont migré, ils ont voyagé beaucoup plus loin en moyenne.

     

    Les gènes et la longévité

    Pour tenter de comprendre le rôle de la nature et de la longévité, les chercheurs ont construit un modèle et l’ont formé sur un ensemble de données de 3 millions de parents nés de 1600 à 1910 qui avaient dépassé l’âge de 30 ans. Ils ont exclu les jumeaux et ceux qui sont morts dans la guerre civile américaine, la Première et Seconde Guerre mondiale ou dans une catastrophe naturelle (inféré si les parents sont morts à 10 jours d’intervalles).

    Ils ont comparé la durée de vie de chaque individu à celle de leurs parents et de leur degré de séparation et ils ont trouvé que les gènes expliquaient environ 16 % de la variation de longévité de leurs données sur la base des estimations précédentes qui se situaient entre 15 et 30 %. Les résultats indiquent que de bons gènes de longévité peuvent prolonger la vie de quelqu’un en moyenne de cinq ans selon Erlich. Et ce n’est pas beaucoup ajoute-t-il. Des études antérieures ont montré que le tabagisme prend 10 ans de votre vie ce qui signifie que certains choix de vie pourraient avoir beaucoup plus d’importance que la génétique.

    Significativement, l’étude montre également que les gènes, qui influencent la longévité, agissent indépendamment plutôt que d’interagir les uns avec les autres et c’est un phénomène appelé épistasie. Certains scientifiques ont utilisé l’épistasie pour expliquer pourquoi les études génomiques à grande échelle n’ont jusqu’à présent pas réussi à trouver les gènes codants pour des caractères complexes comme l’intelligence ou la longévité.

    Si certaines variantes génétiques agissent ensemble pour influencer la longévité, les chercheurs auraient observé une plus grande corrélation entre les individus étroitement apparentés qui partagent plus d’ADN et donc plus d’interactions génétiques. Cependant, ils ont trouvé un lien linéaire entre la longévité et la parenté génétique en excluant une épistasie répandue. C’est important sur le terrain, car l’épistasie a été proposée comme une source d’héritabilité manquante selon l’auteure principale de l’étude, Joanna Thornycroft au Wellcome Sanger Institute.

    Selon Visscher : C’est pertinent avec la théorie et l’inférence précédente des données SNP, mais pour une raison inconnue, de nombreux chercheurs en génétique humaine et en épidémiologie continuent à croire qu’il y a beaucoup de variation génétique non additive pour les maladies courantes et traits quantitatifs. L’ensemble de données est disponible pour la recherche académique via FamiLinx.org, un site Web créé par Erlich et ses collègues. Même si les données FamiLinx sont anonymisées, les lecteurs curieux peuvent consulter Geni.com pour voir si un membre de la famille les a peut-être ajoutés. Si c’est le cas, il y a de fortes chances qu’ils aient réussi à en faire un arbre généalogique de 13 millions de personnes.

     

    Sources

    Quantitative analysis of population-scale family trees with millions of relatives. Science. 

    http://dx.doi.org/10.1126/science.aam9309

    Published March 1, 2018. Accessed March 1, 2018.

     


    votre commentaire


    Suivre le flux RSS des articles de cette rubrique
    Suivre le flux RSS des commentaires de cette rubrique