Discovering human germ cell mutagens with whole genome sequencing: Insights from power calculations reveal the importance of controlling for between-family variability

Simple item page

Simple item page

Full item details

dc.contributor.author
Webster, R.J.
Williams, A.
Marchetti, F.
Yauk, C.L.
dc.date.accessioned
2024-04-19T20:16:54Z
dc.date.available
2024-04-19T20:16:54Z
dc.date.issued
2018-04-20
dc.description - en
Health Canada (HC) is responsible for assessing the health risks posed by chemical exposures. In support of its mandate, HC works to develop and optimize methods that can be used to identify/characterize chemically induced health effects. HC is pioneering the use of genomic technologies to determine if there are environmental exposures that cause genetic changes in parents that can be transmitted to their children. Each human cell contains a genome with a set of genetic instructions. If environmental exposures induce genetic changes (mutations) in sperm or eggs, these may be passed on to the child at conception. Offspring with more mutations have higher rates of genetic diseases. HC is exploring whether whole genome sequencing can be used to compare genetic information of father-mother-offspring trios to detect unexpected genetic changes. Before this work can be done, analyses are required to determine the number of children/families required to detect statistically significant changes in mutations in an exposed group. Such analyses, termed power calculations, are also used to identify the most appropriate statistical model. In this study, the results showed that when both paternal age and between-family variability in mutation rates is statistically controlled for, the effects of an exposure can be detected with 4 to 28 families per treatment group, using a ‘generalised mixed model’. The most powerful models sampled four siblings per family. Using two siblings also controls a modest amount of family variability, providing more power and reducing the samples sizes compared to a study design that only uses one child per family. Overall, this study shows that genome sequencing is a feasible approach to identify environmental chemicals that affect heritable mutation rates. The results are being used to inform the experimental design for sequencing studies aiming to identify environmental exposures that cause heritable effects in humans.
dc.description.abstract - en
Mutations in germ cells pose potential genetic risks to offspring. However, de novo mutations are rare events that are spread across the genome and are difficult to detect. Thus, studies in this area have generally been under-powered, and no human germ cell mutagen has been identified. Whole Genome Sequencing (WGS) of human pedigrees has been proposed as an approach to overcome these technical and statistical challenges. WGS enables analysis of a much wider breadth of the genome than traditional approaches. Here, we performed power analyses to determine the feasibility of using WGS in human families to identify germ cell mutagens. Different statistical models were compared in the power analyses (ANOVA and multiple regression for one-child families, and mixed effect model sampling between two to four siblings per family). Assumptions were made based on parameters from the existing literature, such as the mutation-by-paternal age effect. We explored two scenarios: a constant effect due to an exposure that occurred in the past, and an accumulating effect where the exposure is continuing. Our analysis revealed the importance of modeling inter-family variability of the mutation-by-paternal age effect. Statistical power was improved by models accounting for the family-to-family variability. Our power analyses suggest that sufficient statistical power can be attained with 4–28 four-sibling families per treatment group, when the increase in mutations ranges from 40 to 10% respectively. Modeling family variability using mixed effect models provided a reduction in sample size compared to a multiple regression approach. Much larger sample sizes were required to detect an interaction effect between environmental exposures and paternal age. These findings inform study design and statistical modeling approaches to improve power and reduce sequencing costs for future studies in this area.
dc.description.abstract-fosrctranslation - fr
Les mutations des cellules germinales présentent des risques génétiques potentiels pour la progéniture. Cependant, les mutations de novo sont des événements rares qui se propagent à travers le génome et sont difficiles à détecter. Ainsi, les études dans ce domaine ont généralement manqué de puissance et aucun agent mutagène sur les cellules germinales humaines n’a été identifié. Le séquençage du génome entier (WGS) des pedigrees humains a été proposé comme approche pour surmonter ces défis techniques et statistiques. WGS permet l’analyse d’une étendue beaucoup plus large du génome que les approches traditionnelles. Ici, nous avons effectué des analyses de puissance pour déterminer la faisabilité de l'utilisation du WGS dans des familles humaines afin d'identifier les mutagènes des cellules germinales. Différents modèles statistiques ont été comparés dans les analyses de puissance (ANOVA et régression multiple pour les familles à un enfant, et échantillonnage de modèles à effets mixtes entre deux à quatre frères et sœurs par famille). Des hypothèses ont été formulées sur la base de paramètres de la littérature existante, tels que l'effet de mutation en fonction de l'âge paternel. Nous avons exploré deux scénarios : un effet constant dû à une exposition survenue dans le passé et un effet cumulatif lorsque l'exposition se poursuit. Notre analyse a révélé l'importance de modéliser la variabilité interfamiliale de l'effet mutation selon l'âge paternel. La puissance statistique a été améliorée par des modèles tenant compte de la variabilité familiale. Nos analyses de puissance suggèrent qu'une puissance statistique suffisante peut être obtenue avec 4 à 28 familles de quatre frères et sœurs par groupe de traitement, lorsque l'augmentation des mutations varie respectivement de 40 à 10 %. La modélisation de la variabilité familiale à l'aide de modèles à effets mixtes a permis de réduire la taille de l'échantillon par rapport à une approche de régression multiple. Des échantillons beaucoup plus grands étaient nécessaires pour détecter un effet d’interaction entre les expositions environnementales et l’âge paternel. Ces résultats éclairent la conception des études et les approches de modélisation statistique pour améliorer la puissance et réduire les coûts de séquençage pour les études futures dans ce domaine.
dc.description.fosrctranslation - fr
Santé Canada (SC) est responsable de l'évaluation des risques pour la santé posés par l'exposition à des produits chimiques. À l'appui de son mandat, SC travaille à développer et à optimiser des méthodes qui peuvent être utilisées pour identifier/caractériser les effets sur la santé d'origine chimique. SC est un pionnier dans l'utilisation des technologies génomiques pour déterminer s'il existe des expositions environnementales qui provoquent des changements génétiques chez les parents qui peuvent être transmis à leurs enfants. Chaque cellule humaine contient un génome avec un ensemble d'instructions génétiques. Si les expositions environnementales induisent des modifications génétiques (mutations) dans les spermatozoïdes ou les ovules, celles-ci peuvent être transmises à l'enfant dès la conception. La progéniture avec plus de mutations présente des taux plus élevés de maladies génétiques. SC étudie la possibilité d’utiliser le séquençage du génome entier pour comparer les informations génétiques des trios père-mère-progéniture afin de détecter des changements génétiques inattendus. Avant que ce travail puisse être effectué, des analyses sont nécessaires pour déterminer le nombre d’enfants/familles requis pour détecter des changements statistiquement significatifs dans les mutations dans un groupe exposé. De telles analyses, appelées calculs de puissance, sont également utilisées pour identifier le modèle statistique le plus approprié. Dans cette étude, les résultats ont montré que lorsque l’âge paternel et la variabilité interfamiliale des taux de mutation sont statistiquement contrôlés, les effets d’une exposition peuvent être détectés avec 4 à 28 familles par groupe de traitement, en utilisant un « modèle mixte généralisé ». Les modèles les plus puissants échantillonnaient quatre frères et sœurs par famille. L'utilisation de deux frères et sœurs contrôle également une modeste quantité de variabilité familiale, fournissant plus de puissance et réduisant la taille des échantillons par rapport à une conception d'étude qui n'utilise qu'un seul enfant par famille. Dans l’ensemble, cette étude montre que le séquençage du génome constitue une approche réalisable pour identifier les produits chimiques environnementaux qui affectent les taux de mutation héréditaire. Les résultats sont utilisés pour éclairer la conception expérimentale des études de séquençage visant à identifier les expositions environnementales qui provoquent des effets héréditaires chez l'homme.
dc.identifier.doi
https://doi.org/10.1016/j.mrgentox.2018.04.004
dc.identifier.uri
https://open-science.canada.ca/handle/123456789/2359
dc.language.iso
en
dc.publisher
Elsevier
dc.subject - en
Health
Health and safety
dc.subject - fr
Santé
Santé et sécurité
dc.subject.en - en
Health
Health and safety
dc.subject.fr - fr
Santé
Santé et sécurité
dc.title - en
Discovering human germ cell mutagens with whole genome sequencing: Insights from power calculations reveal the importance of controlling for between-family variability
dc.type - en
Article
dc.type - fr
Article
Download(s)

Original bundle

Now showing 1 - 1 of 1

Thumbnail image

Name: Discovering human germ cell mutagens with whole genome sequencing - Insights from power calculations reveal the importance of controlling for between-family variability.pdf

Size: 1.16 MB

Format: PDF

Download file

Page details

Date modified: