Skip to main content

An improved method for predicting the accuracy of genetic stock identification

Buy Article:

$50.00 plus tax (Refund Policy)


Estimating the accuracy of genetic stock identification (GSI) that can be expected given a previously collected baseline requires simulation. The conventional method involves repeatedly simulating mixtures by resampling from the baseline, simulating new baselines by resampling from the baseline, and analyzing the simulated mixtures with the simulated baselines. We show that this overestimates the predicted accuracy of GSI. The bias is profound for closely related populations and increases as more genetic data (loci and (or) alleles) are added to the analysis. We develop a new method based on leave-one-out cross validation and show that it yields essentially unbiased estimates of GSI accuracy. Applying both our method and the conventional method to a coastwide baseline of 166 Chinook salmon (Oncorhynchus tshawytscha) populations shows that the conventional method provides severely biased predictions of accuracy for some individual populations. The bias for reporting units (aggregations of closely related populations) is moderate, but still present.

L’estimation de la précision de l’identification du stock génétique (« GSI ») qu’on peut espérer, étant donné une banque de données de base récoltée antérieurement, nécessite des simulations. La méthode courante comprend des simulations répétées de mélanges par ré-échantillonnage de la banque de données de base, des simulations de nouvelles banques de données de base en ré-échantillonnant la banque de données et l’analyse des mélanges ainsi simulés à l’aide des banques de données de base simulées. Nous montrons que cette méthode surestime la précision prédite de GSI. L’erreur est importante dans les populations fortement apparentées et elle augmente à mesure que de nouvelles données génétiques (locus et (ou) allèles) sont ajoutées à l’analyse. Nous mettons au point une nouvelle méthode basée sur une validation croisée de type « leave-one-out » (avec retrait d’un élément) et nous montrons qu’elle produit essentiellement des estimations non erronées de la précision de GSI. L’application de notre méthode et de la méthode courante à une banque de données de base provenant de 166 populations de saumons chinook (Oncorhynchus tshawytscha) réparties sur toute la côte montre que la méthode courante fournit des prédictions de la précision qui sont grandement faussées pour certaines populations individuelles. L’erreur dans le cas des unités d’évaluation (des rassemblements de populations fortement apparentées) est peu importante, mais réelle.

Document Type: Research Article

Publication date: July 1, 2008

More about this publication?
  • Published continuously since 1901 (under various titles), this monthly journal is the primary publishing vehicle for the multidisciplinary field of aquatic sciences. It publishes perspectives (syntheses, critiques, and re-evaluations), discussions (comments and replies), articles, and rapid communications, relating to current research on cells, organisms, populations, ecosystems, or processes that affect aquatic systems. The journal seeks to amplify, modify, question, or redirect accumulated knowledge in the field of fisheries and aquatic science. Occasional supplements are dedicated to single topics or to proceedings of international symposia.
  • Information for Authors
  • Submit a Paper
  • Subscribe to this Title
  • Terms & Conditions
  • Sample Issue
  • Reprints & Permissions
  • ingentaconnect is not responsible for the content or availability of external websites

Access Key

Free Content
Free content
New Content
New content
Open Access Content
Open access content
Subscribed Content
Subscribed content
Free Trial Content
Free trial content
Cookie Policy
Cookie Policy
ingentaconnect website makes use of cookies so as to keep track of data that you have filled in. I am Happy with this Find out more