Skip to main content

On the selection of samples for multivariate regression analysis: application to near-infrared (NIR) calibration models for the prediction of pulp yield in Eucalyptus nitens

Buy Article:

$50.00 plus tax (Refund Policy)

Abstract:

The effects of using reduced calibration sets on the development of near-infrared (NIR) calibration models for the prediction of kraft pulp yield in Eucalyptus nitens (Dean & Maiden) Maiden trees were explored. Three selection techniques based on NIR spectral data (CADEX (computer-aided design of experiments), DUPLEX, and SELECT algorithms) and one selection method based on a measured property (RANKING algorithm) were used for analysis and compared against a model using all data. The effect of using calibration sets of different sizes was also evaluated. All sample-selection methods resulted in models of similar performance compared with the model fitted using all samples. For calibration purposes, RANKING selection resulted in models with the lowest errors of cross-validation, followed by the DUPLEX, CADEX, and SELECT methods. In terms of validation, the SELECT and CADEX methods resulted in lower errors of prediction compared with the DUPLEX and RANKING algorithms. In general, cross-validation and prediction errors decreased as the number of calibration samples increased. These results show that it is possible to obtain adequate NIR calibration models with a reduced number of samples allowing the remaining samples to be used for model validation and that sample selection based on NIR spectral data alone is as successful as selection based on a measured property.

Les effets liés à l’utilisation d’ensembles réduits de données de calibration sur le développement de modèles de calibration avec des données spectrales dans le proche infrarouge (PIR) pour prédire le rendement en pâte kraft des tiges d’Eucalyptus nitens (Dean & Maiden) ont été étudiés. Trois méthodes de sélection basées sur des données spectrales dans le PIR (algorithmes CADEX, DUPLEX et SELECT) et une méthode de sélection basée sur une propriété mesurée (algorithme d’ordonnancement) ont été utilisées pour l’analyse et comparées avec un modèle utilisant toutes les données. L’effet lié à l’utilisation d’ensembles de données de calibration de différentes tailles a également été évalué. Toutes les méthodes de sélection de l’échantillon ont produit des modèles dont la performance était similaire comparativement au modèle utilisant toutes les données. Pour des fins de calibration, les modèles basés sur la sélection par ordonnancement avaient les plus petites erreurs de validation croisée suivis par les modèles basés sur les méthodes de sélection utilisant les algorithmes DUPLEX, CADEX et SELECT. En termes de validation, l’erreur de prédiction était la plus faible avec les méthodes de sélection qui utilisaient les algorithmes SELECT et CADEX comparativement à celles qui utilisaient les algorithmes DUPLEX et d’ordonnancement. Généralement, les erreurs de validation croisée et de prédiction diminuaient à mesure que le nombre d’échantillons servant à la calibration augmentait. Ces résultats montrent qu’il est possible d’obtenir des modèles de calibration adéquats pour les données spectrales dans le PIR avec un nombre réduit d’échantillons permettant ainsi d’utiliser les échantillons restants pour valider le modèle et que la sélection des échantillons basée seulement sur des données spectrales dans le PIR est aussi valable que la sélection basée sur une propriété mesurée.

Document Type: Research Article

Publication date: October 1, 2008

More about this publication?
  • Published since 1971, this monthly journal features articles, reviews, notes and commentaries on all aspects of forest science, including biometrics and mensuration, conservation, disturbance, ecology, economics, entomology, fire, genetics, management, operations, pathology, physiology, policy, remote sensing, social science, soil, silviculture, wildlife and wood science, contributed by internationally respected scientists. It also publishes special issues dedicated to a topic of current interest.
  • Information for Authors
  • Submit a Paper
  • Subscribe to this Title
  • Terms & Conditions
  • Sample Issue
  • Reprints & Permissions
  • Ingenta Connect is not responsible for the content or availability of external websites
nrc/cjfr/2008/00000038/00000010/art00008
dcterms_title,dcterms_description,pub_keyword
6
5
20
40
5

Access Key

Free Content
Free content
New Content
New content
Open Access Content
Open access content
Subscribed Content
Subscribed content
Free Trial Content
Free trial content
Cookie Policy
X
Cookie Policy
Ingenta Connect website makes use of cookies so as to keep track of data that you have filled in. I am Happy with this Find out more