Chimiométrie
La chimiométrie est l'application d'outils mathématiques, en particulier statistiques, pour obtenir le maximum d'informations à partir de données chimiques[1] - [2].
Partie de | |
---|---|
Pratiqué par |
Chemometrician (d) |
La chimiométrie est une discipline trÚs appliquée. Son objectif est d'améliorer le contrÎle et l'optimisation des procédés ainsi que la qualité des produits fabriqués. Son développement a été fortement accéléré par celui de la spectrométrie proche infrarouge dans les laboratoires de chimie analytique[3].
La chimiométrie se distingue des statistiques par le fait que :
- les statistiques requiĂšrent que des hypothĂšses soient vĂ©rifiĂ©es a priori. Par exemple on vĂ©rifie lâindĂ©pendance et la distribution des variables avant de rĂ©aliser une rĂ©gression linĂ©aire ;
- la chimiomĂ©trie nĂ©glige ces prĂ©cautions, car elles sont irrĂ©alisables sur les donnĂ©es quâelle traite, mais procĂšde Ă des vĂ©rifications a posteriori, sur la qualitĂ© des structures construites ou sur les performances des modĂšles.
La chimiométrie regroupe notamment[4] :
- les méthodes multivariées d'analyse de données ;
- les méthodes de régression multivariée ;
- Les méthodes de discrimination et de classification ;
- les méthodes de prétraitement du signal ;
- la validation des méthodes de mesure ;
- les plans d'expérience.
Les plans d'expériences ont pour objectif d'organiser mathématiquement les conditions expérimentales pour choisir les plus informatives, ce qui permet de minimiser le nombre d'expériences tout en maximisant l'information obtenue.
Données étudiées
L'une des grandes aires d'application de la chimiomĂ©trie est la spectroscopie infrarouge : proche et moyen infra-rouge (PIR/MIR)[5] sous diffĂ©rentes approches (multi/hyperspectral, spatial ou non). Mais d'autres donnĂ©es peuvent Ă©galement ĂȘtre Ă©tudiĂ©es : spectroscopie RMN[6], spectroscopie de masse[7], spectroscopie Raman[8].
Les signaux traitĂ©s par la chimiomĂ©trie ont gĂ©nĂ©ralement en commun que chaque variable (chaque intensitĂ© Ă une longueur d'onde donnĂ©es d'un spectre) est peu sensible vis Ă vis du phĂ©nomĂšne Ă©tudiĂ©, mais l'ensemble des variables peut l'ĂȘtre. La chimiomĂ©trie, via des opĂ©rations d'algĂšbre linĂ©aire, consiste alors Ă combiner les variables du signal, peu sensibles, pour crĂ©er de nouvelles variables appelĂ©es variables latentes, plus sensibles[9].
Méthodologie générale et bonnes pratiques
Notations
Les matrices seront représentées par des majuscules grasses, comme X. Les vecteurs, par des minuscules grasses, comme xj qui représente la j iÚme colonne de X, et les scalaires, par des minuscules italiques, comme n indiquant le nombre d'individus ou p indiquant le nombre de variables. Les données contenant les signaux décrits par p variables mesurées sur n individus seront rangées dans une matrice X de n lignes par p colonnes[10].
Apprentissage
Un grand nombre de méthodes chimiométriques ont pour but de réaliser un étalonnage (en anglais : calibration), entre un signal x (par exemple un spectre) et des grandeurs à prédire y (par exemple une concentration et une densité), au moyen d'un apprentissage. En apprentissage, on cherche à construire un modÚle mathématique à partir d'un ensemble d'échantillons sur lesquels on aura mesuré x et y, regroupés dans deux matrices, X et Y. Pour ce faire, les données sont classiquement séparées en trois groupes : le jeu d'apprentissage (Xc, Yc), le jeu de validation (Xv, Yv) et le jeu de test (Xt, Yt)[11].
Il y a deux phases dans la construction d'un modĂšle :
- Une phase d'optimisation des (hyper-)paramÚtres du modÚle (le prétraitement du signal, le nombre de plus proches voisins pour le kNN, le nombre de variables latentes dans une PLS, etc.). Un modÚle est calculé sur Xc, Yc avec des valeurs de paramÚtres données et le modÚle est ensuite testé sur Xv, Yv. Le résultat de ces tests permet de régler les paramÚtres du modÚle ;
- Une phase d'évaluation du modÚle. Un modÚle utilisant les paramÚtres déterminés à la phase d'optimisation est calculé sur (Xc+Xv, Yc+Yv) et testé sur Xt, Yt.
La phase 1 emprunte généralement une validation croisée, dans laquelle l'ensemble d'étalonnage et l'ensemble de validation sont tirés de maniÚre répétée. Plusieurs types de validation croisée existent : random blocs, jack-knife, venitian blind, leave-one-out, répétée... Le leave-one-out n'est pas recommandé car il favorise le sur-apprentissage. La validation croisée répétée est préférable.
Pendant la construction du modĂšle, on doit attacher une grande importance Ă ne pas biaiser artificiellement ses critĂšres de performances. Par exemple, tous les rĂ©plicats de mesures d'un mĂȘme Ă©chantillon ne doivent jamais ĂȘtre sĂ©parĂ©s entre le jeu d'Ă©talonnage et le jeu de validation, et le jeu test doit ĂȘtre le plus indĂ©pendant possible et reprĂ©sentatif de l'utilisation future du modĂšle.
Le schéma représente le logigramme typique de la construction d'un modÚle d'étalonnage en chimiométrie.
CritĂšres de performance et d'Ă©valuation des modĂšles
Les critÚres employés pour l'évaluation de la performance : RMSEP, le R2 (et/ou le RPD qui est relié au R2).
Les critÚres employés pour l'évaluation de la qualité : coefficient de Durbin-Watson, le T2 d'Hoteling, le coefficient Q.
Techniques et méthodes employées
Prétraitement des données
Avant d'ĂȘtre traitĂ©es par les mĂ©thodes d'exploration ou d'Ă©talonnage, les donnĂ©es ont parfois besoin d'ĂȘtre prĂ©traitĂ©es, afin d'Ă©liminer des signaux de fond indĂ©sirables, comme les effets des rĂ©flexions spĂ©culaires en spectroscopie. De nombreuses mĂ©thodes de prĂ©traitement ont Ă©tĂ© imaginĂ©es et dĂ©veloppĂ©es, tant pour gommer des altĂ©rations gĂ©nĂ©riques, comme les effets multiplicatifs ou additifs[12], que pour rĂ©soudre des problĂšmes spĂ©cifiques Ă chaque technique analytique, comme la fluorescence en spectromĂ©trie Raman[13].
Les prĂ©traitements se classent en deux grandes catĂ©gories : les prĂ©traitements basĂ©s sur des statistiques calculĂ©es sur les individus de la base de donnĂ©es (câest-Ă -dire sur les colonnes de la matrice) et les prĂ©traitements basĂ©s sur le traitement du signal de chaque individu (câest-Ă -dire sur les lignes de la matrice).
Prétraitements basés sur les statistiques des colonnes
La chimiomĂ©trie repose essentiellement sur des calculs statistiques tels que la moyenne, la variance et la covariance. Ces quantitĂ©s caractĂ©risent l'ensemble des individus sur lesquels le modĂšle sera construit. Par exemple, une PLS cherche Ă maximiser la covariance. Toutefois, les unitĂ©s utilisĂ©es pour mesurer les variables peuvent avoir des Ă©chelles non comparables. De mĂȘme, la distribution de certaines variables peut ĂȘtre trĂšs asymĂ©trique, ce qui entraĂźne des biais dans les estimations des moments statistiques. Un certain nombre de prĂ©traitements sont consacrĂ©s Ă la correction de ces distorsions. Les prĂ©traitements basĂ©s sur les statistiques des colonnes sont calculĂ©s dans l'espace des individus et sont ensuite appliquĂ©s sur chaque individu testĂ© par le modĂšle. Par consĂ©quent ils ne doivent pas ĂȘtre effectuĂ©s avant le fractionnement de l'ensemble Ă©talonnage / test. Une attention particuliĂšre doit Ă©galement ĂȘtre portĂ©e lors de la validation croisĂ©e. En effet, le prĂ©traitement doit ĂȘtre "intĂ©grĂ©" dans la boucle de validation croisĂ©e afin de le calculer et de l'appliquer Ă chaque itĂ©ration de la validation croisĂ©e.
Les méthodes les plus courantes pour corriger la distribution des variables consistent à soustraire et/ou diviser chaque colonne par une statistique calculée sur cette colonne.
Centrage par colonne
Le centrage par colonne a pour but de dĂ©finir l'origine par laquelle passe le modĂšle. Une description dĂ©taillĂ©e des diffĂ©rents modes de centrage se trouve dans Bro et Smilde[14]. Dans le plus courant, la moyenne de chaque colonne de donnĂ©es est soustraite de toutes les valeurs de cette colonne pour donner une matrice de donnĂ©es oĂč la moyenne de chaque variable prĂ©traitĂ©e est nulle. Lorsque le modĂšle, calculĂ© sur ces donnĂ©es prĂ©traitĂ©es, est appliquĂ© Ă un nouvel individu, il faut appliquer Ă cet individu le mĂȘme centrage que celui utilisĂ© par le prĂ©traitement, c'est-Ă -dire soustraire Ă cet individu la moyenne du jeu d'Ă©talonnage.
Normalisation par colonne
La normalisation des colonnes a pour but d'Ă©quilibrer les poids statistiques de toutes les colonnes. Cela revient Ă rendre les colonnes a-dimensionnelles. Il existe diffĂ©rentes mĂ©thodes pour cela. La plus courante consiste Ă donner la mĂȘme variance Ă toutes les colonnes, en les divisant par leur Ă©cart-type, aprĂšs les avoir centrĂ©es. Cela signifie que la seule information qui reste est liĂ©e aux corrĂ©lations entre les variables. Cette opĂ©ration est appelĂ©e Ă©galement « rĂ©duction » ou « autoscaling ». D'autres statistiques que l'Ă©cart-type peuvent ĂȘtre utilisĂ©es, comme la racine carrĂ©e de l'Ă©cart-type, dans le Pareto Scaling.
TrÚs rarement utilisé en spectrométrie proche infrarouge, l'autoscaling est trÚs utile lorsque les signaux porteurs d'information sont faibles et non corrélés à d'autres signaux plus forts. Ces cas peuvent se produire par exemple avec des signaux de spectrométrie de masse.
Prétraitements basés sur le traitement du signal
Les mĂ©thodes de traitement du signal sont largement utilisĂ©es pour des applications spectroscopiques, afin de corriger les donnĂ©es spectrales des effets de taille et de se concentrer sur la forme du signal. Contrairement aux mĂ©thodes basĂ©es sur les statistiques des colonnes, les prĂ©traitements basĂ©s sur le signal s'appliquent Ă chaque individu, indĂ©pendamment des autres. Ils peuvent donc en gĂ©nĂ©ral ĂȘtre effectuĂ©s avant le fractionnement des ensembles d'Ă©talonnage et de test et ne nĂ©cessitent aucune prĂ©caution en ce qui concerne la validation croisĂ©e.
Correction des lignes de base
Les spectres peuvent contenir des signaux d'arriĂšre-plan structurĂ©s qui sont gĂ©nĂ©ralement appelĂ©s lignes de base. Les lignes de base sont censĂ©es ĂȘtre des signaux continus et Ă basse frĂ©quence qui sâajoutent au signal mesurĂ©. Il existe diffĂ©rents modĂšles de ligne de base : constante, linĂ©aire, polynomiale, etc., qui ont donnĂ© lieu Ă diffĂ©rentes mĂ©thodes de correction. De plus, certains filtres de traitement du signal ont Ă©tĂ© adaptĂ©s au prĂ©traitement des spectres chimiomĂ©triques. Il y a donc de nombreuses mĂ©thodes, le choix de la meilleure dĂ©pend fortement de l'application[15].
Les méthodes de correction de ligne de base les plus courantes sont :
- la soustraction d'une valeur à tout le spectre. Par exemple en soustrayant le minimum, le spectre prétraité aura un minimum égal à 0. Cette méthode n'est pas conseillée, car elle utilise la valeur d'un seul point et a donc tendance à augmenter le bruit du spectre. De plus, cette méthode ne corrige que des lignes de base horizontales ;
- la soustraction de la moyenne du spectre Ă tout le spectre. De la sorte, le spectre rĂ©sultant a une moyenne nulle. Cette mĂ©thode est prĂ©fĂ©rable Ă la prĂ©cĂ©dente parce qu'elle propage moins de bruit, utilisant une valeur calculĂ©e Ă partir de tous les points. Par contre elle ne corrige que des lignes de base horizontales et produit des spectres avec des valeurs nĂ©gatives, ce qui peut ĂȘtre gĂȘnant pour l'application de certaines mĂ©thodes ;
- la soustraction d'une ligne calculĂ©e sur une partie du spectre. Si, par expertise, on sait qu'une zone du spectre devrait ĂȘtre nulle, ou qu'en deux points distants, le signal devrait ĂȘtre nul, alors il suffit de calculer l'Ă©quation de la droite passant par cette zone ou par les deux points et de la soustraire du spectre ;
- le detrending permet d'enlever la tendance globale sous-jacente au spectre. Une rĂ©gression est calculĂ©e entre les abscisses et le spectre, avec un modĂšle de type constant (degrĂ© 0), linĂ©aire (degrĂ© 1), ou polynomial (degrĂ© â„ 2). La courbe de tendance trouvĂ©e est enlevĂ©e du spectre. On remarque que le detrend de degrĂ© 0 est la soustraction de la moyenne. On remarque Ă©galement qu'un detrend de degrĂ© k est une projection orthogonale Ă l'espace des polynĂŽmes de degrĂ© k[16]. Detrend permet d'enlever des lignes de bases plus complexes qu'une simple droite, mais produit des valeurs nĂ©gatives, ce qui peut ĂȘtre gĂȘnant pour l'application de certaines mĂ©thodes ;
- la méthode ALS, pour Asymmetric Least Squares, identifie la ligne de base d'un spectre avec une régression des moindres carrés pénalisés. L'idée est de trouver le signal qui s'approche le mieux du spectre, au sens des moindres carrés, tout en ayant un aspect lisse, au sens d'un critÚre de fréquence. Cette méthode est particuliÚrement utile en spectrométrie Raman pour enlever les lignes de bases dues à la fluorescence.
Correction de l'Ă©chelle (scaling)
Un signal mesurĂ© x peut ĂȘtre affectĂ© par un effet multiplicatif, ce qui signifie que ax peut ĂȘtre mesurĂ© au lieu de x, avec a â 1. Dans le domaine de la chromatographie, l'effet multiplicatif peut ĂȘtre dĂ» Ă la quantitĂ© de produit analysĂ©. Dans le domaine de la RMN, la dilution du produit analysĂ© est responsable de l'effet multiplicatif. Dans le domaine du PIR, l'effet multiplicatif peut ĂȘtre dĂ» Ă la gĂ©omĂ©trie de l'appareil de mesure ou Ă la taille des particules du produit. L'effet multiplicatif est incompatible avec les outils de l'algĂšbre linĂ©aire. En effet, tout traitement de x par l'algĂšbre linĂ©aire aboutit Ă une ou plusieurs opĂ©rations matricielles comme, par exemple, t = xTP, oĂč P est une matrice de loadings. Si x est multipliĂ© par a, le rĂ©sultat t sera Ă©galement multipliĂ© par a. En d'autres termes, les effets multiplicatifs passent Ă travers les modĂšles linĂ©aires.
L'effet multiplicatif peut ĂȘtre traitĂ© en appliquant un logarithme au signal mesurĂ©. Il faut pour cela qu'aucun autre effet tel qu'une ligne de base ne soit inclus dans le signal Ă traiter.
L'utilisation de la normalisation est plus courante. La normalisation consiste Ă diviser toutes les variables du signal x par une fonction d de x, de telle sorte que d(ax) = ad(x). Ainsi, chaque ax conduira au mĂȘme signal corrigĂ© z = ax/d(ax) = x/d(x), quelle que soit la valeur de a. Bien que des mĂ©thodes de normalisation spectrale soient appliquĂ©es Ă chaque spectre individuel, certaines d'entre elles nĂ©cessitent l'ensemble des donnĂ©es pour calculer les facteurs de correction ; dans ce cas, le prĂ©traitement ne doit pas ĂȘtre effectuĂ© avant la dĂ©finition des ensembles d'Ă©talonnage et de test et une attention doit Ă©galement ĂȘtre portĂ©e en effectuant une validation croisĂ©e. Il existe diffĂ©rentes mĂ©thodes de normalisation :
- la normalisation par le maximum consiste à diviser toutes les valeurs du spectre par son maximum. L'implémentation de cette normalisation est trÚs simple. Mais elle est déconseillée car, en n'utilisant qu'une seule valeur pour estimer l'effet multiplicatif, elle propage du bruit sur le spectre ;
- la normalisation par la gamme consiste Ă diviser toutes les valeurs du spectre par la diffĂ©rence de signal entre deux points spĂ©cifiques du spectre, ou par la diffĂ©rence entre le maximum et le minimum. Cette mĂ©thode prĂ©sente lâavantage de ne pas baser lâĂ©valuation de lâeffet multiplicatif sur une seule valeur ;
- la normalisation par la norme du spectre consiste Ă diviser toutes les valeurs du spectre par la moyenne quadratique de toutes les valeurs du spectre. Cette mĂ©thode prĂ©sente lâavantage de baser lâĂ©valuation de lâeffet multiplicatif sur une statistique trĂšs stable et donc de ne pas augmenter le bruit.
- Lorsque lâeffet multiplicatif est estimĂ© en utilisant toutes les variables du signal, lâinformation portĂ©e par les pics (reliĂ©s Ă la chimie) se dilue sur lâensemble du spectre[17]. Probalistic Quotient Normalization (PQN) a Ă©tĂ© dĂ©veloppĂ©e pour rĂ©pondre Ă ce problĂšme. Elle consiste Ă :
- calculer le coefficient multiplicatif a entre chaque valeur du spectre à traiter et la valeur correspondante d'un spectre de référence,
- retenir la valeur la plus fréquente du coefficient multiplicateur.
Correction combinée de la ligne de base et de l'échelle
Les méthodes combinant la réduction de ligne de base et la mise à l'échelle des spectres sont trÚs utilisées. Ainsi :
- Standard Normal Variate (SNV)[18] enlÚve au spectre son intensité moyenne et le divise ensuite par son écart type. Cette méthode est également appelée, à juste titre, « centrage réduction en ligne » ;
- Multiplicative Scatter Correction (MSC)[12] identifie l'effet additif et l'effet multiplicatif de chaque spectre, en comparaison à un spectre de référence, puis le corrige explicitement :
- calcul de et tels que ,
- correction de : ;
- Extended Multiplicative Signal Correction (EMSC)[19] procĂšde comme MSC, mais avec des modĂšles de lignes de base plus complexe qu'une simple constante.
De la mĂȘme maniĂšre que pour les mĂ©thodes de scaling, les mĂ©thodes SNV et MSC ont tendance Ă diluer les zones porteuses d'information, comme les pics chimiques, sur l'ensemble des spectres. Ce problĂšme est connu sous le nom de « fermeture » (en anglais : closure)[20]. Pour pallier ce problĂšme, diffĂ©rentes mĂ©thodes alternatives ont Ă©tĂ© proposĂ©es[21] - [22]. Elles reposent toutes sur l'idĂ©e d'estimer les effets additifs et multiplicatifs sur les parties des spectres affectĂ©es seulement par ces effets.
Analyse de données (EDA) : méthodes non supervisées
Les méthodes non-supervisées ont pour but d'explorer un jeu de données, en mettant en avant les sources principales de variabilité, et en définissant les groupes formés par les échantillons.
ACP
Spécificité de l'ACP dans le cadre de la SPIR est de représenter les loadings de chaque composantes principales sous forme de spectre.
Autres méthodes
CANDECOMP/PARAFAC (en)
Non linéaires
PLS locale (LWPLS, local PLS), ANN, CNN, SVM.
Linéaires
PLS-DA.
Non linéaires
kNN, CAH, RF, SVM.
Multivariate Curve Resolution - Asymmetric Least Squares (MCR-ALS)
SIMPLEX.
MĂ©thode traitement signal
ICA.
Méthodes issues de la télédétection
SIMPLEX.
Méthodes particuliÚrement adaptées aux spectres
CovSel, VIP, UVE.
Détection de points atypiques dans le multi-varié
Utilisation du T2 et Q.
Quelques exemples d'applications
Utilisation de la SPIR pour caractériser des matiÚres complexes (plantes, aliments, déchets organiques, sols)
- Différentes caractéristiques sont prédites sur les céréales et graines : la teneur en protéines, composition en acides aminés ou acides gras[23].
- Différentes caractéristiques sont également prédites sur les sols[24] : matiÚre organique, texture, minéraux, CEC, matiÚre sÚche, pH, contaminations[25].
- Le FlashBMP[26] - [27] a été développé pour prédire le potentiel biochimique de méthane (BMP) sur divers déchets organiques destinés à la méthanisation (boues urbaines, déchets agroalimentaires, déchets cantine). L'application nécessite aujourd'hui une étape de lyophilisation et broyage de la matiÚre.
Références
- (en) Svante Wold, « Chemometrics; what do we mean with it, and what do we want from it? », Chemometrics and Intelligent Laboratory Systems, vol. 30, no 1,â , p. 109â115 (ISSN 0169-7439, DOI 10.1016/0169-7439(95)00042-9).
- (en) Kim Esbensen et Paul Geladi, « The start and early history of chemometrics: Selected interviews. Part 2 », Journal of Chemometrics, vol. 4, no 6,â , p. 389â412 (ISSN 0886-9383 et 1099-128X, DOI 10.1002/cem.1180040604).
- (en) H. M. Heise et R. Winzen, « Chemometrics in Near-Infrared Spectroscopy », dans Near-Infrared Spectroscopy, Wiley-VCH Verlag (ISBN 9783527612666, lire en ligne), p. 125â162.
- (en) Comprehensive Chemometrics : chemical and biochemical data analysis, Amsterdam, Elsevier, (ISBN 978-0-444-52701-1, lire en ligne).
- http://math.agrocampus-ouest.fr/infoglueDeliverLive/digitalAssets/41740_Poly_Bertrand_2008.pdf
- https://tel.archives-ouvertes.fr/tel-01341959/document
- https://tel.archives-ouvertes.fr/tel-00685887/document
- https://serval.unil.ch/resource/serval:BIB_DD70B27E1A48.P003/REF.pdf
- https://agritrop.cirad.fr/567909/1/document_567909.pdf
- Carl Meyer, Matrix Analysis and Applied Linear Algebra, SIAM, , 718 p. (ISBN 978-0-89871-454-8, lire en ligne).
- B.G.M. Vandeginste, D.L. Massart, L.M.C. Buydens et S. De Jong, « Introduction to Part B », dans Data Handling in Science and Technology, Elsevier, (ISBN 978-0-444-82853-8, lire en ligne), p. 1â5.
- Tomas Isaksson et Tormod NĂŠs, « The Effect of Multiplicative Scatter Correction (MSC) and Linearity Improvement in NIR Spectroscopy », Applied Spectroscopy, vol. 42, no 7,â , p. 1273â1284 (ISSN 0003-7028 et 1943-3530, DOI 10.1366/0003702884429869).
- Nils Kristian Afseth, Vegard Herman Segtnan et Jens Petter Wold, « Raman Spectra of Biological Samples: A Study of Preprocessing Methods », Applied Spectroscopy, vol. 60, no 12,â , p. 1358â1367 (ISSN 0003-7028 et 1943-3530, DOI 10.1366/000370206779321454).
- Rasmus Bro et Age K. Smilde, « Centering and scaling in component analysis », Journal of Chemometrics, vol. 17, no 1,â , p. 16â33 (ISSN 0886-9383 et 1099-128X, DOI 10.1002/cem.773).
- Kristian Hovde Liland, Trygve AlmĂžy et BjĂžrn-Helge Mevik, « Optimal Choice of Baseline Correction for Multivariate Calibration of Spectra », Applied Spectroscopy, vol. 64, no 9,â , p. 1007â1016 (ISSN 0003-7028 et 1943-3530, DOI 10.1366/000370210792434350).
- Jean-Claude Boulet et Jean-Michel Roger, « Pretreatments by means of orthogonal projections », Chemometrics and Intelligent Laboratory Systems, vol. 117,â , p. 61â69 (ISSN 0169-7439, DOI 10.1016/j.chemolab.2012.02.002).
- Gilles Rabatel, Federico Marini, Beata Walczak et JeanâMichel Roger, « VSN: Variable sorting for normalization », Journal of Chemometrics,â (ISSN 0886-9383 et 1099-128X, DOI 10.1002/cem.3164).
- R. J. Barnes, M. S. Dhanoa et Susan J. Lister, « Standard Normal Variate Transformation and De-Trending of Near-Infrared Diffuse Reflectance Spectra », Applied Spectroscopy, vol. 43, no 5,â , p. 772â777 (ISSN 0003-7028 et 1943-3530, DOI 10.1366/0003702894202201).
- Harald Martens et Edward Stark, « Extended multiplicative signal correction and spectral interference subtraction: New preprocessing methods for near infrared spectroscopy », Journal of Pharmaceutical and Biomedical Analysis, vol. 9, no 8,â , p. 625â635 (ISSN 0731-7085, DOI 10.1016/0731-7085(91)80188-f).
- M. Bylesjö, O. Cloarec et M. Rantalainen, « Normalization and Closure », dans Comprehensive Chemometrics, Elsevier, (ISBN 978-0-444-52701-1, lire en ligne), p. 109â127.
- Q Guo, W Wu et D.L Massart, « The robust normal variate transform for pattern recognition with near-infrared data », Analytica Chimica Acta, vol. 382, nos 1-2,â , p. 87â103 (ISSN 0003-2670, DOI 10.1016/s0003-2670(98)00737-5).
- Gilles Rabatel, Federico Marini, Beata Walczak et JeanâMichel Roger, « VSN: Variable sorting for normalization », Journal of Chemometrics,â (ISSN 0886-9383 et 1099-128X, DOI 10.1002/cem.3164).
- DerniĂšres publications dans ce domaine.
- Bo Stenberg, Raphael A. Viscarra Rossel, Abdul Mounem Mouazen et Johanna Wetterlind, « Chapter Five - Visible and Near Infrared Spectroscopy in Soil Science », dans Advances in Agronomy, vol. 107, Academic Press, (DOI 10.1016/s0065-2113(10)07005-7, lire en ligne), p. 163â215.
- DerniĂšres publications dans ce domaine.
- « Méthodes de Chimiométrie et Machine Learning / Ondalys », sur Ondalys (consulté le ).
- M. Lesteur, E. Latrille, V. Bellon Maurel et J. M. Roger, « First step towards a fast analytical method for the determination of Biochemical Methane Potential of solid wastes by near infrared spectroscopy », Bioresource Technology, vol. 102, no 3,â , p. 2280â2288 (ISSN 0960-8524, DOI 10.1016/j.biortech.2010.10.044, lire en ligne, consultĂ© le ).