• Facebook
  • LinkedIn
  • KONTAKT
  • ANNONCERING
  • OM KEMIFOKUS
  • PARTNERLOGIN

KemiFOKUS

Fokus på kemi

  • Analytisk kemi
  • Arbejdsmiljø/Indeklima
  • Biokemi
  • Biologi
  • Bioteknologi
  • Branchenyt
  • Energi
  • Fødevarekemi
  • Historisk kemi
  • Kemiteknik
  • Kemometri
  • Klikkemi
  • Klima og miljø
  • Lovgivning og patenter
  • Medicinalkemi
  • Nanoteknologi
  • Organisk kemi
  • Artikler fra Dansk Kemi

Kemometri01. 11. 2008 | Katrine Meyn

Arbejdshesten i multivariat kalibrering: Partial Least Squares

Kemometri01. 11. 2008 By Katrine Meyn

Partial Least Squares (PLS) regression er et alternativ til Principal Component Regression. Det handler bl.a. om, hvordan man handler bedst i et supermarked.

Læs originalartiklen her

Artiklen har været bragt i Dansk Kemi nr. 11, 2008 og kan læses uden illustrationer, strukturer og ligninger herunder. Se relaterede artikler nederst på siden.

Af Lars Nørgaard, Rasmus Bro & Søren Balling Engelsen, Institut for Fødevarevidenskab, Det Biovidenskabelige Fakultet, Københavns Universitet

Vi vil her introducere Partial Least Squares (PLS) regression som et alternativ til Principal Component Regression (PCR). Baggrunden for at introducere en ny regressionsmetode er følgende: PCR er en totrins metode, hvor man først beregner scores (T) fra en data-tabel X (f.eks. NIR spektre) og dernæst laver en regressionsmodel til den afhængige variabel (y, f.eks. kvalitet). Det svarer til, at man går ind i et supermarked (X), indkøber varer i forskellige afdelinger som frugt & grønt, kød, desserter, vine etc., og først når varerne er betalt, får man at vide hvilken menu (y), man skal lave til middagen. Det er klart, at når man først vælger informationen i T uden at tænke på, hvad den skal bruges til, så risikerer man, at kalibreringsmodellen, der relaterer T til y, bliver unødigt kompliceret.
PLS er opstået som et alternativ til denne måde at lave regressionsanalyse på: i PLS-regression anvendes y direkte til at finde den relevante information T i X; y indgår således i første trin af PLS-algoritmen, og ikke først senere. Dette svarer til, at man går ind i supermarkedet med menuen i hånden og derfor har mulighed for at indkøbe præcis de varer, man skal bruge. Man skal således ikke sikre sig, at al relevant information i X er repræsenteret i T, men kan nøjes med at uddrage den relevante information. Dermed bliver modellen nemmere at fortolke og forstå, og dette aspekt er ofte centralt i forhold til at optimere og udvikle en analyse.
PLS-regression anvendes nu på data fra ølproduktion, og sammenlignes med en PCR-model på de samme data (beskrevet i en tidligere klumme i Dansk Kemi, nr. 8, 2008).

Øldata
Fyrre prøver bestående af forskellige øl er analyseret for ekstraktindhold i % plato med en laboratoriemetode. Ekstrakt er en vigtig kvalitetsparameter i bryggeriindustrien og indikerer gærens potentiale til at danne alkohol. Ekstraktprocenten varierer fra 4,2-18,8% plato. De samme fyrre prøver er ligeledes målt med visuel- og nærinfrarød spektroskopi i området 400 nm til 1400 nm med to nanometers interval, dvs. 501 spektrale variable. Prøverne er afgasset inden måling på et NIRSystems 6500 spektrofotometer i en 30 mm kuvette. Spektrofotometeret anvender et delt detektorsystem med siliciumbaseret detektor i området 400 nm til 1100 nm og blysulfid detektor (PbS) i området 1100 nm til 2500 nm. Figur 1 viser de centrerede spektre for alle prøver farvet efter ekstraktkoncentrationen.
Hvert spektrum er farvekodet efter ekstraktindholdet, og for de centrerede data er det tydeligt, at ekstraktkoncentrationen, som forventet, afspejles bedre i det nærinfrarøde spektrale område (f.eks. omkring 1200 nm) sammenlignet med det synlige (f.eks. omkring 500 nm). Selvom der tydeligvis er mest variation i det synlige område, er informationen i dette område åbenbart ikke relevant for ekstrakt.

PLS versus PCR
Der beregnes nu en PLS-model på de givne data med NIR-spektrene som X og ekstrakt som y. Helt analogt til PCR beregnes et antal PLS-komponenter; disse kaldes helt specifikt PLS-komponenter for at understrege, at de ikke er lig med de principale komponenter.
Forskellene mellem PLS og PCR kan illustreres ved inspektion af de forklarede varianser i X og y for fem komponenter for både PLS og PCR; disse kan ses i tabel 1. For både PCR og PLS ses, at første komponent ikke forklarer en særlig stor del af ekstraktvariationen. Dette er egentlig lidt i modstrid med, hvad man ville forvente, specielt for PLS. Første komponent forventes at være den vigtigste komponent, da PLS netop i første komponent leder efter den variation i spektrene som er mest relateret til ekstrakt. Årsagen til den lidt besynderlige første komponent vil vi vende tilbage til i en senere klumme omkring variabel-selektion.
Bevæger vi os videre til anden komponent, så ser vi at anden PLS-komponent forklarer mere af ekstraktvariationen end PCR, og dette er netop fordelen ved PLS. De komponenter man finder i PLS er mere relevante for y end tilfældet er for PCR.
For fem komponenter beskriver PLS-modellen 98,7%, mens PCR beskriver 94,7%. For X forholder det sig omvendt: forklaret X-varians i PCR-modellen vil altid være højere end for PLS-modellen, fordi PCA netop finder præcis de komponenter, der bedst muligt beskriver – alt i – X.
I figur 2 ses hvorledes ekstrakt bliver estimeret ud fra henholdsvis en fire- og fem-komponent PLS-model. Korrelationskoefficienten mellem estimeret og målt er hhv. 0,96 og 0,99 for de to modeller. Valget af antal komponenter er vigtigt, for selvom prædiktionerne fra fem-komponent-modellen ser bedst ud, så er vi interesseret i at modellen er bedst på nye prøver. Og det er ikke sikkert, at det er fem-komponent-modellen, der vil være bedst på nye prøver, blot fordi den er god til at prædiktere de prøver, der blev brugt til at lave modellen. Vi vil senere se på teknikker til objektivt at afgøre, hvor mange komponenter man skal bruge.
En PLS-model giver de samme diagnostiske redskaber som PCR. Man får scores, loadings, regressionskoefficienter og residualer. Disse kan bruges til fortolkning, til validering og til at finde mulige outliere.
Forskellene mellem en PLS-model og en PCR-model er sjældent dramatiske, mht. hvor godt man prædikterer, men oftest anvender man et lavere antal komponenter i PLS-modellen. PLS kan især have en fordel, hvis det er små variationer i X, der er relevante for y, mens PCR kan have en fordel, hvis y er meget støjfyldt, da y anvendes to gange i PLS-algoritmen. Der findes ydermere en variant af PLS kaldet PLS2, som kan bruges, når man har mange forskellige y-variable. Det kunne f.eks. være, at man ville prædiktere udbytte, spild og energiforbrug. Ved hjælp af PLS2 kan man lave disse tre forskellige modeller på én gang og således få mulighed for direkte at forstå, hvorledes de tre forskellige kvalitetsparametre spiller sammen. Dermed kan man f.eks. lettere finde det rette kompromis, som kun maksimerer udbyttet i den grad, det ikke går dramatisk ud over energiforbrug.
En dansk indføring i PLS og multivariabel kalibrering kan findes i reference [1].

PLS algoritme
En enkel version af PLS-algoritmen ses nedenfor. Der findes andre mere optimale versioner, men nedenstående viser hvordan y involveres i modelleringen straks fra start:

1. Centrér eller autoskalér X og y

2. Løs X = yw’ + E1 mht. w
Løsning: “w = X/y” eller w=X’y(y’y)-1
Normalisér w til længde én

3. Løs X = tw’ + E2 mht. t
Løsning: “t = X/w” eller t=Xw(w’w)-1
dvs. t=Xw da |w|=1

4. Løs X = tp’ + E3 mht. p
Løsning: “p = X/t” eller p=X’t(t’t)-1

5. Løs y = tbscore1 + ey mht. bscore1
Løsning: “bscore1 = y/t” eller bscore1=(t’t)-1t’y

6. Xny = X – tp’ (= EX)
yny = y – tbscore1 (= ey)
bPLScores=[bscore1, bscore2 … bscoreA]

7. Start fra trin 2 med Xny og yny for at beregne næste PLS-komponent
(op til det søgte antal komponenter)

Outro
PLS anvendes dagligt i rigtig mange industrielle korn- og mejeriapplikationer baseret på NIR og IR, men metoden kan anvendes på alle typer af multivariate data, hvor man ønsker at sammenkoble og fortolke information fra to matricer.

Tabel 1. Forklaret %-varians for X og y i en PLS og PCR-model af øldata.

Figur 1. A)(skal der være et ”A” her???) Centrerede absorptionsspektre for fyrre ølprøver i det spektrale område 400-1400 nm målt med 2 nm’s interval; dvs. i alt 501 spektrale variable er registreret. Spektrene er farvet efter prøvens ekstraktkoncentration, og området fra 1100 nm til 1375 nm ses at afspejle ekstraktkoncentrationen bedre end det synlige område.

Figur 2. Estimerede ekstrakt % værdier baseret på nærinfrarød spektroskopi og PLS sammenlignet med de målte laboratorieværdier. A) Fire-komponent PLS-model. B) Fem-komponent PLS-model.

Referencer
1. R. Bro, Håndbog i multivariabel kalibrering, Jordbrugsforlaget, 1996 (ISBN: 8774324586).

Skrevet i: Kemometri

Seneste nyt fra redaktionen

Chemical ionization mass spectrometry in atmospheric studies

Analytisk kemiArtikler fra Dansk KemiTop09. 05. 2025

Advances in chemical ionization mass spectrometry can improve our understanding of atmospheric composition. Artiklen har været bragt i Dansk Kemi nr. 2, 2025 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Varun Kumar, Institut for

Gamle processer, nye muligheder: Nyt kemisk-biologisk koncept til CO2-fangst og omdannelse

AktueltArtikler fra Dansk KemiBioteknologi02. 05. 2025

Oldgamle CO2-ædende mikroorganismer kan fange CO2 direkte fra skorstensrøg og omdanne kulstoffet til grønne molekyler. Artiklen har været bragt i Dansk Kemi nr. 2, 2025 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Mads Ujarak Sieborg1 og

Atmosfærisk transport af PFAS til Højarktis

AktueltArtikler fra Dansk KemiKlima og miljø28. 04. 2025

Tilstedeværelsen af PFAS-forbindelser skyldes ikke kun lokale kilder, men de kan langtransporteres i luften til selv meget fjerntliggende arktiske egne. Artiklen har været bragt i Dansk Kemi nr. 2, 2025 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen

Biotek-firma bag fedme-medicin på tabletform har lagt en klar plan om samarbejde eller opkøb

AktueltMedicinalkemi21. 04. 2025

I dag er det frem med nålen, hvis man er i behandling med diverse former for fedme-medicin. Det hæmmer imidlertid udbredelsen på specielt asiatiske og afrikanske markeder, hvor der er en udtalt nålefobi. Derfor arbejder det danskstiftede biotekselskab Pila Pharma med at få udvikle deres

Dansk virksomhed vil vende produktionen af ammoniak på hovedet – ned i en lille container

AktueltBioteknologiFødevarekemi07. 04. 2025

NitroVolt, en dansk biotech-virksomhed, vil vende produktionen af ammoniak på hovedet. I stedet for den velkendte løsning, der bygger på den energitunge Haber-Bosch-proces, vil produktionen nu foregå i en container, der fx kan stå direkte ude hos en landmand. Ammoniak til kunstgødning er en slags

En EU-historie om nomenklatur – og ginseng til hunde, katte og heste!

AktueltArtikler fra Dansk KemiHistorisk kemi01. 04. 2025

Artiklen har været bragt i Dansk Kemi nr. 6, 2024 og kan læses uden illustrationer, strukturer og ligninger herunder. Læs originalartiklen her Nomenklaturudvalget får indimellem henvendelser om dansk kemisk nomenklatur fra de oversættere i EU, hvis opgave det er at oversætte EU-lovgivning på

Tysk elektrolyseanlæg er som det første i verden blevet integreret direkte i kemisk produktion

AktueltEnergi31. 03. 2025

Efter en byggeperiode på omkring to år, er BASF nye 54 megawatt elektrolyseanlæg blevet indviet. Udover at være Tyskland største, med en kapacitet til at producere op til 8.000 ton grøn brint årligt, skriver det også historie på et andet område. Brinten skal primært anvendes som råmateriale i

Dansk innovation blander sig i toppen over lande med de fleste patentansøgninger

AktueltBranchenyt31. 03. 2025

Danske virksomheder er fortsat nogle af de mest aktive i Europa til at innovere. Det viser nye tal fra Den Europæiske Patentmyndighed, EPO, som udsteder patenter, der kan dække i op til 45 lande. Vestas, Novozymes og Danmarks Tekniske Universitet har leveret de største bidrag til, at Danmark kan

Ny grundbog tager studerende på videregående uddannelser ind i den basale kemi

Branchenyt26. 03. 2025

Hvad er kemi? Hvad er de teoretiske perspektiver ved kemi? Og hvordan påvirker kemi vores hverdagsliv? Det er udgangspunktet for en ny grundbog til de studerende på de videregående uddannelser, som giver en introduktion til almen, uorganisk og organisk kemi. Bogen gennemgår, hvordan stoffer,

Nedrivningsarbejdere i kontakt med PCB slipper med skrækken – kun lave niveauer i blodet

Arbejdsmiljø/IndeklimaKlima og miljø25. 03. 2025

Ingen alarm, men hold fokus på sikkerhed og hygiejne. Den besked blev givet til 62 medarbejdere, som forskere fra Det Nationale Forskningscenter for Arbejdsmiljø (NFA) har fulgt over to år. Forskerne har undersøgt niveauerne af miljøgiften PCB i blodet hos nedrivere, der blandt andet har arbejdet

Tilmeld Nyhedsbrev

Tilmeld dig til dit online branchemagasin/avis





Få fuld adgang til indlægning af egne pressemeddelelser...
Læs mere her

/Nyheder

  • DENIOS ApS

    Ved du, hvornår det er tid til at vedligeholde, udskifte eller flytte dit opsamlingskar?

  • DENIOS ApS

    3 sikkerhedsfunktioner, du skal kigge efter på dit opsamlingskar

  • Holm & Halby

    VidensDage 2025: To dage i videnskabens og fremtidens tegn

  • Holm & Halby

    Holm & Halby deltager i Europe Biobank Week 2025

  • LABDAYS – Fagmesse for Laboratorieteknik

    LabDays – Almost sold out

  • Busch Vakuumteknik A/S

    Busch på IFFA 2025: Vacuum Diagnostics til intelligente vakuumløsninger til kødforarbejdning

  • Mikrolab – Frisenette A/S

    NYHED: IKA er tilbage med IKA Specials tilbudsavis

  • DENIOS ApS

    Glemmer du service? Her er konsekvenserne

  • Busch Vakuumteknik A/S

    Vakuumsystemer: En guide til turn-key projekter

  • DENIOS ApS

    Tid til serviceeftersyn?

Vis alle nyheder fra vores FOKUSpartnere ›

Seneste Nyheder

  • Chemical ionization mass spectrometry in atmospheric studies

    09.05.2025

  • Gamle processer, nye muligheder: Nyt kemisk-biologisk koncept til CO2-fangst og omdannelse

    02.05.2025

  • Atmosfærisk transport af PFAS til Højarktis

    28.04.2025

  • Biotek-firma bag fedme-medicin på tabletform har lagt en klar plan om samarbejde eller opkøb

    21.04.2025

  • Dansk virksomhed vil vende produktionen af ammoniak på hovedet – ned i en lille container

    07.04.2025

  • En EU-historie om nomenklatur – og ginseng til hunde, katte og heste!

    01.04.2025

  • Tysk elektrolyseanlæg er som det første i verden blevet integreret direkte i kemisk produktion

    31.03.2025

  • Dansk innovation blander sig i toppen over lande med de fleste patentansøgninger

    31.03.2025

  • Ny grundbog tager studerende på videregående uddannelser ind i den basale kemi

    26.03.2025

  • Nedrivningsarbejdere i kontakt med PCB slipper med skrækken – kun lave niveauer i blodet

    25.03.2025

  • Styrkelse af nyfundet gen kan gøre kartoflen resistent over for svampeangreb

    24.03.2025

  • Fra forskning i nanosikkerhed til mere sikker håndtering af nanomaterialer i det danske arbejdsmiljø

    21.03.2025

  • Dansk forbud mod PFAS er lige på trapperne – indsigelsesfrist mod 2024-aftale er overskredet

    20.03.2025

  • Flere elbiler og mindre ammoniak kan nu måles i en form af en bedre luftkvalitet

    19.03.2025

  • Forskere står bag hybridost med 25 procent ærteprotein – men med samme smag og tekstur

    18.03.2025

Alle nyheder ›

Læs Dansk Kemi online

Annoncering i Dansk Kemi

KONTAKT

TechMedia A/S
Naverland 35
DK - 2600 Glostrup
www.techmedia.dk
Telefon: +45 43 24 26 28
E-mail: info@techmedia.dk
Privatlivspolitik
Cookiepolitik