• Facebook
  • LinkedIn
  • KONTAKT
  • ANNONCERING
  • OM KEMIFOKUS
  • PARTNERLOGIN

KemiFOKUS

Fokus på kemi

  • Analytisk kemi
  • Arbejdsmiljø/Indeklima
  • Biokemi
  • Biologi
  • Bioteknologi
  • Branchenyt
  • Energi
  • Fødevarekemi
  • Historisk kemi
  • Kemiteknik
  • Kemometri
  • Klikkemi
  • Klima og miljø
  • Lovgivning og patenter
  • Medicinalkemi
  • Nanoteknologi
  • Organisk kemi
  • Artikler fra Dansk Kemi

Kemometri01. 04. 2013 | Katrine Meyn

Trevejs-data skal modelleres med trevejs-modeller

Kemometri01. 04. 2013 By Katrine Meyn

Trevejs-data laves ofte om til tovejs-data for at kunne anvende standard PLS-modeller. Denne klumme illustrerer, at det giver langt bedre fortolkning og robusthed at anvende en trevejs PLS-model, når man har trevejs-data.

Læs originalartiklen her

Artiklen har været bragt i Dansk Kemi nr. 4, 2013 og kan læses uden illustrationer, strukturer og ligninger herunder. Se relaterede artikler nederst på siden.

Af Rasmus Bro, Søren Balling Engelsen, Institut for Fødevarevidenskab, Københavns Universitet og Lars Nørgaard, FOSS

Vi har tidligere beskrevet (Dansk Kemi, 93, 1-2, 2012) et fluorescensdatasæt [1], som består af 23 prøver med varierende koncentration af phenylalanin, 3,4-dihydroxyphenylalanin (L-DOPA), dihydrobenzen og tryptofan. Vi vil nu udvikle en kalibreringsmodel, som kan prædiktere koncentrationen af dihydrobenzen ud fra de målte eksitations-emissions-matricer (EEM’ere).
I figur 1 (venstre) ses et typisk fluorescens-landskab af en prøve, der indeholder alle fire komponenter og til højre et landskab af en prøve, der kun indeholder dihydrobenzen. Hvert landskab består af en matrix, der angiver fluorescens-intensitet målt ved 116 emissionsbølgelængder og ved 18 eksitationsbølgelængder.
Fem prøver gemmes som et testsæt og kalibreringssættet består altså af en 19 (prøver) ×116 (emissionsbølgelængder) ×18 (eksitationsbølgelængder) trevejs EEM-struktur og en 19×1 vektor med koncentrationer. Ud fra dette datasæt kan der enten laves en trevejs PLS-model, eller datasættet kan foldes ud til en tovejs-matrix med 116 gange 18 (=2088) variable. Med denne udfoldede 19×2088 matrix kan man så lave almindelig tovejs-PLS. Dette kaldes også unfold-PLS, fordi den laves på udfoldede data.

Forskellen på tovejs- og trevejs-PLS
En almindelig tovejs PLS-kalibreringsmodel på de udfoldede data giver ved krysdvalidering en model, som prædikterer glimrende med fire PLS-komponenter. Fire PLS-komponenter er også, hvad man ville vente, der var optimalt, når der er fire stoffer, der fluorescerer og varierer uafhængigt i prøverne.
Til sammenligning er også vist prædiktionerne fra en helt tilsvarende trevejs PLS-model. Som det kan ses af RMSEC- og RMSECV-værdierne er modellerne meget lig hinanden. Dog har trevejs-modellen noget højere prædiktionsfejl på testsættet (RMSEP). Det skal dog nok tages med et gran salt, givet de få prøver der er i dette sæt.
Unfold-PLS-modellen har også et sæt loadings, og som man kan se i figur 3, er det ganske vanskeligt at tyde disse loadings, fordi man har 2088 forskellige variable at ”undersøge” for hver komponent. Det er faktisk et af hovedproblemerne, når man folder sine data ud. Prædiktionerne fra en model baseret på udfoldede data er ofte meget lig de prædiktioner, man får med en trevejs-model. Men selve fortolkningen af modellen er meget mere vanskelig. Og fortolkning er væsentlig for at kunne nå frem til gode modeller og for at kunne præsentere og diskutere disse.
Nederst i figur 3 er vist, hvordan trevejs-PLS giver loadings, som passer langt bedre med strukturen af data og som derfor langt nemmere kan visualiseres og forstås. Det er f.eks. let at se, at første trevejs PLS-komponent, som forklarer hovedparten af respons-koncentrationen, har høje emissions- og eksitationsloadings i samme områder som dihydrobenzen (figur 1). Den første komponent er den mørkeblå.

Trevejs PLS-regression er robust
I et forsøg på at se hvordan trevejs- og tovejs-PLS håndterer støj, er ovenstående model blevet gentaget med mere og mere støj lagt på fluorescens-landskaberne. For hvert scenarie laves en tovejs og en trevejs kalibreringsmodel og testsættet prædikteres. Testsættet er ikke det samme som foregående model, men ellers er metoden til at lave prediktionsmodel den samme som ovenfor.
I figur 4 kan man se fluorescens-landskabet for den første kalibreringsprøve i hver af kørslerne. Først uden adderet støj og dernæst med mere og mere støj lagt på. Som man kan se, bliver det til sidst næsten umuligt at se strukturen i fluorescens-landskabet.
Som det fremgår det af figur 5, kan trevejs-PLS prædiktere anstændigt selv ved meget store mængder støj, mens tovejs-PLS har større problemer. Dette peger på den anden væsentlige fordel ved trevejs-PLS. Da modellen indeholder langt færre parametre end tovejs-PLS, så er modellen mere robust overfor støj. Som eksempel så har én tovejs PLS-komponent en loading-vektor, der indeholder 2088 parametre. En enkelt komponent fra en trevejs PLS-model har til sammenligning bare 134 (116+18) parametre. Ikke nok med at de 2088 parametre er vanskelige at visualisere, de fører også til overfit (modellering af støj), når der ikke er yderligere systematisk variation at gå efter.

Outro
Det er demonstreret, at trevejs-data bør modelleres med trevejs-modeller. Det giver to væsentlige fordele: modellerne bliver simplere at fortolke og mere robuste overfor støj i data.

Referencer
D. Baunsgaard, Factors affecting 3-way modelling (PARAFAC) of fluorescence landscapes, Intern KVL rapport, August 1999, http://www.models.life.ku.dk/sites/default/files/dorrit.pdf

Figur 1. Eksitations-emissions-matrix (EEM) af blandingsprøve (venstre) og ren dihydrobenzen (højre).

Figur 2. Prædiktioner af de fem prøver i testsæt vha. unfold-PLS (venstre) og trevejs-PLS (højre).

Figur 3. PLS-loading-vægte. Øverst for unfold-PLS og nederst for trevejs-PLS, hvor der ét sæt for emission og ét sæt loading-vægte for eksitation.

Figur 4. EEM-landskab for første kalibreringsprøve med forskellige mængder adderet støj (i fraktion af oprindelig støj).

Figur 5. RMSEP-værdier for testsæt som funktion af mængden af adderet støj for både tovejs- og trevejs-PLS.

Skrevet i: Kemometri

Seneste nyt fra redaktionen

Fra forskning til et mere sikkert kemisk arbejdsmiljø for brandfolk

Arbejdsmiljø/IndeklimaArtikler fra Dansk Kemi03. 06. 2026

Biomonitorering har ført til konkrete ændringer i røgdykkeruddannelsen og reduceret eksponering for tjærestoffer. Artiklen har været bragt i Dansk Kemi nr. 3, 2026 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Maria Helena Guerra Andersen¹,

GC-analyse af ”håbløse” matricer

Artikler fra Dansk Kemi03. 06. 2026

Prøveforberedelse ”all-in-one”. Artiklen har været bragt i Dansk Kemi nr. 3, 2026 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Jens Glastrup, MSCi ApS For nogle år siden var jeg på besøg på Ravmuseet i Thyborøn, som drives af Bjarne

Molekylær fødevarekemi former fremtidens mad

Artikler fra Dansk KemiFødevarekemi03. 06. 2026

Villumlegat til forsker Milena Corredig sætter fokus på struktur og funktionalitet i bæredygtige fødevarer. Artiklen har været bragt i Dansk Kemi nr. 3, 2026 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Kimie Kongsøre, Institut for

Hvor kommer kalken fra?

Artikler fra Dansk Kemi03. 06. 2026

Fra kølige underjordiske gange i Mønsted til molerklinter på Fur: Danmarks hvide mineral er et aftryk af et urgammelt hav og en nøgle til at forstå, hvorfor Danmark har hårdt vand. Artiklen har været bragt i Dansk Kemi nr. 3, 2026 og kan læses uden illustrationer, strukturer eller ligninger

Størrelse betyder noget

Analytisk kemiArtikler fra Dansk Kemi03. 06. 2026

Hvad præcise størrelsesmålinger af proteiner kan fortælle os om deres foldning, binding og hvordan de samles. Fra Einsteins diffusionslov og Taylor-dispersion til moderne kapillærmetoder er proteinstørrelse blevet et overraskende stærkt mål for binding, aggregering og selvsamling. Artiklen har

Mælkens caseiner er uden indre orden – men hvad gør calcium?

Artikler fra Dansk KemiFødevarekemi03. 06. 2026

Når calcium bindes til caseiner for biologisk transport, øges entropien, og orden mindskes tilsyneladende. Dissociation af calcium fra casein har endda negativ aktiveringsenergi. Ikke-ligevægtstermodynamik forklarer disse usædvanlige effekter af temperatur på orden og uorden under

Fra fedtsyreprofil til fedtsyrekoncentration

Artikler fra Dansk KemiFødevarekemi03. 06. 2026

Semikvantitativ bestemmelse af fedtsyrer i fødevarer med intern standard og GC-MS. Artiklen har været bragt i Dansk Kemi nr. 3, 2026 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Daniel Halling Breiner, seniorspecialist, og Gudrun M.

Moderne forskning kræver stammekonstruktion i high-throughput

Artikler fra Dansk KemiBioteknologi03. 06. 2026

Krydsning sætter endnu engang gær i førersædet som forsøgsorganisme. Artiklen har været bragt i Dansk Kemi nr. 3, 2026 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Uffe Hasbro Mortensen (professor), Thomas Strucko (post doc), Morten

Polycykliske aromatiske kulbrinter – multi-redox systemer

Artikler fra Dansk KemiTop01. 06. 2026

Kombinationen af polycykliske aromatiske kulbrinter og den organiske svovlforbindelse tetrathiafulvalen giver nye multi-redox systemer. De har potentiel anvendelse inden for materialekemien som elektrisk ledende materialer, elektrokrome materialer eller som komponenter i batterier. Artiklen har

Ozon i den arktiske troposfære

AktueltArtikler fra Dansk KemiKlima og miljø21. 05. 2026

Ozon (O3) i atmosfæren er en vigtig klimagas – desuden er den giftig for dyr og mennesker samt skadelig for planter. Artiklen har været bragt i Dansk Kemi nr. 2, 2026 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Henrik Skov, Claus

Tilmeld Nyhedsbrev

Tilmeld dig til dit online branchemagasin/avis





Få fuld adgang til indlægning af egne pressemeddelelser...
Læs mere her

/Nyheder

  • MD Scientific

    Opnå højere opløsning og hurtigere SEC ved FPLC-proteinoprensning med TSKgel G#000SW

  • Holm & Halby

    Laboratorieverdenen samles til VidensDag’26

  • Busch Vakuumteknik A/S

    Busch Vacuum Solutions introducerer den intelligente MINK MV 0360 A ECOTORQUE klovakuumpumpe

  • Kem-En-Tec Nordic

    Sikker gelfarvning på kun 15 minutter?

  • Drifton

    Innovalloy 4000 – kemikalieresistent pumpeslange til krævende kemiske applikationer

  • Busch Vakuumteknik A/S

    ARGOS gør fabriksdriften smartere med data og forudsigelig vedligeholdelse

  • Holm & Halby

    CCA – Teknisk gennemgang af cleanroom-praksis sætter fokus på reel contamination control

  • LABDAYS – Fagmesse for Laboratorieteknik

    LabDays i KB Hallen – Hurtigt udsolgt

  • MD Scientific

    1 L kromatografikolonner i processkala, præpakket med TOYOPEARL® Super A-resin

  • Busch Vakuumteknik A/S

    Vakuumteknologi og dens kritiske rolle i sikker og effektiv genbrug af batterier

Vis alle nyheder fra vores FOKUSpartnere ›

Seneste Nyheder

  • Fra forskning til et mere sikkert kemisk arbejdsmiljø for brandfolk

    03.06.2026

  • GC-analyse af ”håbløse” matricer

    03.06.2026

  • Molekylær fødevarekemi former fremtidens mad

    03.06.2026

  • Hvor kommer kalken fra?

    03.06.2026

  • Størrelse betyder noget

    03.06.2026

  • Mælkens caseiner er uden indre orden – men hvad gør calcium?

    03.06.2026

  • Fra fedtsyreprofil til fedtsyrekoncentration

    03.06.2026

  • Moderne forskning kræver stammekonstruktion i high-throughput

    03.06.2026

  • Polycykliske aromatiske kulbrinter – multi-redox systemer

    01.06.2026

  • Ozon i den arktiske troposfære

    21.05.2026

  • Plastik i luften – havets usynlige bidrag

    11.05.2026

  • Supporting chemical thermodynamics

    04.05.2026

  • Aminosyrer til folk og fæ – hvad er egentlig ”L-cystin”?

    29.04.2026

  • Kemiens etik:

    22.04.2026

  • Physical Unclonable Functions

    22.04.2026

Alle nyheder ›

Læs Dansk Kemi online

Annoncering i Dansk Kemi

KONTAKT

TechMedia A/S
Naverland 35
DK - 2600 Glostrup
www.techmedia.dk
Telefon: +45 43 24 26 28
E-mail: info@techmedia.dk
Privatlivspolitik
Cookiepolitik