• Facebook
  • LinkedIn
  • KONTAKT
  • ANNONCERING
  • OM KEMIFOKUS
  • PARTNERLOGIN

KemiFOKUS

Fokus på kemi

  • Analytisk kemi
  • Arbejdsmiljø/Indeklima
  • Biokemi
  • Biologi
  • Bioteknologi
  • Branchenyt
  • Energi
  • Fødevarekemi
  • Historisk kemi
  • Kemiteknik
  • Kemometri
  • Klikkemi
  • Klima og miljø
  • Lovgivning og patenter
  • Medicinalkemi
  • Nanoteknologi
  • Organisk kemi
  • Artikler fra Dansk Kemi

Kemometri01. 04. 2013 | Katrine Meyn

Trevejs-data skal modelleres med trevejs-modeller

Kemometri01. 04. 2013 By Katrine Meyn

Trevejs-data laves ofte om til tovejs-data for at kunne anvende standard PLS-modeller. Denne klumme illustrerer, at det giver langt bedre fortolkning og robusthed at anvende en trevejs PLS-model, når man har trevejs-data.

Læs originalartiklen her

Artiklen har været bragt i Dansk Kemi nr. 4, 2013 og kan læses uden illustrationer, strukturer og ligninger herunder. Se relaterede artikler nederst på siden.

Af Rasmus Bro, Søren Balling Engelsen, Institut for Fødevarevidenskab, Københavns Universitet og Lars Nørgaard, FOSS

Vi har tidligere beskrevet (Dansk Kemi, 93, 1-2, 2012) et fluorescensdatasæt [1], som består af 23 prøver med varierende koncentration af phenylalanin, 3,4-dihydroxyphenylalanin (L-DOPA), dihydrobenzen og tryptofan. Vi vil nu udvikle en kalibreringsmodel, som kan prædiktere koncentrationen af dihydrobenzen ud fra de målte eksitations-emissions-matricer (EEM’ere).
I figur 1 (venstre) ses et typisk fluorescens-landskab af en prøve, der indeholder alle fire komponenter og til højre et landskab af en prøve, der kun indeholder dihydrobenzen. Hvert landskab består af en matrix, der angiver fluorescens-intensitet målt ved 116 emissionsbølgelængder og ved 18 eksitationsbølgelængder.
Fem prøver gemmes som et testsæt og kalibreringssættet består altså af en 19 (prøver) ×116 (emissionsbølgelængder) ×18 (eksitationsbølgelængder) trevejs EEM-struktur og en 19×1 vektor med koncentrationer. Ud fra dette datasæt kan der enten laves en trevejs PLS-model, eller datasættet kan foldes ud til en tovejs-matrix med 116 gange 18 (=2088) variable. Med denne udfoldede 19×2088 matrix kan man så lave almindelig tovejs-PLS. Dette kaldes også unfold-PLS, fordi den laves på udfoldede data.

Forskellen på tovejs- og trevejs-PLS
En almindelig tovejs PLS-kalibreringsmodel på de udfoldede data giver ved krysdvalidering en model, som prædikterer glimrende med fire PLS-komponenter. Fire PLS-komponenter er også, hvad man ville vente, der var optimalt, når der er fire stoffer, der fluorescerer og varierer uafhængigt i prøverne.
Til sammenligning er også vist prædiktionerne fra en helt tilsvarende trevejs PLS-model. Som det kan ses af RMSEC- og RMSECV-værdierne er modellerne meget lig hinanden. Dog har trevejs-modellen noget højere prædiktionsfejl på testsættet (RMSEP). Det skal dog nok tages med et gran salt, givet de få prøver der er i dette sæt.
Unfold-PLS-modellen har også et sæt loadings, og som man kan se i figur 3, er det ganske vanskeligt at tyde disse loadings, fordi man har 2088 forskellige variable at ”undersøge” for hver komponent. Det er faktisk et af hovedproblemerne, når man folder sine data ud. Prædiktionerne fra en model baseret på udfoldede data er ofte meget lig de prædiktioner, man får med en trevejs-model. Men selve fortolkningen af modellen er meget mere vanskelig. Og fortolkning er væsentlig for at kunne nå frem til gode modeller og for at kunne præsentere og diskutere disse.
Nederst i figur 3 er vist, hvordan trevejs-PLS giver loadings, som passer langt bedre med strukturen af data og som derfor langt nemmere kan visualiseres og forstås. Det er f.eks. let at se, at første trevejs PLS-komponent, som forklarer hovedparten af respons-koncentrationen, har høje emissions- og eksitationsloadings i samme områder som dihydrobenzen (figur 1). Den første komponent er den mørkeblå.

Trevejs PLS-regression er robust
I et forsøg på at se hvordan trevejs- og tovejs-PLS håndterer støj, er ovenstående model blevet gentaget med mere og mere støj lagt på fluorescens-landskaberne. For hvert scenarie laves en tovejs og en trevejs kalibreringsmodel og testsættet prædikteres. Testsættet er ikke det samme som foregående model, men ellers er metoden til at lave prediktionsmodel den samme som ovenfor.
I figur 4 kan man se fluorescens-landskabet for den første kalibreringsprøve i hver af kørslerne. Først uden adderet støj og dernæst med mere og mere støj lagt på. Som man kan se, bliver det til sidst næsten umuligt at se strukturen i fluorescens-landskabet.
Som det fremgår det af figur 5, kan trevejs-PLS prædiktere anstændigt selv ved meget store mængder støj, mens tovejs-PLS har større problemer. Dette peger på den anden væsentlige fordel ved trevejs-PLS. Da modellen indeholder langt færre parametre end tovejs-PLS, så er modellen mere robust overfor støj. Som eksempel så har én tovejs PLS-komponent en loading-vektor, der indeholder 2088 parametre. En enkelt komponent fra en trevejs PLS-model har til sammenligning bare 134 (116+18) parametre. Ikke nok med at de 2088 parametre er vanskelige at visualisere, de fører også til overfit (modellering af støj), når der ikke er yderligere systematisk variation at gå efter.

Outro
Det er demonstreret, at trevejs-data bør modelleres med trevejs-modeller. Det giver to væsentlige fordele: modellerne bliver simplere at fortolke og mere robuste overfor støj i data.

Referencer
D. Baunsgaard, Factors affecting 3-way modelling (PARAFAC) of fluorescence landscapes, Intern KVL rapport, August 1999, http://www.models.life.ku.dk/sites/default/files/dorrit.pdf

Figur 1. Eksitations-emissions-matrix (EEM) af blandingsprøve (venstre) og ren dihydrobenzen (højre).

Figur 2. Prædiktioner af de fem prøver i testsæt vha. unfold-PLS (venstre) og trevejs-PLS (højre).

Figur 3. PLS-loading-vægte. Øverst for unfold-PLS og nederst for trevejs-PLS, hvor der ét sæt for emission og ét sæt loading-vægte for eksitation.

Figur 4. EEM-landskab for første kalibreringsprøve med forskellige mængder adderet støj (i fraktion af oprindelig støj).

Figur 5. RMSEP-værdier for testsæt som funktion af mængden af adderet støj for både tovejs- og trevejs-PLS.

Skrevet i: Kemometri

Seneste nyt fra redaktionen

Chemical ionization mass spectrometry in atmospheric studies

Analytisk kemiArtikler fra Dansk KemiTop19. 05. 2025

Advances in chemical ionization mass spectrometry can improve our understanding of atmospheric composition. Artiklen har været bragt i Dansk Kemi nr. 2, 2025 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Varun Kumar, Institut for

Gamle processer, nye muligheder: Nyt kemisk-biologisk koncept til CO2-fangst og omdannelse

AktueltArtikler fra Dansk KemiBioteknologi14. 05. 2025

Oldgamle CO2-ædende mikroorganismer kan fange CO2 direkte fra skorstensrøg og omdanne kulstoffet til grønne molekyler. Artiklen har været bragt i Dansk Kemi nr. 2, 2025 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen her) Af Mads Ujarak Sieborg1 og

Centrotherm clean solutions bliver til Pfeiffer Vacuum+Fab Solutions

AktueltBranchenyt14. 05. 2025

Busch Group annoncerer, at deres brand centrotherm clean solutions bliver en del af Pfeiffer Vacuum+Fab Solutions. Fra september 2025 vil gasreduktionssystemerne til Semicon-industrien, som tidligere blev tilbudt under dette mærke, blive integreret i Pfeiffer-porteføljen og fremover være

I dag får professor Per Halkjær Nielsen Videnskabernes Selskabs Guldmedalje

Branchenyt14. 05. 2025

For blot fjerde gang i dette årtusinde uddeles Videnskabernes Selskabs Guldmedalje. Det sker i dag, hvor bakterieforsker Per Halkjær Nielsen, professor ved Institut for Kemi og Biovidenskab ved Aalborg Universitet, får den fine hæder for sit livsværk og sin holdånd. Han er manden, der kortlægger

Atmosfærisk transport af PFAS til Højarktis

AktueltArtikler fra Dansk KemiKlima og miljø28. 04. 2025

Tilstedeværelsen af PFAS-forbindelser skyldes ikke kun lokale kilder, men de kan langtransporteres i luften til selv meget fjerntliggende arktiske egne. Artiklen har været bragt i Dansk Kemi nr. 2, 2025 og kan læses uden illustrationer, strukturer eller ligninger herunder(læs originalartiklen

Biotek-firma bag fedme-medicin på tabletform har lagt en klar plan om samarbejde eller opkøb

AktueltMedicinalkemi21. 04. 2025

I dag er det frem med nålen, hvis man er i behandling med diverse former for fedme-medicin. Det hæmmer imidlertid udbredelsen på specielt asiatiske og afrikanske markeder, hvor der er en udtalt nålefobi. Derfor arbejder det danskstiftede biotekselskab Pila Pharma med at få udvikle deres

Dansk virksomhed vil vende produktionen af ammoniak på hovedet – ned i en lille container

AktueltBioteknologiFødevarekemi07. 04. 2025

NitroVolt, en dansk biotech-virksomhed, vil vende produktionen af ammoniak på hovedet. I stedet for den velkendte løsning, der bygger på den energitunge Haber-Bosch-proces, vil produktionen nu foregå i en container, der fx kan stå direkte ude hos en landmand. Ammoniak til kunstgødning er en slags

En EU-historie om nomenklatur – og ginseng til hunde, katte og heste!

AktueltArtikler fra Dansk KemiHistorisk kemi01. 04. 2025

Artiklen har været bragt i Dansk Kemi nr. 6, 2024 og kan læses uden illustrationer, strukturer og ligninger herunder. Læs originalartiklen her Nomenklaturudvalget får indimellem henvendelser om dansk kemisk nomenklatur fra de oversættere i EU, hvis opgave det er at oversætte EU-lovgivning på

Tysk elektrolyseanlæg er som det første i verden blevet integreret direkte i kemisk produktion

AktueltEnergi31. 03. 2025

Efter en byggeperiode på omkring to år, er BASF nye 54 megawatt elektrolyseanlæg blevet indviet. Udover at være Tyskland største, med en kapacitet til at producere op til 8.000 ton grøn brint årligt, skriver det også historie på et andet område. Brinten skal primært anvendes som råmateriale i

Dansk innovation blander sig i toppen over lande med de fleste patentansøgninger

AktueltBranchenyt31. 03. 2025

Danske virksomheder er fortsat nogle af de mest aktive i Europa til at innovere. Det viser nye tal fra Den Europæiske Patentmyndighed, EPO, som udsteder patenter, der kan dække i op til 45 lande. Vestas, Novozymes og Danmarks Tekniske Universitet har leveret de største bidrag til, at Danmark kan

Tilmeld Nyhedsbrev

Tilmeld dig til dit online branchemagasin/avis





Få fuld adgang til indlægning af egne pressemeddelelser...
Læs mere her

/Nyheder

  • Kem-En-Tec Nordic

    Sikker gelfarvning på kun 15 minutter?

  • DENIOS ApS

    Her er den oversete vej til et sundere arbejdsmiljø

  • Busch Vakuumteknik A/S

    Pfeiffer Vacuum+Fab Solutions lancerer den nye HiCube Neo RGA

  • Busch Vakuumteknik A/S

    centrotherm clean solutions bliver til Pfeiffer Vacuum+Fab Solutions

  • DENIOS ApS

    Ved du, hvornår det er tid til at vedligeholde, udskifte eller flytte dit opsamlingskar?

  • DENIOS ApS

    3 sikkerhedsfunktioner, du skal kigge efter på dit opsamlingskar

  • Holm & Halby

    VidensDage 2025: To dage i videnskabens og fremtidens tegn

  • Holm & Halby

    Holm & Halby deltager i Europe Biobank Week 2025

  • LABDAYS – Fagmesse for Laboratorieteknik

    LabDays – Almost sold out

  • Busch Vakuumteknik A/S

    Busch på IFFA 2025: Vacuum Diagnostics til intelligente vakuumløsninger til kødforarbejdning

Vis alle nyheder fra vores FOKUSpartnere ›

Seneste Nyheder

  • Chemical ionization mass spectrometry in atmospheric studies

    19.05.2025

  • Gamle processer, nye muligheder: Nyt kemisk-biologisk koncept til CO2-fangst og omdannelse

    14.05.2025

  • Centrotherm clean solutions bliver til Pfeiffer Vacuum+Fab Solutions

    14.05.2025

  • I dag får professor Per Halkjær Nielsen Videnskabernes Selskabs Guldmedalje

    14.05.2025

  • Atmosfærisk transport af PFAS til Højarktis

    28.04.2025

  • Biotek-firma bag fedme-medicin på tabletform har lagt en klar plan om samarbejde eller opkøb

    21.04.2025

  • Dansk virksomhed vil vende produktionen af ammoniak på hovedet – ned i en lille container

    07.04.2025

  • En EU-historie om nomenklatur – og ginseng til hunde, katte og heste!

    01.04.2025

  • Tysk elektrolyseanlæg er som det første i verden blevet integreret direkte i kemisk produktion

    31.03.2025

  • Dansk innovation blander sig i toppen over lande med de fleste patentansøgninger

    31.03.2025

  • Ny grundbog tager studerende på videregående uddannelser ind i den basale kemi

    26.03.2025

  • Nedrivningsarbejdere i kontakt med PCB slipper med skrækken – kun lave niveauer i blodet

    25.03.2025

  • Styrkelse af nyfundet gen kan gøre kartoflen resistent over for svampeangreb

    24.03.2025

  • Fra forskning i nanosikkerhed til mere sikker håndtering af nanomaterialer i det danske arbejdsmiljø

    21.03.2025

  • Dansk forbud mod PFAS er lige på trapperne – indsigelsesfrist mod 2024-aftale er overskredet

    20.03.2025

Alle nyheder ›

Læs Dansk Kemi online

Annoncering i Dansk Kemi

KONTAKT

TechMedia A/S
Naverland 35
DK - 2600 Glostrup
www.techmedia.dk
Telefon: +45 43 24 26 28
E-mail: info@techmedia.dk
Privatlivspolitik
Cookiepolitik