• Facebook
  • Instagram
  • KONTAKT
  • ANNONCERING
  • OM KEMIFOKUS
  • PARTNERLOGIN

KemiFOKUS

Fokus på kemi

  • Analytisk kemi
  • Arbejdsmiljø/Indeklima
  • Bioteknologi
  • Branchenyt
  • Energi
  • Fødevarekemi
  • Historisk kemi
  • Kemiteknik
  • Kemometri
  • Klima og miljø
  • Lovgivning og patenter
  • Medicinalkemi
  • Nanoteknologi
  • Organisk kemi
  • Link til Klimateknologi

Kemometri01. 04. 2013 | Katrine Meyn

Trevejs-data skal modelleres med trevejs-modeller

Kemometri01. 04. 2013 By Katrine Meyn

Trevejs-data laves ofte om til tovejs-data for at kunne anvende standard PLS-modeller. Denne klumme illustrerer, at det giver langt bedre fortolkning og robusthed at anvende en trevejs PLS-model, når man har trevejs-data.

Læs originalartiklen her

Artiklen har været bragt i Dansk Kemi nr. 4, 2013 og kan læses uden illustrationer, strukturer og ligninger herunder. Se relaterede artikler nederst på siden.

Af Rasmus Bro, Søren Balling Engelsen, Institut for Fødevarevidenskab, Københavns Universitet og Lars Nørgaard, FOSS

Vi har tidligere beskrevet (Dansk Kemi, 93, 1-2, 2012) et fluorescensdatasæt [1], som består af 23 prøver med varierende koncentration af phenylalanin, 3,4-dihydroxyphenylalanin (L-DOPA), dihydrobenzen og tryptofan. Vi vil nu udvikle en kalibreringsmodel, som kan prædiktere koncentrationen af dihydrobenzen ud fra de målte eksitations-emissions-matricer (EEM’ere).
I figur 1 (venstre) ses et typisk fluorescens-landskab af en prøve, der indeholder alle fire komponenter og til højre et landskab af en prøve, der kun indeholder dihydrobenzen. Hvert landskab består af en matrix, der angiver fluorescens-intensitet målt ved 116 emissionsbølgelængder og ved 18 eksitationsbølgelængder.
Fem prøver gemmes som et testsæt og kalibreringssættet består altså af en 19 (prøver) ×116 (emissionsbølgelængder) ×18 (eksitationsbølgelængder) trevejs EEM-struktur og en 19×1 vektor med koncentrationer. Ud fra dette datasæt kan der enten laves en trevejs PLS-model, eller datasættet kan foldes ud til en tovejs-matrix med 116 gange 18 (=2088) variable. Med denne udfoldede 19×2088 matrix kan man så lave almindelig tovejs-PLS. Dette kaldes også unfold-PLS, fordi den laves på udfoldede data.

Forskellen på tovejs- og trevejs-PLS
En almindelig tovejs PLS-kalibreringsmodel på de udfoldede data giver ved krysdvalidering en model, som prædikterer glimrende med fire PLS-komponenter. Fire PLS-komponenter er også, hvad man ville vente, der var optimalt, når der er fire stoffer, der fluorescerer og varierer uafhængigt i prøverne.
Til sammenligning er også vist prædiktionerne fra en helt tilsvarende trevejs PLS-model. Som det kan ses af RMSEC- og RMSECV-værdierne er modellerne meget lig hinanden. Dog har trevejs-modellen noget højere prædiktionsfejl på testsættet (RMSEP). Det skal dog nok tages med et gran salt, givet de få prøver der er i dette sæt.
Unfold-PLS-modellen har også et sæt loadings, og som man kan se i figur 3, er det ganske vanskeligt at tyde disse loadings, fordi man har 2088 forskellige variable at ”undersøge” for hver komponent. Det er faktisk et af hovedproblemerne, når man folder sine data ud. Prædiktionerne fra en model baseret på udfoldede data er ofte meget lig de prædiktioner, man får med en trevejs-model. Men selve fortolkningen af modellen er meget mere vanskelig. Og fortolkning er væsentlig for at kunne nå frem til gode modeller og for at kunne præsentere og diskutere disse.
Nederst i figur 3 er vist, hvordan trevejs-PLS giver loadings, som passer langt bedre med strukturen af data og som derfor langt nemmere kan visualiseres og forstås. Det er f.eks. let at se, at første trevejs PLS-komponent, som forklarer hovedparten af respons-koncentrationen, har høje emissions- og eksitationsloadings i samme områder som dihydrobenzen (figur 1). Den første komponent er den mørkeblå.

Trevejs PLS-regression er robust
I et forsøg på at se hvordan trevejs- og tovejs-PLS håndterer støj, er ovenstående model blevet gentaget med mere og mere støj lagt på fluorescens-landskaberne. For hvert scenarie laves en tovejs og en trevejs kalibreringsmodel og testsættet prædikteres. Testsættet er ikke det samme som foregående model, men ellers er metoden til at lave prediktionsmodel den samme som ovenfor.
I figur 4 kan man se fluorescens-landskabet for den første kalibreringsprøve i hver af kørslerne. Først uden adderet støj og dernæst med mere og mere støj lagt på. Som man kan se, bliver det til sidst næsten umuligt at se strukturen i fluorescens-landskabet.
Som det fremgår det af figur 5, kan trevejs-PLS prædiktere anstændigt selv ved meget store mængder støj, mens tovejs-PLS har større problemer. Dette peger på den anden væsentlige fordel ved trevejs-PLS. Da modellen indeholder langt færre parametre end tovejs-PLS, så er modellen mere robust overfor støj. Som eksempel så har én tovejs PLS-komponent en loading-vektor, der indeholder 2088 parametre. En enkelt komponent fra en trevejs PLS-model har til sammenligning bare 134 (116+18) parametre. Ikke nok med at de 2088 parametre er vanskelige at visualisere, de fører også til overfit (modellering af støj), når der ikke er yderligere systematisk variation at gå efter.

Outro
Det er demonstreret, at trevejs-data bør modelleres med trevejs-modeller. Det giver to væsentlige fordele: modellerne bliver simplere at fortolke og mere robuste overfor støj i data.

Referencer
D. Baunsgaard, Factors affecting 3-way modelling (PARAFAC) of fluorescence landscapes, Intern KVL rapport, August 1999, http://www.models.life.ku.dk/sites/default/files/dorrit.pdf

Figur 1. Eksitations-emissions-matrix (EEM) af blandingsprøve (venstre) og ren dihydrobenzen (højre).

Figur 2. Prædiktioner af de fem prøver i testsæt vha. unfold-PLS (venstre) og trevejs-PLS (højre).

Figur 3. PLS-loading-vægte. Øverst for unfold-PLS og nederst for trevejs-PLS, hvor der ét sæt for emission og ét sæt loading-vægte for eksitation.

Figur 4. EEM-landskab for første kalibreringsprøve med forskellige mængder adderet støj (i fraktion af oprindelig støj).

Figur 5. RMSEP-værdier for testsæt som funktion af mængden af adderet støj for både tovejs- og trevejs-PLS.

Skrevet i: Kemometri

 
 

Seneste nyt fra redaktionen

Højere hastigheden og mindre kompleksiteten skal sikre den europæiske konkurrenceevne

AktueltBranchenyt27. 03. 2023

Skal man koge det ned til ganske få ord, vil EU have mindre bøvl omkring sagsbehandlingerne. Det stod klat efter EU’s stats- og regeringschefer blev enige om, at man vil gøre reguleringen mere enkel og sagsbehandlingen i EU, mens hastigheden for sagsbehandlingen skal op i de enkelte

Dansk-tysk aftale er første skridt på vejen til en brintrørledning på tværs af grænsen

Energi24. 03. 2023

Brint og Power-to-X er set som værende en af de helt store teknologier i en mere grøn fremtid med vedvarende energi. For at det skal lykkedes, skal man have opbygget en infrastruktur, der kan håndtere fx brinten. Og det nu er første skridt taget til en fremtidig brintrørledning mellem Danmark og

Prisvindende gymnasielærer er fanatisk omkring STEM-fagene på den positive måde

BranchenytTop24. 03. 2023

Man forbinder det sjældent med noget godt, når folk er fanatiske, men i tilfældet med gymnasielærer Klaus Møller Kristensen fra Tradium Teknisk Gymnasium i Randers forholder det sig anderledes. For selv om han betegner sig som fanatisk omkring STM-fagene, er det på en så positiv måde, at han har

Pas på ramløgens giftige familiemedlemmer – de kan i værste fald være dødelige

AktueltMedicinalkemi23. 03. 2023

Med forårets komme er den populære urt ramsløg ved at titte frem i de danske skove. Og der er intet forgjort ved at tilsætte den til sin mad. Men man skal passe på, for den velsmagende urt har en giftig fætter - eller to. Den mest kendte er liljekonval. Planten indeholder en række toxiner, men

Hestebønner

Så er det lykkedes – afkodning af det gigantiske hestebønnegenom er gennemført

FødevarekemiKlima og miljøTop17. 03. 2023

Den proteinrige hestebønne anses for at have en lovende fremtid som fødevare. Den største udfordring hidtil har været, at hestebønnegenomet er så stort og komplekst, at det ikke har været muligt at karakterisere det. Det største kromosom i hestebønnegenomet svarer til hele det humane genom. Uden

Danmark er en blød mellemvare på ranglisten over kvindelige opfindere

AktueltBranchenyt17. 03. 2023

En europæiske liste over patentansøgninger viser det tydeligt. Danske opfindelser er udtænkt af mænd. Kun ved én ud af ti danske patentansøgninger står en kvinde bag, og det gør Danmark i bedste fald en blød mellemvare på det område. Det lave antal kvindelige opfindere i forhold til antal mænd,

Pulje med midler til grøn bioraffinering er blevet løbet over ende

AktueltBioteknologi17. 03. 2023

Interessen for at komme i gang med bioraffinering er stor. Så stor, at en pulje, der har midler som kan støtte op om udviklingen af teknologien, er blevet løbet over ende. Puljen rummer 5 mio. kr. til uddeling i 2022, 2023 og 2024, og i år har Landbrugsstyrelsen modtaget ansøgninger om tilskud

Bedre forståelse af den græske Ouzo-effekt kan på sigt føre til bedre emulsioner

KemiteknikMedicinalkemi17. 03. 2023

Nogle kalder drikken Ouzo for Grækenland på flaske, men den anissmagende græske brændevin, der er landets nationaldrik, gemmer også på en hemmelighed, der på sigt kan føre til bedre emulsioner. Normalt er Ouzo en klar væske, men når den blandes med vand forvandles den til en mælkehvid opløsning.

Lettere adgang til supercomputere rummer store perspektiver for dansk forskningsmiljø

Branchenyt16. 03. 2023

Bedre medicin, klimaoptimeret byggeri og mere viden om fjerne galakser. Mulighederne er store, når man har den massive regnekraft fra supercomputere til rådighed. Og dem får forskere nu lettere adgang til takket være DeiC Integration Portal. Bag initiativet til den nye portal står The Danish

Hvordan fungerer en LED-lyskilde?

Energi16. 03. 2023

LED-lys har i de seneste år taget verden med storm og har vundet popularitet som en energieffektiv, holdbar og alsidig form for belysning. Men hvad er kemien bag LED-lys? LED (Light Emitting Diode) fungerer ved hjælp af en halvleder, der er placeret mellem to ledende materialer. Når en elektrisk

Tilmeld Nyhedsbrev

Tilmeld dig til dit online branchemagasin/avis





Få fuld adgang til indlægning af egne pressemeddelelser...
Læs mere her

/Nyheder

  • DENIOS ApS

    Sådan sparer du rengøringen efter vedligeholdelsesarbejde

  • Busch Vakuumteknik A/S

    Sikker køling af salat takket være vakuumteknologi

  • Metrohm Nordic

    Kom med på IC-kursus med Metrohm!

  • MD Scientific

    Shodex polymer-baserede HPLC kolonner – se det nye katalog

  • Mikrolab Aarhus A/S

    Kom til Mikrolab Seminardag d. 25 april!

  • Kem-En-Tec Nordic

    ANB Sensors går i partnerskab med Kem-En-Tec Nordic A/S i distributionen af nye, revolutionerende pH sensorer i Danmark, Sverige, Norge og Finland

  • DENIOS ApS

    Øg sikkerheden ved dit opsamlingskar med tre små justeringer

  • Busch Vakuumteknik A/S

    Vakuum bevarer den gode smag

  • Metrohm Nordic

    NIRS DS2500 Analyzers – til polymerer, petrokemi, kemikalier, pharma, palmeolie, produkter til personlig pleje m.m.

  • DENIOS ApS

    35 krav du ikke må misse, når du opbevarer gasflasker udendørs

Vis alle nyheder fra vores FOKUSpartnere ›

Seneste Nyheder

  • Højere hastigheden og mindre kompleksiteten skal sikre den europæiske konkurrenceevne

    27.03.2023

  • Dansk-tysk aftale er første skridt på vejen til en brintrørledning på tværs af grænsen

    24.03.2023

  • Prisvindende gymnasielærer er fanatisk omkring STEM-fagene på den positive måde

    24.03.2023

  • Pas på ramløgens giftige familiemedlemmer – de kan i værste fald være dødelige

    23.03.2023

  • Så er det lykkedes – afkodning af det gigantiske hestebønnegenom er gennemført

    17.03.2023

  • Danmark er en blød mellemvare på ranglisten over kvindelige opfindere

    17.03.2023

  • Pulje med midler til grøn bioraffinering er blevet løbet over ende

    17.03.2023

  • Bedre forståelse af den græske Ouzo-effekt kan på sigt føre til bedre emulsioner

    17.03.2023

  • Lettere adgang til supercomputere rummer store perspektiver for dansk forskningsmiljø

    16.03.2023

  • Hvordan fungerer en LED-lyskilde?

    16.03.2023

  • Danske forskere på vej med en løsning til at fjerne og nedbryde PFAS i ét trin

    15.03.2023

  • Millionbevillig til patentvoucherordning skal give flere blod på tanden

    15.03.2023

  • Minister vil teste for næsten dobbelt så mange PFAS-stoffer i drikkevandet

    15.03.2023

  • Nyt sekventeringsudstyr til SDU efter million-bevilling fra A.P. Møller Fonden

    15.03.2023

  • Den er god nok – gigtramte kan godt forudsige omskift i vejret

    14.03.2023

Alle nyheder ›

Læs Dansk Kemi online

Annoncering i Dansk Kemi

KONTAKT

TechMedia A/S
Naverland 35
DK - 2600 Glostrup
www.techmedia.dk
Telefon: +45 43 24 26 28
E-mail: info@techmedia.dk
Privatlivspolitik
Cookiepolitik