– ny datateknologi for ikke-iterativ multieksponentiel kurvetilpasning. Med korte beregningstider og uden begyndelsesgæt giver SLICING pålidelige og robuste modeller, der bl.a. kan bruges på NMR-målinger af kød.
Læs 1. del af originalartiklen her
Læs 2. del af originalartiklen her
Artiklen har været bragt i Dansk Kemi nr. 2, 2003 og kan læses uden illustrationer, strukturer og ligninger herunder. Se relaterede artikler nederst på siden.
Af Rasmus Bro, Henrik T. Pedersen1 og Søren B. Engelsen, Levnedsmiddelcentret, Mejeri- og Levnedsmiddelinstituttet, Levnedsmiddelteknologi, KVL
1nuværende adresse: Novo Nordisk, Applied Trinomics
Mange typer af målte data kan beskrives som en sum af eksponentialfunktioner (f.eks. fra NMR relaxometri, kinetik, farmakologi, radioaktivitet, lysspredning og livstidsfluorescens). For at forstå og fortolke sådanne data er det væsentligt at kunne modellere dem præcist og robust. Numerikerne har i århundreder arbejdet med ikke-lineære mindste kvadraters kurvetilpasning for at bestemme de underliggende mono-eksponentielle funktioner.
En ny metode – SLICING – fra KVL kan foretage multieksponentiel kurveopløsning ikke-iterativt og hurtigt.
Introduktion
Med udgangspunkt i NMR-relaxometridata har gruppen for Levnedsmiddelteknologi på KVL udarbejdet en ny matematisk modelleringsteknik til at beregne
1) de underliggende eksponentielle kurver og
2) kvantiteten af disse.
Metoden hedder SLICING, fordi den baserer sig på, at data »skæres op« og arrangeres, så nye såkaldte multivejs-metoder kan bruges til at ekstrahere den ønskede information.
Her beskrives teknikken og et eksempel fra NMR-relaxometri illustrerer anvendelsen. SLICING kan bruges i alle tilfælde, hvor en sum af eksponentialkurver analyseres.
Princippet i SLICING
Der haves et sæt af multieksponentielle profiler, der alle kan beskrives som en (forskelligt vægtet) sum af et lille antal eksponentialkurver (se boks).
I NMR-sammenhæng (se boks) betyder det, at alle prøver er givet som linearkombinationer af exp(-t/T2,1), exp(-t/T2,2), .., exp(-t/T2,I), mens mængden af de mono-eksponentielle kurver i en specifik prøve er givet ved prøvens M-værdier (»koncentrationer«). T2-værdierne er den kvalitative information, der f.eks. beskriver komponentens proton-mobilitet og M0-værdierne giver den kvantitative information om, hvor meget prøven indeholder af hver af disse komponenter.
Typiske eksempler på multieksponentielle kurver er vist i figur 1 med tilhørende resolvering.
Hver multieksponentiel kurve transformeres som illustreret i figur 2. Bemærk, at udtrykket slicing dækker over selve datatransformationen, mens SLICING dækker over den overordnede algoritme. Der er forskellige strategier for hvordan slicing-transformationen implementeres. I den oprindelige SLICING-metode [1] blev der udviklet en noget langsom, men robust teknik til at udvælge optimal slicing-strategi. En direkte løsning på dette problem er beskrevet af Engelsen & Bro [2], hvor power-SLICING (slicing af data med eksponentielt stigende x-akseforskydning, engelsk: lagning) både informationsteoretisk og i praksis er vist at være en fundamentalt korrekt strategi for slicing. Denne implementering af SLICING er overordentlig kompetitiv mht. beregningshastighed.
Vha. transformationen fås en matrix/landskab (C) for hver prøve. Data for flere prøver kan herefter arrangeres i en tredimensionel array; en såkaldt trevejs-datastruktur.
Hvis de oprindelige data består af vægtede summer af underliggende eksponentialkurver plus støj, kan den eksponentielle information (kvalitativ såvel som kvantitativ information) estimeres ud fra en PARAFAC-model [3] af de transformerede trevejs data [4]. Der findes alternative PARAFAC-algoritmer, men Engelsen & Bro [2] har vist, at det er specielt hensigtsmæssigt at bruge en algoritme baseret på løsningen af et enkelt generaliseret egenværdiproblem (Direct Trilinear Decomposition). En af fordelene ved denne algoritme er, at den beregner en ikke-iterativ analytisk løsning og derfor er meget hurtig.
Beskrivelse af metodens matematiske og statistiske aspekter kan findes i originallitteraturen.
Et af metodens fascinerende aspekter er, at den i modsætning til traditionelle kurve-tilpasningsalgoritmer, der er baserede på hård modellering til en forudbestemt eksponentiel funktion [5], bygger på brug af redundant data-information, hvor det er sammenhængen (kontekst), der bestemmer modellen. Som et eksempel på SLICING-metodens hurtighed i forhold til en state-of-the-art algoritme er beregningstiden for fire modeller med hhv. 1, 2, 3 og 4 komponenter vist i figur 3.
Eksempel på anvendelse af SLICING
Der ses på NMR-målinger af kød. Data består af målinger på 47 prøver kødfars med et totalt fedtindhold på 1,2-15,0% (w/w). Prøverne blev målt ved 55°C for at sikre en flydende lipidfase, og der blev optaget 2048 lige ekkoer via en gradientundertrykt CPMG puls-sekvens med en t-værdi på 500 ms.
Et vigtigt aspekt i lavfelts-NMR-dataanalyse er, hvordan fasekorrektionen af rå-data implementeres. Det er tidligere vist [1], at de gængse metoder ikke er i stand til at fasekorrigere korrekt, hvilket har stor betydning for efterfølgende analyse af de korrigerede data. En ny fasekorrektion, kaldet Principal Phase Correction (PPC) [1], kan fasekorrigere uden at introducere systematiske fejl i de korrigerede data og er derfor anvendt på disse data.
Figur 4 viser, hvordan de i alt 47 relaxationshenfald (A) via todimensionel SLICING-analyse simultant dekomponeres til to underliggende relaxationshenfald med karakteristiske T2-tider på hhv. 31 ms og 323 ms (B).
Plotter man prøvernes estimerede »koncentrationer« (M2) fra den langsomt relaxerende komponent mod en reference-analyse af fedtindholdet i kødprøverne (SBR) fås en direkte korrelation på r=0.988 (C).
Konklusion
Ekstensive simuleringer af NMR-relaxometridata har afsløret, at SLICING-teknikken er sammenlignelig med, men ikke bedre end de klassiske robuste numeriske algoritmer. SLICING-teknikken er attraktiv, da algoritmen ved brug af stærkt redundant information og uden nogen form for begyndelsesgæt giver ikke-iterative og unikke løsninger med perfekte mono-eksponentielle profiler.
I praksis er det den dramatisk kortere beregningshastighed (uafhængig af antallet af komponenter, der skal ekstraheres) og den forbedrede diagnostik, der er attraktiv.
Med introduktionen af SLICING er det muligt at lave pålidelige og robuste modeller af multieksponentielle data. Algoritmerne er gratis tilgængelige på internettet (se nedenfor).
Fremtiden byder på flere spændende tiltag inden for multieksponentiel modellering. En helt ny teknik, dobbelt-SLICING, vil gøre det muligt at modellere en enkelt prøve ad gangen. Det betyder, at man ikke længere er afhængig af at have adgang til flere prøver, der alle følger de samme underliggende eksponentielle forløb. Det betyder også, at man i praksis kan teste om flere prøver har samme underliggende struktur. Denne og andre metoder vil løbende blive stillet til rådighed på http://www.models.kvl.dk
Referencer:
1. Pedersen H.T., Bro R, Engelsen S.B., Towards Rapid and Unique Curve Resolution of Low-Field NMR relaxation data: Trilinear SLICING versus Two-dimensional Curve Fitting, Journal of Magnetic Resonance, 2002, 157, 141-155.
2. Engelsen S.B., Bro R., Power- SLICING, Journal of Magnetic Resonance, 2002, Submitted.
3. Bro R., PARAFAC. Tutorial and applications, Chemom Intell Lab Syst, 1997, 38, 149-171.
4. Windig W., Antalek B., Direct exponential curve resolution algorithm (DECRA): A novel application of the generalized rank annihilation method for a single spectral mixture data set with exponentially decaying contribution profiles, Chemom Intell Lab Syst, 1997, 37, 241-254.
5. Nielsen H.B., Multiexponential fitting of low-field 1H NMR data , IMM-REP-2000-03, IMM, The Technical University, Denmark, 2000.
billedtekster:
Figur 1. Typiske multieksponentielle profiler (venstre). Den øverste profil er et eksempel på første-ordens kinetiske målinger af en intermediær, som kan beskrives ved det eksponentielle henfald af reaktant og dannelsen af produkt. Det nederste eksempel kunne være en NMR-profil, som består af fire underliggende komponenter. SLICING kan ud fra sæt af sådanne målte profiler bestemme de underliggende mono-eksponentielle kurver samt deres relative mængder.
Figur 2. Hver målt multieksponentiel profil (A) slices, så der dannes en tabel (B), hvor hver række repræsenterer profilen men forskudt i forskellig grad (lag). Den del af tabellen, hvor der er fuldt overlap over rækkerne udgør data for en prøve (C). I figuren er anvendt en mono-eksponentiel profil, men i praksis vil der være tale om multieksponentielle kurver.
Figur 3. Beregningstid for forskelligt antal komponenter vha. hhv. »exponential fit« (state-of-the-art) og SLICING.
NMR relaxometri
NMR (Kerne Magnetisk Resonans) relaxometri eller lavfelts-1H NMR (typisk 0-.5 Tesla) er en af de mest fleksible, multivariate og ikke-destruktive analytiske måleteknikker på markedet. I modsætning til optiske metoder giver NMR relaxometri volumenbaserede målinger, der er uafhængige af prøvens overfladekarakteristik. NMR relaxometri er således direkte anvendelig til målinger på amorfe, heterogene og ikke-transparente prøver, som er typisk for bl.a. levnedsmiddelsystemer. NMR relaxometri er også en relativt billig teknik, som har potentialet til at fungere som et unikt »vindue« i f.eks. komplicerede levnedsmiddelsystemer og -processer. 1H NMR relaxometri giver via forskelligartede puls-sekvenser mulighed for at »komme i kontakt« med protonerne i prøverne. Levnedsmiddelindustrien har en række problemstillinger, for hvilke NMR relaxometri er en optimal analytisk teknik; f.eks.:
(1) »solid fat«-bestemmelse i planteolier
(2) total fedtindhold i kød, oliefrø, fiskemel, konfekture og mejeriprodukter
(3) dråbestørrelse i smør/margarine
(4) adsorberet og total vandindhold i foderstoffer, ingredienser, snacks og småkager samt
(5) geldannelse i stabilisatorer og hydrokolloider.
Derudover kan NMR relaxometri benyttes til at eksplorere sensoriske levnedsmiddelegenskaber, som f.eks. tekstur, »mouth feel« og »slipperiness«, i den grad disse egenskaber afhænger af kompartementalisering og mobilitet af vand.
Den mest almindelige datatype som genereres fra NMR relaxometri er transvers eller T2-relaxationsdata, som følger formen:
hvor RMAG(t) – residual magnetisering – er det målte signal som funktion af tiden, og hvor M0,i er amplituden og T2,i den karakteristiske tidskonstant for den i’te komponent. Bestemmelse af samtlige M0,i- og T2,i-værdier ud fra RMAG(t) giver således en fuldstændig karakteristik af prøven.

