Ved at kombinere avanceret maskinlæring og traditionel kemisk og biokemisk modellering, kan hybridmodelleringskonceptet være den gamechanger, der er nødvendig for en realiserbar implementering af Industri 4.0.
Artiklen har været bragt i Dansk Kemi nr. 8, 2020 og kan læses uden illustrationer, strukturer og ligninger herunder.
Af Rasmus Fjordbak Nielsen1, Nima Nazemzadeh1, Martin Peter Andersson2, Krist V. Gernaey1 og Seyed Soheil Mansouri1
1 Process and Systems Engineering Center, Institut for Kemiteknik, Danmarks Tekniske Universitet
2 Combustion and Harmful Emission Control Center, Institut for Kemiteknik, Danmarks Tekniske Universitet
Digitalisering af kemiske og biokemiske processer er kommet langt i de sidste to årtier. Mulighederne for systematisk dataindsamling er blevet flere og væsentligt forbedrede. Mange nye måleteknikker er opstået og de eksisterende er blevet væsentligt forbedret samt automatiseret. Som følge af dette er det for en lang række af kemiske og biokemiske processer nu muligt at monitorere både kritiske kvalitetsattributter (CQA) og kritiske procesparametre (CPP), hvilket giver mulighed for nye og forbedrede procesautomatiseringer.
Med den øgede tilgængelighed af data og mangfoldigheden af processensorer er det oplagt at tro, at datadrevet modellering, populært kendt som maskinlæring, er en god måde at udnytte den ekstra information på. Især når man ser på forskellige anvendelser af maskinlæring i dag. Dette kan for eksempel være i selvkørende biler, hvor data kan komme fra flere radarer, lys- og ultralydssensorer og videokameraer. Dette illustrerer rigtig godt, hvordan maskinlæring kan udnytte mange forskellige inputs uden behov for konventionel programmering (svarende til modellering baseret på basale fysiske principper).
I modsætning til mange anvendelser af maskinlæring, kan dataindsamling inden for industrielle rammer dog stadig være forbundet med relativt høje omkostninger, især i den tidlige udvikling af en ny proces. Dette resulterer typisk i færre data, der kan bruges til træning af den datadrevne model og dermed også en lavere pålidelighed af modellen. Desuden ønskes det ofte at have en model, der kan forklare procesdynamikken i stedet for blot at kunne forudsige dem. På den anden side kan en mere pålidelig model, baseret på traditionel modellering, være for dyr og tidskrævende at udlede, da dette let kan kræve en omfattende mængde eksperimentelt arbejde.
Som afvejning mellem de traditionelle modeller, baseret på fysiske og kemiske principper og modeller, baseret udelukkende på data, findes konceptet kaldet hybridmodellering. Denne metode udnytter det bedste fra begge verdener, herunder fleksibiliteten i maskinlæringsmodeller samt udnyttelsen af eksisterende procesviden i form af traditionelle matematiske modeller. Dette giver en mere robust model sammenlignet med en fuldt ud datadrevet model og er samtidigt et mere pragmatisk valg sammenlignet med modeller baseret udelukkende på traditionel modellering.
Denne type af modellering er i øjeblikket et forskningsfokus på Institut for Kemiteknik på DTU. Mange forskellige kemiske og biokemiske processer modelleres her i øjeblikket ved hjælp af hybride modeller, herunder fermentering, kromatografi, krystallisation og flokkuleringsprocesser.
Det kendte og det ukendte:
et eksempel på hybridmodellering
En af de processer, der for tiden bliver undersøgt ved hjælp af hybridmodelleringsmetoden, er flokkulerings-processen, som traditionelt har været svær at modellere. Dette bliver udført i samarbejde med Novozymes og en dansk producent af analyseinstrumenter til online og at-line partikelanalyse, ParticleTech ApS. I disse studier er en laboratorie-flokkulering af silicapartikler i vand blandt andet blevet undersøgt, hvor målet er at forudsige partikelstørrelsesfordelingen i slutningen af en batchoperation.
For en række batchoperationer blev partikelstørrelsesfordelingen målt løbende ved at tage billeder af silica-partiklerne i den vandige suspension. Dette blev gjort ved hjælp af en avanceret billedanalysesensor, udviklet af BioSense Solutions ApS. Billederne blev efterfølgende segmenteret, og partikelstørrelser blev ekstraheret ved hjælp af ParticleTech Analyzer-softwaren (udviklet af ParticleTech ApS). Desuden blev pH og omrøringshastigheden målt.
For denne proces fortæller vores forudgående viden os, at de dominerende fænomener er agglomerering og brud af partikler. Det er desuden muligt at opsætte en massebalance, som kobler disse fænomener sammen. Massebalancen ved agglomerering og brud udgør vores mekanistiske model. De kinetiske hastighedsudtryk for agglomerering og brud er derimod ukendte, og skal dermed bestemmes ved hjælp af den datadrevne model. Med denne struktur vil det desuden være muligt at tilføje mere procesviden til modellen, enten som yderligere input til den datadrevne model eller som direkte input til den mekanistiske model.
Til at modellere agglomerationshastigheden, brudhastigheden og datterpartikel-størrelsesfordelingen (på grund af brud af partikler) blev der anvendt et dybt neuralt netværk. Inputtet til det neurale netværk var her alle de målte procesvariable. Denne model viste sig at være i stand til at forudsige systemets adfærd til en vis grad, se model A i figur 2 [1]. Ikke desto mindre syntes det, at i tilfælde af lavere pH ville den hybride model have vanskeligheder med at forudsige agglomerationshastigheden nøjagtigt.
Dette blev forbedret ved at tilføje mere viden, baseret på yderligere fysisk forståelse til den hybride model [2]. Det vides nemlig, at silica har tendens til at aggregere ved lavere pH-værdier (pH <3), da tiltrækningskræfterne overvinder de frastødende kræfter blandt molekylerne. For højere pH kan de ikke overvinde de frastødende kræfter, og sandsynligheden for at partiklerne vil skabe aggregater, bliver dermed meget lille. Ved at beregne kollisionseffektiviteten ved hjælp af Derjaguin, Landau, Vervey og Overbeek-teorien (DLVO), der tager højde for tiltrækning og frastødning af partikler, og tilføje dette som input til maskinlæringsmodellen, kunne man yderligere forbedre forudsigelsen, se model B i figur 2. Dette illustrerer rigtig fint, hvor let maskinlæringsmodellen kan tilpasses til flere inputs (både sensordata og/eller forudsigelser baseret på yderligere fysisk/kemisk baserede modeller) og derved agere som en lim mellem traditionelle modeller og danne en hybrid model, som på en effektiv måde kan kombinere klassisk viden med de store mængder data, der bliver genereret i industrien.
Hybride modellers rolle i Industri 4.0
Med en hybrid procesmodel er der mange proces-udviklings- og driftsopgaver, der kan blive gjort lettere. Frem for alt kan den tidlige udvikling og design af en ny proces have meget gavn af en fleksibel procesmodel. I denne fase kan forståelsen af procesdynamikken være meget begrænset, hvilket betyder, at en traditionel kemisk-fysisk model ikke er let tilgængelig. Da hybride modeller er meget mere fleksible, kan denne type model anvendes selv med mindre procesforståelse og derefter forbedres gradvist, når flere og flere data indsamles, og der opnås en bedre procesforståelse. Dette giver mulighed for at designe eksperimenter baseret på en model (kendt som modelbaseret design af eksperimenter). Dette resulterer i, at procesdynamikken og de optimale procesbetingelser kan bestemmes hurtigere og det ved brug af færre eksperimenter.
Desuden kan den hybride model gradvist forbedres i løbet af processens levetid ved at træne modellen med operationelle data. Dette resulterer i den såkaldte digitale tvilling, som kan bruges til at give procesoperatøren forudsigelser af procesresultatet i realtid og muliggøre afbødning af potentielle procesforstyrrelser. Endelig kan en hybridmodel væsentligt lette implementeringen af realtidsoptimering og/eller komplekse kontrolstrategier, såsom modelbaseret proceskontrol [3]. Disse metoder giver blandt andet mulighed for en forbedret kontrol af de kritiske kvalitetsattributter, men giver også mulighed for let at tilpasse sig skiftende produktkrav.
Alt i alt har hybridmodellering et stort potentiale til at reducere tiden brugt på udvikling af en nøjagtig og fungerende matematisk model, der skal bruges i industriel produktion, herunder i den indledende procesudvikling, til procesovervågning og proceskontrol.
Anerkendelser
Forfatterne af denne artikel vil gerne takke alle de involverede industrielle og akademiske partnere i udviklingen af de præsenterede værktøjer. Ydermere vil vi gerne udtrykke en stor tak for den økonomiske støtte til dette projekt fra Greater Copenhagen Food Innovation-projektet (CPH-Food), Novozymes, EU’s regionale fond (BIOPRO-SMV-projektet) og fra Innovationsfonden Danmark gennem det strategiske forskningscenter BIOPRO2 (Sags nr. 4105-00020B).
E-mail:
Rasmus Fjordbak Nielsen: rfjoni@kt.dtu.dk
Referencer:
1. R.F. Nielsen, N. Nazemzadeh, L.W. Sillesen, M.P. Andersson, K. V Gernaey, S.S. Mansouri, Hybrid machine learning assisted modelling framework for particle processes, Comput. Chem. Eng. 140 (2020).
2. N. Nazemzadeh, L.W. Sillesen, R.F. Nielsen, M.N. Jones, K. V. Gernaey, M.P. Andersson, S.S. Mansouri, Integration of Computational Chemistry and Artificial Intelligence for Multi-scale Modeling of Bioprocesses, Comput. Aided Chem. Eng. 48 (2020) 295-300.
3. F. Nielsen, Rasmus, K. V. Gernaey, S.S. Mansouri, A hybrid model predictive control strategy using neural network based soft sensors for particle processes, Comput. Aided Chem. Eng. 48 (2020) 1177-1182.