Her gives en kort opsummering af vores viden om protein elektrostatik og om eksperimenter som for nylig direkte har målt styrken af elektriske felter i proteiner og har bekræftet, at den dielektriske konstant af proteiner er lav.
Artiklen har været bragt i Dansk Kemi nr. 3, 2015 og kan læses uden illustrationer, strukturer og ligninger herunder. Se relaterede artikler nederst på siden.
Af Jens Erik Nielsen, Protein Design, Novozymes A/S
Elektrostatiske vekselvirkninger i proteiner og enzymer har været studeret i over hundrede år på grund af deres store indvirkning på stabiliteten og funktionen af disse biomolekyler. I de sidste 10-20 år har vi fået meget større viden om styrken af elektrostatiske kræfter i proteiner, og hvordan de påvirker industrielt vigtige enzymparametre som pH-aktivitets- og pH-stabilitetsprofiler.
Beregning af elektrostatiske vekselvirkninger
Grundlæggende set er styrken af elektrostatiske vekselvirkninger givet ved Coulombs lov:
Her indsættes formel
, hvor ε0 er permitiviteten af vakuum, ε er den dielektriske konstant af mediet, q1 og q2 beskriver størrelsen af de elektriske ladninger, og r er afstanden mellem ladningerne.
Den dielektriske konstant beskriver, hvordan mediet påvirker styrken af den elektrostatiske vekselvirkning. Et meget polariserbart solvent som vand har en høj dielektrisk konstant (ca. 80 ved 25°C) og leder ikke det elektriske felt godt, idet vandmolekylerne orienterer sig i forhold til det elektrostatiske felt. Et apolært solvent som f.eks. octanol har en lav dielektisk konstant, hvilket giver stærkere interaktioner end de tilsvarende i vand.
En vandig proteinopløsning kan ikke beskrives tilstrækkelig nøjagtigt som én fase med en uniform dielektrisk konstant, eftersom proteiner er mere apolære end vand, og Coulomb’s lov derfor giver unøjagtige beregninger for elektriske kræfter med statiske proteinstrukturer. Der er udviklet flere beregningsmetoder til at løse dette problem. De mest populære er Poisson-Boltzmann-baserede algoritmer, der typisk modellerer protein-vand systemet som et 2-fasesystem med en protein dielektrisk konstant på ca. 2-4, og en dielektrisk konstant for vandet på 80.
Der har i mange år været stor uenighed om størrelsen på den dielektriske konstant for proteiner i disse modeller. Forskellige forskningsgrupper har brugt værdier fra 2-20 i et forsøg på at reproducere eksperimentelt biofysiske karakteristika, som primært bestemmes af elektrostatiske kræfter. Disse har typisk været pKa-værdier af titrerbare aminosyregrupper i grupper målt vha. NMR pH-titreringseksperimenter, og de har vist sig at være svære at beregne nøjagtigt.
Det elektrostatiske felt og pKa-værdier
Før vi diskuterer, hvorfor pKa-værdier er svære at beregne og hvad dette fortæller os om det elektriske felt, er det vigtigt at forstå, hvad der producerer det elektriske felt, hvordan det påvirker pKa-værdierne i proteiner, og hvorfor pKa-værdier er vigtige for applikationen af enzymer.
Det elektriske felt i proteiner bestemmes af ladningsfordelingen i proteinet. I klassisk fysisk forstand kan ladningsfordelingen approksimeres ved at tildele hvert eneste atom i et protein en partiel ladning. Sådanne ladningsfordelinger modellerer dipoler og formelle ladninger med god nøjagtighed, men forholder sig ikke til inducerede dipoler og højere-ordens inducerede ladningseffekter.
I praksis vil man således tildele hvert atom en ladning på grundlag af et opslag i et ”kraftfelt”, som er udviklet til at reproducere egenskaber af aminosyrer, f.eks. disses partitioneringskoefficient i et octanol-vand-system. En backbone C=O-gruppe vil typisk have partielle ladninger af størrelsen +0.8 og -0.8, hvorimod den mindre stærke dipol i H-N-bindingen modelleres med partielle ladninger af størrelsen +0.3 og -0.3. Ved et sådant tabelopslag, ladningstildeling eller ”charge assignment”, kan man approksimere ladningsfordelingen af et givent protein, hvis man har en høj-opløsnings 3D-struktur af proteiner, hvori positionerne af hydrogenatomer også er bestemt.
Oftest er hydrogenatomer ikke synlige i protein 3D-strukturer bestemt ved røntgenkrystallografi, og positionerne skal derfor beregnes. Ydermere er ladningsfordelingen i et protein stærkt pH-afhængig.
Disse to fakta komplicerer ladningstilordningen betydeligt, idet ioniseringskonstanterne (pKa-værdierne) af de titrerbare aminosyrer (Glutaminsyre–Glu, Asparaginsyre–Asp, Histidin–His, Arginin–Arg, Lysin–Lys) til dels bestemmes af det elektriske felt i proteinet. F.eks. vil en Asp i et stærkt negativt ladet miljø have en højere pKa-værdi, hvorimod en Asp i et positivt ladet miljø vil have en lavere pKa-værdi.
Dvs. for at kunne bestemme det elektriske felt i et givent protein, så skal man kende pKa-værdierne for alle de titrerbare aminosyrer i deres specifikke miljø i proteinet, samt pH-værdien der er relevant for ladningstildelingen.
Det lyder umiddelbart som et hønen-eller-ægget problem, men det kan løses elegant ved at dekomponere bidragene til det elektrostatiske felt i en pH-afhængig og en pH-uafhængig komponent. Den pH-uafhængige komponent beregnes først, hvorimod den pH-afhængige typisk bestemmes ved evalueringen af en Boltzmann-sum, som summerer over alle tilgængelige protoneringstilstande i proteiner. Selv for små proteiner (100 aminosyrer) er antallet af mulige protoneringstilstande meget højt, eftersom dette afhænger af antallet af protonerbare grupper (N) som 2N. Eksempelvis består et middelstort enzym som en -amylase af ca. 500 aminosyrer og ca. 130 titrerbare grupper, hvilket giver 1.4*1039 mulige protoneringstilstande. Direkte evaluering af Boltzmann-summen er selvsagt ikke mulig, men med sampling-teknikker såsom Monte Carlo eller andre approksimationer kan man finde gode løsninger på få sekunder.
pKa-værdier og faktorer, der bestemmer disse
Af de 20 naturligt forekommende aminosyrer titrerer Arg, Asp, Cys, Glu, His, Tyr og Lys ved pH-værdier mellem 2 og 12. Ydermere vil hhv. N- og C-terminalen af proteinet titrere, og standard pKa-værdierne er kendt for alle disse titrerbare grupper. En pKa-værdi er et mål for energiforskellen mellem den protonerede og den uprotonerede form af en titrerbar gruppe, og denne energi bestemmes tildels af identiteten af den givne aminosyre og tildels af miljøet omkring den titrerbare gruppe som nævnt ovenfor.
En Asp har eksempelvis en pKa-værdi på ca. 4.0 i vandig opløsning, men fikseres denne nær en negativ ion såsom en klorid-ion, vil den ufavorable elektrostatiske vekselvirkning mellem den negative ion og den negative ladning på Asp bevirke, at pKa-værdien af Asp’en bliver forhøjet. Dette gør sig også gældende for interaktioner mellem titrerbare aminosyrer, og mellem disse og partielle ladninger og udvirker, at der er stor forskel på pKa-værdierne på f.eks. aspartater i proteiner.
Tabel 1 viser pKa-værdierne af de første syv titrerbare aminosyrer i Hen Egg White Lysozyme og demonstrerer, at der kan være stor forskel på standard pKa-værdien og den faktisk målte pKa-værdi i proteinets foldede tilstand.
Effekt af pKa-værdier
Denne spredning i et proteins pKa-værdier er andet end et kuriosum, og har en stor funktionsmæssig betydning. Der observeres bl.a. en effekt på proteinstabilitet og enzymatiske pH-aktivitetsprofiler.
Et enzym katalyserer kemiske reaktioner ved at tilvejebringe et miljø omkring det bundne substrat, således at energien af overgangstilstanden (transition state) for den kemiske reaktion nedbringes. Typisk er det en eller to specifikke protoneringstilstande, som er katalytisk aktive, og derfor er aminosyrernes pKa-værdier i det aktive site af stor betydning for enzymets pH-aktivitetsprofil.
I Hen Egg White Lysozyme (HEWL) er to syregrupper (Glu 35 og Asp 52) involveret i katalysen. Glu 35 skal være protoneret og Asp 52 skal være negativt ladet for, at den katalytiske reaktion kan foregå. Den katalytisk kompetente protoneringstilstand (KKP) kan således beskrives som Glu35H, Asp52-. pKa-værdierne for isolerede Asp og Glu sidekæder i vandig opløsning er hhv. 4.0 og 4.4, hvilket giver en meget smal pH-aktivitetsprofil for enzymet (figur 2a). I virkeligheden er pKa-værdierne i HEWL perturberet, så enzymet er katalytisk aktivt fra pH 3-7 jf. pKa-værdierne i tabel 1 (figur 2b).
Ændrede pKa-værdier har også stor betydning for pH-stabilitetsprofilen af proteiner. I de fleste tilfælde er der forskel på pKa-værdierne mellem den foldede og udfoldede tilstand af proteinet, og her observerer man typisk en stærk pH-afhængighed af proteinets stabilitet, hvor pKa-værdierne spiller den primære rolle.
pKa-værdier er således vigtige for et enzyms pH-stabilitets- og pH-aktivitetsprofil. De er indirekte bestemmende for, hvilke betingelser enzymet kan bruges under. Da elektrostatiske kræfter spiller en stor rolle i at bestemme et enzyms pKa-værdier, er det vigtigt at forstå disse, hvis man vil optimere/engineere et enzym, så det virker under specifikke industrielle betingelser.
Hvorfor er pKa-værdier svære at beregne nøjagtigt?
Vi er nu nået tilbage til vores udgangspunkt og forklaringen på, hvorfor undertegnede og forskningsgrupper, der arbejder med proteinelektrostatik, ikke har gjort nævneværdige fremskridt de sidste 10-15 år mht. udvikling af modeller, der kan beregne protein pKa-værdier mere nøjagtigt.
I løbet af de sidste 10 år er to nye eksperimentelle teknikker blevet udviklet til at måle det elektrostatiske felt mere direkte end det har været muligt med pKa-værdier. Målinger baseret på pH- og ladnings-inducerede ændringer i det NMR kemiske skift og på vibrational Stark spectroskopi har vist, at det elektriske felt i proteiner modelleres bedst med en lav protein dielektrisk konstant i Poisson-Boltzmann ligningen. Dvs., at det elektrostatiske felt er stærkt, og at pKa-beregningsalgoritmer – hvis de modellerer proteiner realistisk – bør bruge en dielektrisk konstant på 2-4.
Desværre så overestimerer pKa-beregningalgoritmer de protein-inducerede ændringer i pKa-værdier, hvis de bruger så lave dielektrisk konstanter, og vi er derfor i den situation, at korrekt modellering af det elektriske felt bevirker, at de beregnede pKa-værdier bliver endnu værre.
En forklaring på den observation er, at andre effekter end det protein-inducerede elektriske felt har stor betydning for et proteins pKa-værdier. En mulig effekt, som kan være skyld i diskrepansen, og som sjældent modelleres pga. af dens kompleksitet, er ændringerne i vandstrukturen omkring proteinet, der sker, når en aminosyre titrerer. Det har altid været velkendt, at ionisering afstedkommer ændringer i den umiddelbare vandstruktur, men man har i mange år ignoreret dette i håbet om, at en detaljeret beskrivelse af proteinstrukturen og Poisson-Boltzmann-ligningen kunne give en tilstrækkelig nøjagtig beskrivelse af de faktorer, der er vigtige for pKa-værdier.
Med de nye data for det elektrostatiske felts styrke er det klart, at detaljeret modellering ioniserings-inducerede ændringer i vandstrukturen bør være et fokusområde for fremtidig udvikling af algoritmer til beregning af elektrostatiske effekter i proteiner.
Selv efter ca. 100 års studie er det svært at forstå selv simple effekter som elektrostatik i proteiner, og for elektrostatik-nørder er det gode nyheder!
Kilder
Vibrational Stark Spectroscopy Directly Probes Electric Fields in Proteins. S Boxer, S Bagchi, SD Fried, N Levinson, M Saggu, L Xu. Biophysical Journal 104 (2), 355a.
Protein dielectric constants determined from NMR chemical shift perturbations. Predag Kukic, Damien Farrell, Lawrence P MacIntosch, Bertrand García-Moreno E, Kristine Steen Jensen, Zigmantas Toleikis, Kaare Teilum, Jens Erik Nielsen. Journal of the American Chemical Society 135 (45), 16968-16976.
The pKa Cooperative: A collaborative effort to advance structure-based calculations of pKa values and electrostatic effects in proteins. JE Nielsen, MR Gunner, E García-Moreno. Proteins: Structure, Function and Bioinformatics 79 (12), 3249-3259.