Analyse av enzymkinetikkdata

Analyse av enzymkinetikkdata#

I forrige laboratorieoppgave gjorde dere kinetikkmålinger på enzymet alkalisk fosfatase, som er vist nedenfor.

You appear to be running in JupyterLab (or JavaScript failed to load for some other reason). You need to install the 3dmol extension:
jupyter labextension install jupyterlab_3dmol

Du skal nå lære hvordan du kan visualisere og analysere enzymkinetikkdata med Python. Du kan bruke en valgfri editor til å lage programmene som gjør analysen av data fra enzymkinetikklaben, for eksempel Jupyter Notebook. Figurene og resultatene skal brukes i labrapporten. Hvis du står fast, kan du spørre generativ kunstig intelligens (gpt.uio.no) om hjelp. Da kan det være lurt å spesifisere hvilken del av koden du trenger hjelp til ved å lime inn koden og formatet på datafilene dine. Hvis dette heller ikke hjelper, kan du spørre labansvarlige om hjelp (veiledningstime uka etter laben).

NB: For alle oppgaven nedenfor anbefaler vi at dere enten prøver helt selv først (hvis du er komfortabel med programmering), eller at du prøver å generere koden med KI, og leser og evaluerer denne. Deretter kan du eventuelt se på løsningsforslaget. All kode skal legges som vedlegg til rapporten.

Steg 1: Finne initialhastighetene#

Før vi kan begynne å analysere en Michaelis-Menten-modell for dataene våre, må vi finne initialhastigheten til reaksjonen som en funksjon av substratkonsentrasjonen fra dataene våre av absorbansøkning over tid.

Importere data#

Du har lagret data fra enzymkinetikklaben som separate csv-filer. Fila inneholder to kolonner: tid og absorbans. Vi skal bruke disse dataene til å finne initialhastigheten til reaksjonen som en funksjon av substratkonsentrasjonen.

La oss se på hvordan vi kan lese av fila. Det finnes mange måter å importere filer på i Python. Du kan velge den metoden du er mest komfortabel med. Det enkleste metoden er å bruke read_csv fra pandas-biblioteket:

import pandas as pd

data = pd.read_csv("Absorbans_tid.csv") # Leser fila

tid = data["tid"]
absorbans = data["absorbans"]

Fila du skal lese av, må ligge i samme mappe som programmet som skal analysere og lese fila. Eventuelt kan vi angi filbanen, f.eks. “datafiler/Absorbans_tid.csv”. Vi kan også lese direkte fra internett. Da erstatter du filnavnet med en lenke.

Du skal lese fem filer, en for hver substratkonsentrasjon. Du kan bruke en løkke for å lese alle filene.

Oppgave

Lag et program som leser alle filene og lagrer dataene i lister. Du kan ta utgangspunkt i programmet nedenfor. Prøv selv før du kikker på løsningsforslaget!

import pandas as pd
import matplotlib.pyplot as plt

# Liste over filnavn
data_files = [f"data{i}.csv" for i in range(1, 6)] # Denne lista kan også lages manuelt (["data1.csv", "data2.csv", ...])

# Les og plott data fra alle filer med en løkke som går over alle filnavnene
# Fyll inn koden her

plt.xlabel("Tid (min)")
plt.ylabel("Absorbans")
plt.legend()
plt.grid()
plt.show()

Løsningsforslag

import pandas as pd
import matplotlib.pyplot as plt

# Liste over filnavn
data_files = [f"data{i}.csv" for i in range(1, 6)] # Denne lista kan også lages manuelt (["data1.csv", "data2.csv", ...])

# Les og plott data fra alle filer
for file in data_files:
    df = pd.read_csv(file, delimiter=";")
    t = df["tid_min"]
    A = df["abs"]
    plt.scatter(t, A, label=file)

plt.xlabel("Tid (min)")
plt.ylabel("Absorbans")
plt.title("Absorbansmålinger uten hemmer")
plt.legend()
plt.grid()
plt.show()

Lineærtilpasning av dataene#

Lineær regresjon betyr å finne et polynom av første grad (en førstegradsfunksjon) som gir minst mulig gjennomsnittlig varians til et sett med datapunkter. Metodene vi skal bruke, benytter minste kvadraters metode for å estimere en slik funksjon. En funksjon som er ganske enkel å bruke til dette, er polyfit fra numpy-biblioteket. Du kjenner kanskje til og med denne funksjonen fra før (f.eks. fra IN-KJM1900). Denne funksjonen utfører polynomregresjon med en vilkårlig grad av polynomet.

Det polyfit-funksjonen derimot ikke kan estimere direkte, er andre typer regresjonsmodeller enn lineære, slik som eksponentialfunksjoner, logaritmefunksjoner eller logistiske funksjoner. Vi skal gjøre en logistisk regresjon seinere, og derfor benytter vi heller en annen funksjon som heter curve_fit fra scipy-biblioteket også når vi skal gjøre lineær regresjon i denne laben. Denne funksjonen returnerer både koeffisientene i regresjonslinja og et mål på hvor godt modellen passer dataene (såkalt kovarians). Det er koeffisientene a og b i uttrykket \(f(x) = ax + b\) som estimeres når vi gjør en linær regresjon.

I curve_fit må vi definere en funksjonsmodell på formen \(f(x, a, b, c, ...)\) som brukes som utgangspunkt for regresjonen. Her skal vi definere en funksjon \(f(x, a, b) = ax + b\).

Nå skal du gjøre en oppgavene/nivåene nedenfor. Velg kun én av nivåene. Dersom du mener du behersker enkel plotting og regresjon med curve_fit, velger du nivå 1. Dersom du er usikker på hvordan dette gjøres, kan du velge nivå 2. Prøv gjerne på nivå 1 før du prøver på nivå 2 - da lærer du enda mer! Du kan laste ned filene fra Canvas og bruke dem i en valgfri editor, som Jupyter Notebook eller Spyder.

Oppgave

Se på programmmet nedenfor og forklar hva det gjør, trinn for trinn.
Hva beskriver variabelen koeff?
Forklar hvordan vi kan plotte originaldataene sammen med regresjonslinja?

import pandas as pd
import numpy as np
import scipy.optimize as opt

data = pd.read_csv("Absorbans_tid.csv")

tid = data["tid"]
absorbans = data["absorbans"]

# Definerer formen på modellen vi ønsker
def modell(x, a, b):
    return a*x + b

koeff, covar = opt.curve_fit(modell, tid, absorbans)
# Finner a og b her
a = koeff[0]
b = koeff[1]

# Beregner funksjonsverdier til den lineære tilpasningen
x = np.linspace(0,35,100) # Nye x-verdier å plotte med
y = a*x + b               # Regresjonsmodellens y-verdier

Håndtering av flere datafiler#

Vi skal nå kombinere de to stegene ovenfor for å analysere alle dataene våre. Vi skal gjøre en lineær regresjon for hver fil og plotte regresjonslinjene sammen med originaldataene.

Oppgave

Prøv å kombinere løkka som leser alle dataene med regresjonen av dataene. Du kan ta utgangspunkt i programmene ovenfor. Prøv selv før du kikker på løsningsforslaget!

Løsningsforslag

import pandas as pd
import numpy as np
import scipy.optimize as opt
import matplotlib.pyplot as plt

# Liste over filnavn
data_files = [f"data{i}.csv" for i in range(1, 6)] # Denne lista kan også lages manuelt (["data1.csv", "data2.csv", ...])
S = [0.257, 0.0634, 0.0343, 0.0171, 0.0114] # Konsentrasjoner (mg/mL). 
# Definerer formen på modellen vi ønsker
def modell(x, a, b):
    return a*x + b

V0 = [] # Initialhastigheter

# Les og plott data fra alle filer
for file, kons in zip(data_files, konsentrasjoner): # kan også bruke for fole in data_files: dersom du ikke har med navnelapper på konsentrasjonene
    df = pd.read_csv(file, delimiter=";")
    t = df["tid_min"]
    A = df["abs"]

    koeff, covar = opt.curve_fit(modell, t, A)
    a = koeff[0]
    b = koeff[1]
    
    # Beregner funksjonsverdier til den lineære tilpasningen
    x = np.linspace(0,15) # Nye x-verdier å plotte med
    y = a*x + b               # Regresjonsmodellens y-verdier

    v0.append(a) # Legger til initialhastigheten i lista
    plt.scatter(t, A, label=str(kons) + " mg/mL")
    plt.plot(x, y, label=f"y = {a:.2f}x + {b:.2f}")

plt.xlabel("Tid (min)")
plt.ylabel("Absorbans")
plt.title("Absorbansmålinger av alkalisk fosfatase med PNPP")
plt.legend()
plt.grid()
plt.show()

Oppgave

Lagre grafen som et høyoppløselig bilde, og lagre dataene dine i en ny csv-fil. Dette kan du gjøre ved å legge til følgende kode nederst i programmet ditt (men før plt.show()):

plt.savefig("initialhastigheter.tiff") # kan også angi oppløsning med f.eks. dpi=500 (500 piksler per tomme)

# Lagrer dataene i en dataframe og skriver dem til en csv-fil
d = {"Hastighet": V0, "Substratkonsentrasjon": S}
df = pd.DataFrame(d)
df.to_csv("Reaksjonshastigheter.csv", index = False)

Steg 2: Finne vmaks og Km#

Michaelis-Menten-modellen#

Vi skal nå plotte og analysere resultatene fra første analyse. Vi skal altså lage et Michaelis-Menten-plott og tilpasse Michaelis-Menten-likningen til verdiene vi fant for initialhastighetene. Vi har lagret substratkonsentrasjonene og de tilhørende initialhastighetene i en .csv-fil (reaksjonshastigheter.csv), og vi skal bruke denne fila videre.

Oppgave

Les av fila som du lagde i forrige program, og skriv ut initialhastighetene og tilhørende substratkonsentrasjoner for å se at du har lest inn fila korrekt.
Plott dataene (gjerne med scatter, slik at du får punkter istedenfor linjer) slik at du får et Michaelis-Menten-plott (husk hvilken form grafen skal ha!). Husk aksetitler med korrekte enheter.

Nå skal vi lage en modellkurve som er basert på Michaelis-Menten-likningen. Denne kan vi definere som en Python-funksjon, slik (på samme måte som du definerte den lineære funksjonen i del 1):

def michaelis_menten(x, Vmax, Km):
    return Vmax*x/(Km + x)

Oppgave

Bruk funksjonen ovenfor og gjør en regresjon av initialhastighetene med curve_fit på samme måte som med den lineære funksjonen (men nå skal du bruke michaelis-menten-funksjonen som regresjonsmodell isteden).
Plott regresjonskurven i samme koordinatsystem som dataene dine.
Modifiser programmet slik at Km får enheten mol/L (M) og Vmax får enheten mol/L/min (M/min) (dette er ikke gjort i løsningsforslaget, så det må du gjøre selv). Ekstinksjonskoeffisienten, ε, til produktet er 18 000 M/cm. Lysveien, l (lengden av kyvetten), er 1 cm.

Løsningsforslag

import pandas as pd
import numpy as np

data = pd.read_csv("reaksjonshastigheter.csv")

S = data["Substratkonsentrasjon"]
V0 = data["Initialhastighet"]

def michaelis_menten(S, Vmax, Km):
    return Vmax*S/(Km + S)

koeff, covar = opt.curve_fit(michaelis_menten, S, V0)
Vmax = koeff[0]
Km = koeff[1]

# Beregner funksjonsverdier til Michaelis-Menten-tilpasningen
S = np.linspace(0,0.3,100) # Nye x-verdier å plotte med
V = michaelis_menten(S, Vmax, Km) # Regresjonsmodellens y-verdier

plt.scatter(S, V0, label="Data")
plt.plot(S, V, label=f"Michaelis-Menten: Vmax = {Vmax:.2f}, Km = {Km:.2f}")

plt.xlabel("Substratkonsentrasjon (mg/mL)")
plt.ylabel("Initialhastighet (mg/mL/min)")
plt.title("Michaelis-Menten-plot")
plt.legend()
plt.grid()
plt.show()

Enzymhemming#

For å avgjøre om en hemmer er ikke-konkurrerende eller konkurrerende, kan vi plotte en modell for initalhastigheter med og uten hemmer i samme koordinatsystem. Du kan bruke samme framgangsmåte som i del 1, der du lagde en løkke som gikk igjennom flere filer med data, analyserte og plottet dataene. Vi skal bruke et Lineweaver-Burk-plott for å sammenlikne resultatene for et enzym med og uten hemmer.

Oppgave

Bruk generativ kunstig intelligens, som gpt.uio.no til å lage et program som genererer et Lineweaver-Burk-plott av dataene dine med og uten hemmer. Husk å spesifisere følgende for KI-en:

Hva skal plottet vise?
Hvilket format er dataene dine i? Gi gjerne et utsnitt av datafilene som skal leses.
Hvordan ønsker du at programmet skal se ut? Skal det bruke funksjoner eller ikke? Ønsker du at det bruker Pandas? Polyfit for lineær regresjon, kanskje? Prøv å få programmet til å bruke programmeringsstrukturer du er kjent med og som du klarer å forstå.

Husk å evaluere det du får, og gå tilbake til KI-en og be den endre programmet dersom det ikke gir det plottet du ønsker.

pH-optimum#

I dette forsøket har du målt absorbansen kun ved start og slutt. Det betyr at du her ikke skal gjøre en kurvetilpassing for å beregne hastigheten, men istedenfor bruke differansen i absorbans og dividere med tiden. Husk å korrigere de siste avlesningsverdiene for fortynningen med Tris (hint: fortynningsfaktor).

Oppgave

Lag et program som plotter en grafisk fremstilling av reaksjonshastigheten som funksjon av pH. Du kan gjøre alle beregninger i programmet. Et hint er å lagre alle dataene dine i arrayer. Dette gjør det enkelt å behandle dataene matematisk, for eksempel for å ta hensyn til fortynningen med Tris.

Rapport#

Rapport

Lagre alle figurer du trenger med savefig-kommandoen og print ut eller lagre alle koeffisientene du har funnet. Bruk gjerne en tabell for å presentere resultatene. Skriv labrapporten din basert på resultatene du har funnet. Du kan bruke malen for labrapporten som ligger på Canvas. Husk å sette riktige enheter på alle verdier og grafer! Her er en veiledning for skriving av rapporten:

Forsøk 1: Fremstill initialhastigheten for de forskjellige prøvene uttrykt som absorbansøkning pr. min (= hastigheten) ved å plotte absorbansen som funksjon av tiden. Pass på at punktene du skal bruke for kurvetilpassing, fremdeles er i det lineære området. Gjør en lineærtilpasning for å finne initialhastighetene. Lag en figur som presenterer de eksperimentelle dataene og de tilhørende tilpasningene. Lag deretter en visualisering av initialhastigheten som funksjon av substratkonsentrasjonen, som kan angis som mg PNPP (dinatriumsaltet) i 3,5 ml inkubasjonsblanding (mg/3,5 mL). Dette er Michaelis-Menten-plottet. Gjør en kurvetilpasning i Python for å finne \(v_{maks}\) og \(K_m\). Molekylvekten for dinatriumsaltet av p-nitrofenylfosfat heksahydrat settes lik 371,2 g/mol. Oppgi resultatet for \(K_m\) i mol/L.
Forsøk 2: Plott absorbansen som funksjon av tiden for hemmet og uhemmet reaksjon. Finn \(K_m\) og \(v_{maks}\), og avgjør hva slags hemmer vi har brukt her.
Forsøk 3: Lag en grafisk fremstilling av reaksjonshastigheten som funksjon av pH. Husk å ta hensyn til fortynning med Tris-buffer.

Dere skal levere inn en individuell rapport som skal inneholde:

Introduksjon: En kort innledning for de fire delforsøkene hvor du skriver teori, bakgrunn og hensikten med forsøkene (ca. 1 side, maks 2)
Metoder: Et kort felles sammendrag av metodene (ca. 1/2 side – for detaljert prosedyre henviser du til laboppgaveteksten).
Resultater: En resultatdel som skal inneholde tabeller (med tabelltekst over tabellen) og grafer (med figurtekst under) av alle forsøkene.
Diskusjon: En kort diskusjon/analyse av resultatene (dette vil vanligvis være lengste del av rapporten).
Utregninger og rådata puttes i appendiks på slutten av rapporten

På Canvas ligger det en rapportmal som beskriver hvordan rapporten burde legges opp med lab 2+3 som eksempel og vurderingsmatrise som brukes for vurdering av rapportene. Dere har 2 forsøk på å få godkjent labrapport. Lever inn rapporten (1 per person) for lab 4 i Canvas senest to uker etter labøvelsen er gjennomført.

Analyse av enzymkinetikkdata

Contents

Analyse av enzymkinetikkdata#

Steg 1: Finne initialhastighetene#

Importere data#

Lineærtilpasning av dataene#

Håndtering av flere datafiler#

Steg 2: Finne vmaks og Km#

Michaelis-Menten-modellen#

Enzymhemming#

pH-optimum#

Rapport#