Forelesning 2: Plotting og datahåndtering#
I denne forelesningen skal vi se på datavisualisering og datahåndtering. Vi skal se på:
enkel plotting (med matplotlib og seaborn)
lese datafiler (med pandas)
rydde og visualisere data (med pandas)
Vi kan plotte små datasett ved å benytte lister:
# pH i vann som funksjon av temperaturen i grader C
T = [0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
pH = [7.48, 7.29, 7.10, 6.90, 6.72, 6.61, 6.50, 6.41, 6.32, 6.26, 6.19]
Oppgave: Visualiser dataene overfor. Plott også funksjonen x^2 - x + 2.
Store datafiler kan vi lese inn direkte, enten ved hjelp av basisfunksjonene i Python eller ved hjelp av biblioteker som numpy og pandas.
Pandas!#
Lese fil og undersøke innholdet#
Finne og systematisere sammenhenger#
Lage nye verdier i datarammen#
Oppgave:
Les av fila “pengwings.txt” og undersøk dataene
Finn pingvinen med kortest nebb.
Velg ut og undersøk (med “head”) kun damepingvinene
Hva veier den tyngste damepingvinen?
Menti: www.menti.com/wzruzmq8cw
Visualisere sammenhenger#
Lese ulike filer#
Oppgave: Prøv å lese fila “dec”. Bruk head-funksjonen til å undersøke om du har lest fila korrekt.