Forelesning 2: Plotting og datahåndtering#

I denne forelesningen skal vi se på datavisualisering og datahåndtering. Vi skal se på:

  • enkel plotting (med matplotlib og seaborn)

  • lese datafiler (med pandas)

  • rydde og visualisere data (med pandas)

Vi kan plotte små datasett ved å benytte lister:

# pH i vann som funksjon av temperaturen i grader C
T = [0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
pH = [7.48, 7.29, 7.10, 6.90, 6.72, 6.61, 6.50, 6.41, 6.32, 6.26, 6.19]

Oppgave: Visualiser dataene overfor. Plott også funksjonen x^2 - x + 2.

Store datafiler kan vi lese inn direkte, enten ved hjelp av basisfunksjonene i Python eller ved hjelp av biblioteker som numpy og pandas.

Pandas!#

Lese fil og undersøke innholdet#

Finne og systematisere sammenhenger#

Lage nye verdier i datarammen#

Oppgave:

  1. Les av fila “pengwings.txt” og undersøk dataene

  2. Finn pingvinen med kortest nebb.

  3. Velg ut og undersøk (med “head”) kun damepingvinene

  4. Hva veier den tyngste damepingvinen?

Menti: www.menti.com/wzruzmq8cw

Visualisere sammenhenger#

Lese ulike filer#

Oppgave: Prøv å lese fila “dec”. Bruk head-funksjonen til å undersøke om du har lest fila korrekt.