Written by students who passed Immediately available after payment Read online or as PDF Wrong document? Swap it for free 4.6 TrustPilot
logo-home
Other

School of Data Science - Python cursus - Pandas Cheatsheet

Rating
-
Sold
-
Pages
2
Uploaded on
05-07-2021
Written in
2020/2021

Een samenvatting van de meestgebruikte functies van de Pandas library voor Python. De Pandas library is de meest gebruikte library voor het importen en bewerken van tabel data. De vragen zijn onderdeel van de Python for Data Analysis cursus van School of Data Science.

Show more Read less
Institution
Module

Content preview

Python - Pandas Cheatsheet
import pandas as pd


importeren en exporteren
df = pd.read_csv(“location.csv”) Importeert dataset en slaat het op onder de naam df. De
default is hier csv. Heb je een andere delimiter?
Gebruik de sep parameter.

df.to_csv('mijnDataset.csv') Slaat dataset df op als mijnDataset.csv


Beschrijvende functies
df.head() Laat de eerste 5 rijen zien van je dataset.

df.tail() Laat de laatste 5 rijen zien van je dataset.

df.describe() Geeft beschrijvende statistieken van je dataset. Wanneer er een
numerieke kolom aanwezig is in je dataset, zal de beschrijving
uitsluitend op deze kolom gericht zijn.

df.shape Geeft het aantal rijen en kolommen weer.

df.dtypes Geeft aan welke datatypes aanwezig zijn in je dataset.

df.mean() Geeft van iedere numerieke kolom de gemiddelde waarde.

df.median() Geeft van iedere numerieke kolom de mediaan.

df.isnull() Geeft weer welke rijen missende data bevatten.

df.notnull() Geeft weer welke rijen geen missende data bevatten.

df[‘A’].value_counts() Geeft binnen kolom A weer hoeveel er per waarde aanwezig zijn.

df[‘A’].unique() Geeft alle unieke waarden binnen kolom A.


Sorteren van data
df.sort_values(‘A’, Sorteert je dataset op basis van kolom met naam A. Bij de
ascending = True/False) ascending parameter kun je middels True of False aangeven of
je het oplopend wilt of niet.

pd.crosstab(df[‘A’], Creëert een frequentietabel van kolom A in combinatie met
df[‘B’]) kolom B.


Selecteren van data
df.iloc[0,0] Selecteert het element op index positie rij 0 en
kolom 0.

df.loc[‘rijA’,’kolomA’] Selecteert data in rijA en kolomA

df[‘kolomA’] Selecteert kolom met naam ‘A’.

df[df[‘kolomA’] == ‘A’] Filteren door binnen de kolomA te zoeken naar de
string A en alleen de rijen te selecteren die
binnen die voorwaarde vallen.

df[(df[‘kolomA’] == ‘A’) & Het gebruik van meerdere condities om rijen te
(df[‘kolomB’ > 8)] selecteren die voldoen aan de voorwaarden.

df[df[‘kolomA’].isin(['A',B','C'])] Seleceert rijen binnen kolomA wanneer het element
gelijk is aan de string ‘A’, ‘B’ of ‘C’.




School of Data Science
Lulofsstraat 55, Unit 48 | 2521AL, Den Haag
+31 70 221 1586
schoolofdatascience.nl

Written for

Module

Document information

Uploaded on
July 5, 2021
Number of pages
2
Written in
2020/2021
Type
OTHER
Person
Unknown

Subjects

Free
Get access to the full document:
Download

Wrong document? Swap it for free Within 14 days of purchase and before downloading, you can choose a different document. You can simply spend the amount again.
Written by students who passed
Immediately available after payment
Read online or as PDF

Get to know the seller
Seller avatar
SchoolOfDataScience

Get to know the seller

Seller avatar
SchoolOfDataScience School of Data Science
Follow You need to be logged in order to follow users or courses
Sold
2
Member since
4 year
Number of followers
1
Documents
4
Last sold
11 months ago
School of Data Science is dé opleider in Nederland op het gebied van Data Science, Machine Learning en Artificial Intelligence.

Door expertise en een focus op persoonlijke aandacht is School of Data Science uitgegroeid tot de beste opleider op het gebied van Data Science. Hieronder zijn een aantal cijfers over ons te lezen. -Honderden cursisten les gegeven en bedrijven begeleid in data science gerelateerde cursussen. -Gemiddelde waardering van 9,7 op Springest. -Organisator van AI Learning Communities via Meetup met 1000+ leden in Den Haag, Rotterdam en Amsterdam. -1400+ actieve volgers op LinkedIn die mee doen met data science challenges of leren over de nieuwste ontwikkelingen via onze posts en webinars.

Read more Read less
0.0

0 reviews

5
0
4
0
3
0
2
0
1
0

Trending documents

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their exams and reviewed by others who've used these revision notes.

Didn't get what you expected? Choose another document

No problem! You can straightaway pick a different document that better suits what you're after.

Pay as you like, start learning straight away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and smashed it. It really can be that simple.”

Alisha Student

Frequently asked questions