H1: Gegevens & data
1. Data coderen
1.1 Digitaal
Digitaal signaal = geeft gegevens weer als een reeks discrete
waarden: op 1 bep moment kan het hoogstens 1 van een eindig
aantal waarden innemen
Digitaal is afgeleid v digiti (vingers ih Latijn)
Bit
= Meest elementaire eenheid v informatie het heeft maar 2
mogelijke waarden
- Het is geen codering, mr de informatie zelf
- Voorbeeld: Morse code (binaire codering: lang vs kort signaal)
Bits werden vroeger opgeslagen in ponskaarten: elke pos/potentieel
gat was een bit
Term werd uitgevonden door Shannon
Bits & bytes
Bits worden gecombineerd in bytes: 8 bits = 1 byte
Hoe langer de reeks bits hoe mr informatie kan opgeslagen
worden
Hoeveelheid bits
1 bit:
- Kan twee verschillende waarden hebben: 0 of 1.
- Mogelijkheden: 2 (0, 1)
2 bits:
- Kan vier verschillende combinaties van waarden hebben: 00,
01, 10, 11.
- Mogelijkheden: 4
3 bits:
- Kan acht verschillende combinaties van waarden hebben: 000,
001, 010, 011, 100, 101, 110, 111.
- Mogelijkheden: 8
Algemene regel:
1
, - De algemene regel voor het aantal mogelijkheden met N bits
is: 2^N (twee tot de Nde macht)
o Bijvoorbeeld, met 4 bits heb je 2^4=16 mogelijkheden.
Waarom is dit belangrijk?
- Hoe meer bits mr ≠ waarden/combinaties je kunt maken.
meer informatie opslaan & verwerken.
- In de praktijk worden bits meestal in groepen verwerkt, zoals in
bytes (8 bits, 256 mogelijke waarden: daar kan je bvb 256
verschillende tekens mee coderen). Dit maakt het mogelijk om
complexere gegevens zoals tekst, afbeeldingen en geluid op te
slaan en te verwerken.
Welk soort informatie kan ik coderen met bytes?
Tekst
Afbeeldingen
Geluid
Video
Programma’s & software
Sensorgegevens, configuratiebestanden, …
Decimale codering van gehele getallen (voorbeeld)
Basis 10 Systeem:
- Het decimale stelsel, of basis 10, gebruikt de cijfers 0 tot en met
9.
- Elke positie in een getal vertegenwoordigt een macht van 10,
afhankelijk van de positie van het cijfer.
Voorbeeld: 152
- We kunnen 152 opsplitsen in de som van de machten van tien.
o Positie 1: 2 × 10^0 (vermenigvuldiging)
10^0 is gelijk aan 1 2 × 10^0 2
o Tientallen: 5 × 10^1
10^1 is gelijk aan 10 5 × 10^1 50
o Honderdtallen: 1 × 10^2
10^2 is gelijk aan 100 1 × 10^2 100
2
, Som van de Machten van Tien:
- 152 kan worden geschreven als:
o 1×10^2+5×10^1+2×10^0
o Dit komt neer op: 100 + 50 + 2 = 152.
Conclusie:
- Elk cijfer vertegenwoordigt een specifieke macht van 10,
afhankelijk van zijn pos: de nummer van de macht is “n. positie
– 1” (het eerste cijfer (2) heeft dus positie 1-1=0. Daarom 2 ×
10^0)
- Door deze machten van tien bij elkaar op te tellen, krijgen we
het oorspronkelijke getal.
Binaire codering van getallen
Basis 2 Systeem:
- Het binaire stelsel, of basis 2, gebruikt slechts 2 cijfers: 0 en 1.
- Elke pos ie binaire getal vertegenwoordigt een macht v 2,
afhankelijk vd positie van het cijfer.
Voorbeeld: 101
- We kunnen 101 opsplitsen in de som van de machten van
twee.
o Positie 1: 1 × 2^0 (vermenigvuldiging)
2^0 is gelijk aan 1 1 × 2^0 1
o Positie 2: 0 × 2^1
2^1 is gelijk aan 2 0 × 2^ 0
o Positie 3: 1 × 2^2
2^2 is gelijk aan 4 1 × 2^2 4
Som van de Machten van Twee:
- 101 kan worden geschreven als:
o 1×2^2+0×2^1+1×2^0
o Dit komt neer op: 4 + 0 + 1 = 5.
Hexadecimale code
Weergave vaak gevonden in de informatica
Base 16 162 = 256 combinaties
Symbolen: 0-9, A-F
Weergave, geen codering: De computers vertalen het altijd naar
binair
3
, 1.2. Tekens
Voorlopers van gecodeerde tekens
Francis Bacon (1561-1626): geheime code waarbij elke letter wordt
weergegeven door een reeks van twee symbolen
Emile Baudot (1845-1903): set van vijf 1/0 bits -> 32 tekens, twee
sets (één bit gereserveerd om de set te identificeren)
ASCII-codering
American Standard Code for Information Interchange
Eerste standaardversie in de jaren 60.
7 bits 128 tekens kan coderen
Cijfers, Latijnse kleine letters, Latijnse hoofdletters, leestekens,
controlecodes (regelterugloop)
Na ASCII: nood aan meer karkaters
Sets van 1 byte met tekens
Bijv. Windows 1252
- Single-byte codering van het Latijnse alfabet
- Standaard gebruikt met Engelse documenten op Windows
Nood aan standaarden: unicode
Elk teken = uniek codepunt (geeft nt aantal bytes aan) (= U+<hex-
code>)
Karakter vs. Glyph:
- Karakter: Een karakter is een abstract symbool dat een letter,
cijfer, leesteken, etc. vertegenwoordigt.
- Glyph: Een glyph is de visuele weergave van een karakter.
Unicode specificeert karakters, niet glyphs.
De eerste 256 tekens in de Unicode-bibliotheek= 1 byte
Elk codepunt (hexadecimaal getal) kan op veel ≠ manieren in binary
code worden weergegeven, volgens verschillende transformaties
UTF-8 (Unicode-transformatie Format -8 bit) is een van die toewijzing
aan binaire code
Oudgrieks
BetaCode: transliteratieschema van Griekse tekens en diakritische
tekens naar Latijnse letters
W(=I)
4
1. Data coderen
1.1 Digitaal
Digitaal signaal = geeft gegevens weer als een reeks discrete
waarden: op 1 bep moment kan het hoogstens 1 van een eindig
aantal waarden innemen
Digitaal is afgeleid v digiti (vingers ih Latijn)
Bit
= Meest elementaire eenheid v informatie het heeft maar 2
mogelijke waarden
- Het is geen codering, mr de informatie zelf
- Voorbeeld: Morse code (binaire codering: lang vs kort signaal)
Bits werden vroeger opgeslagen in ponskaarten: elke pos/potentieel
gat was een bit
Term werd uitgevonden door Shannon
Bits & bytes
Bits worden gecombineerd in bytes: 8 bits = 1 byte
Hoe langer de reeks bits hoe mr informatie kan opgeslagen
worden
Hoeveelheid bits
1 bit:
- Kan twee verschillende waarden hebben: 0 of 1.
- Mogelijkheden: 2 (0, 1)
2 bits:
- Kan vier verschillende combinaties van waarden hebben: 00,
01, 10, 11.
- Mogelijkheden: 4
3 bits:
- Kan acht verschillende combinaties van waarden hebben: 000,
001, 010, 011, 100, 101, 110, 111.
- Mogelijkheden: 8
Algemene regel:
1
, - De algemene regel voor het aantal mogelijkheden met N bits
is: 2^N (twee tot de Nde macht)
o Bijvoorbeeld, met 4 bits heb je 2^4=16 mogelijkheden.
Waarom is dit belangrijk?
- Hoe meer bits mr ≠ waarden/combinaties je kunt maken.
meer informatie opslaan & verwerken.
- In de praktijk worden bits meestal in groepen verwerkt, zoals in
bytes (8 bits, 256 mogelijke waarden: daar kan je bvb 256
verschillende tekens mee coderen). Dit maakt het mogelijk om
complexere gegevens zoals tekst, afbeeldingen en geluid op te
slaan en te verwerken.
Welk soort informatie kan ik coderen met bytes?
Tekst
Afbeeldingen
Geluid
Video
Programma’s & software
Sensorgegevens, configuratiebestanden, …
Decimale codering van gehele getallen (voorbeeld)
Basis 10 Systeem:
- Het decimale stelsel, of basis 10, gebruikt de cijfers 0 tot en met
9.
- Elke positie in een getal vertegenwoordigt een macht van 10,
afhankelijk van de positie van het cijfer.
Voorbeeld: 152
- We kunnen 152 opsplitsen in de som van de machten van tien.
o Positie 1: 2 × 10^0 (vermenigvuldiging)
10^0 is gelijk aan 1 2 × 10^0 2
o Tientallen: 5 × 10^1
10^1 is gelijk aan 10 5 × 10^1 50
o Honderdtallen: 1 × 10^2
10^2 is gelijk aan 100 1 × 10^2 100
2
, Som van de Machten van Tien:
- 152 kan worden geschreven als:
o 1×10^2+5×10^1+2×10^0
o Dit komt neer op: 100 + 50 + 2 = 152.
Conclusie:
- Elk cijfer vertegenwoordigt een specifieke macht van 10,
afhankelijk van zijn pos: de nummer van de macht is “n. positie
– 1” (het eerste cijfer (2) heeft dus positie 1-1=0. Daarom 2 ×
10^0)
- Door deze machten van tien bij elkaar op te tellen, krijgen we
het oorspronkelijke getal.
Binaire codering van getallen
Basis 2 Systeem:
- Het binaire stelsel, of basis 2, gebruikt slechts 2 cijfers: 0 en 1.
- Elke pos ie binaire getal vertegenwoordigt een macht v 2,
afhankelijk vd positie van het cijfer.
Voorbeeld: 101
- We kunnen 101 opsplitsen in de som van de machten van
twee.
o Positie 1: 1 × 2^0 (vermenigvuldiging)
2^0 is gelijk aan 1 1 × 2^0 1
o Positie 2: 0 × 2^1
2^1 is gelijk aan 2 0 × 2^ 0
o Positie 3: 1 × 2^2
2^2 is gelijk aan 4 1 × 2^2 4
Som van de Machten van Twee:
- 101 kan worden geschreven als:
o 1×2^2+0×2^1+1×2^0
o Dit komt neer op: 4 + 0 + 1 = 5.
Hexadecimale code
Weergave vaak gevonden in de informatica
Base 16 162 = 256 combinaties
Symbolen: 0-9, A-F
Weergave, geen codering: De computers vertalen het altijd naar
binair
3
, 1.2. Tekens
Voorlopers van gecodeerde tekens
Francis Bacon (1561-1626): geheime code waarbij elke letter wordt
weergegeven door een reeks van twee symbolen
Emile Baudot (1845-1903): set van vijf 1/0 bits -> 32 tekens, twee
sets (één bit gereserveerd om de set te identificeren)
ASCII-codering
American Standard Code for Information Interchange
Eerste standaardversie in de jaren 60.
7 bits 128 tekens kan coderen
Cijfers, Latijnse kleine letters, Latijnse hoofdletters, leestekens,
controlecodes (regelterugloop)
Na ASCII: nood aan meer karkaters
Sets van 1 byte met tekens
Bijv. Windows 1252
- Single-byte codering van het Latijnse alfabet
- Standaard gebruikt met Engelse documenten op Windows
Nood aan standaarden: unicode
Elk teken = uniek codepunt (geeft nt aantal bytes aan) (= U+<hex-
code>)
Karakter vs. Glyph:
- Karakter: Een karakter is een abstract symbool dat een letter,
cijfer, leesteken, etc. vertegenwoordigt.
- Glyph: Een glyph is de visuele weergave van een karakter.
Unicode specificeert karakters, niet glyphs.
De eerste 256 tekens in de Unicode-bibliotheek= 1 byte
Elk codepunt (hexadecimaal getal) kan op veel ≠ manieren in binary
code worden weergegeven, volgens verschillende transformaties
UTF-8 (Unicode-transformatie Format -8 bit) is een van die toewijzing
aan binaire code
Oudgrieks
BetaCode: transliteratieschema van Griekse tekens en diakritische
tekens naar Latijnse letters
W(=I)
4