L-DATA
1. Data voor humane wetenschappen
Deel I: Data coderen
Computers vandaag de dag
Def.: Een computer is een apparaat waarmee gegevens volgens formele procedures (algoritmen)
kunnen worden verwerkt. Meestal wordt met het woord computer een elektronisch, digitaal
apparaat bedoeld, maar er bestaan ook mechanische en analoge computers. (Wikipedia)
Vooral over elektronische en digitale apparaten praten, link tonen tussen moderne computers en
oude methodes om informatie te verwerken.
Elektronica
Def.: Het bestudeert hoe elektrische stroom in een schakeling, waarin elektronenbuizen of
halfgeleidertechniek zijn verwerkt, kan worden gestuurd. (Wikipedia)
Al onze informatie moet uiteindelijk elektronische stroom worden, hoe doen we dat? Hoe kan bv. een
handschrift, gevoel, idee, elektronische stroom worden?
Digitaal
Def.: Digitaal signaal geeft gegevens weer als een reeks discrete waarden: op een bepaald moment
kan het hoogstens één van een eindig aantal waarden aannemen (Wikipedia)
=> een digitaal signaal betekent dat informatie wordt weergegeven met duidelijke stapjes/ discrete
waarden. Het kan maar een beperkt aantal waarden aannemen, meestal 0 of 1. Er bestaan geen
tussenwaarden. Bv. een lamp: kan enkel aan of uit, dus in stapjes:
(Het tegenovergestelde van digitaal is analoog, dan zijn er oneindig veel mogelijke waarden. Bv. de
zon, die sterker of zwakker kan schijnen.)
Informatie kan waarden aannemen aan een grote schaal van nummers.
1
,Wanneer is informatie digitaal?
Het woord ‘digitaal’ komt van ‘digit’, wat cijfer betekent. Dat komt dan weer van
het Latijnse ‘digiti’, dat aangaf dat vingers werden gebruikt om te tellen.
Digitale informatie betekent dus dat je kunt tellen hoeveel mogelijke waarden
er zijn.
Bv. een digitaal signaal kan 0 of 1 zijn, je kunt dus altijd een eindig aantal
mogelijkheden opsommen. Bij analoog is dit niet mogelijk, omdat er oneindig veel waarden zijn.
Analoog versus digitaal? Oefening
1. FM-radio-uitzending analoog, het geluid wordt als een
radiogolf verstuurd. Die golf kan vloeiend veranderen.
2. HDMI-videotransmissie digitaal, HDMI stuurt beeld en
geluid via nullen en enen. Er zijn geen tussenwaarden,
alleen duidelijke stapjes.
3. Vinyl platenspeler analoog, de naald volgt de groeven
in de plaat. De groeven zijn een directe/vloeiende kopie van het geluidsignaal.
4. Bluetooth audio gegevensstromen digitaal, geluid wordt eerst gecomprimeerd (omgezet in
nullen en enen). Daarna wordt het draadloos verzonden als digitale pakketjes.
Ezelsbruggetje:
Radio en vinyl = ouderwets analoog
HDMI en bluetooth = modern digitaal, apparaten die communiceren met computers
houden zich aan het digitale signaal
In het begin was er het bit
Een bit is de kleinste eenheid van informatie. Het kan maar twee waarden hebben: 0 of 1. Met een
tijdseenheid/klok wordt bepaald wanneer zo’n bit gelezen of verzonden wordt. Belangrijk om te weten
is dat een bit geen fysiek ding is, maar puur informatie. Ze kunnen op verschillende manieren worden
gecodeerd en opgeslagen.
Alles digitaal begint met bits, en met veel bits samen kun je cijfers, letters, muziek of video
voorstellen.
Alle informatie is zoals een schakelaar, ‘ja of nee’, alles of niets doorgeven
Een voorloper van bits? Morsecode
Morsecode is een vroeg voorbeeld van informatie doorgeven. Met puntjes en
streepjes worden lange (‘dah’) en korte signalen (‘dit’) doorgegeven en die
combinatie geeft letters van het alfabet weer. Zo legde morsecode in de 19e
eeuw al de basis voor de binaire codering die computers nu gebruiken. =
voorloper van digitale communicatie.
2
,Punchcards: Eerste opslag van bits
Punchcards of ponskaarten waren één van de eerste manieren om informatie (bits) op te slaan. Ze
zaten in de eerste computers, ca. jaren 40-50. Computers lazen de frequentie van de posities in de
kaart. De kaart heeft een heleboel posities. Als er een gat in een positie zit, betekent dit 1. Geen gat
betekent 0. Deze combinatie vormden instructies of gegevens voor
een computer.
De ponskaarten liggen dus aan de basis van elektrische
computers. Je kan het zien als de eerste harde schijf of USB-stick,
maar dan van karton.
The bit (een ja of een nee)
De bit is de kleinste eenheid van informatie (0 of 1)
Claude Elwood Shannon (1916-2001) gaf de eerste defintie van het bit in 1948. Hij wordt de vader
van de informatietheorie genoemd.
Een bit kan opgeslagen worden in verschillende vormen:
Flip-flop (reeksen transistors): elektronisch schakelingetje dat 0 of 1 kan onthouden
Elektrische schakelaar: aan = 1, uit = 0
Ponskaart: gat = 1, geen gat = 0
Bits en bytes
8 bits samen maken 1 byte. Bytes zijn de bouwstenen waarmee computers tekst, beelden, muziek,
etc. opslaan.
De grootte van een document wordt aangegeven in bytes. Hoe langer de reeks van de bits, hoe groter
de hoeveelheid aan informatie die opgeslagen kan worden.
Historische context: aanvankelijk gaf een byte meestal een reeks bits aan die werd gebruikt om één
enkel teken tekst te coderen.
Het combineren van bits:
1 bit 2 mogelijkheden:
0 of 1
2 bits 4 mogelijkheden:
00, 01, 10, 11
3 bits 8 mogelijkheden:
000, 001, 010, 011, 100, 101, 110, 111
Algemene regel: N bits= 2n mogelijkheden
Dus: een byte bestaat uit 8 bits 28=256 mogelijkheden
3
, Belangrijk omdat: hoe meer bits je hebt, hoe meer verschillende waarden of combinaties je kunt
maken. Dit betekent dat je meer informatie kunt opslaan en verwerken.
In de praktijk worden bits meestal in groepen verwerkt, zoals in bytes. Dat maakt het mogelijk om een
breed scala aan complexere gegevens te coderen zoals:
Tekst: elke letter of symbool is een byte
Afbeeldingen: de kleur van elke pixel wordt in bytes opgeslagen
Geluid: frequentie en volume van geluidsgolven in bytes
Video: combinatie van beeld en geluid vereist veel bytes
Software/programma’s: instructie en gegevens van programma’s in bytes
Overige data zoals bv. sensorgegevens, configuratiebestanden, … ook in bytes
Cijfers
Decimale codering van gehele getallen
Dagelijks gebruiken we het decimale stelsel, oftewel basis 10. Dit systeem werkt met 10
verschillende cijfers: 0,1,2,3,4,5,6,7,8,9. De waarde van elk cijfer hangt af van de positie waar het
staat. Elke positie in een getal vertegenwoordigt een macht van 10:
Eerste positie (het meest rechtste nummer van het getal) = eenheden = 100 = 1
Tweede positie = tientallen = 101 = 10
Derde positie = honderdtallen = 102 = 100
Vierde positie = duizendtallen = 103 = 1000
Enzovoort
Dus de plaats van het cijfer in het getal bepaalt hoeveel het waart is
Voorbeeld:
We splitsen dit getal op in posities:
Cijfer 2 staat op de eenheden-positie
→ 2 × 100 = 2 × 1 = 2
Cijfer 5 staat op de tientallen-positie
→ 5 × 101 = 5 × 10 = 50
Cijfer 1 staat op de honderdtallen-positie
→ 1 × 10^2 = 1 × 100 = 100
152 kan worden geschreven als: 1×10²+5×101+2×100
Dat komt neer op: 100 + 50 + 2 = 152
Conclusie:
Elk cijfer vertegenwoordigt een specifieke macht van tien, afhankelijk van zijn positie: de
nummer van de macht is ‘n’. Door deze machten van tien bij elkaar op te tellen, krijgen we het
oorspronkelijke getal
4
1. Data voor humane wetenschappen
Deel I: Data coderen
Computers vandaag de dag
Def.: Een computer is een apparaat waarmee gegevens volgens formele procedures (algoritmen)
kunnen worden verwerkt. Meestal wordt met het woord computer een elektronisch, digitaal
apparaat bedoeld, maar er bestaan ook mechanische en analoge computers. (Wikipedia)
Vooral over elektronische en digitale apparaten praten, link tonen tussen moderne computers en
oude methodes om informatie te verwerken.
Elektronica
Def.: Het bestudeert hoe elektrische stroom in een schakeling, waarin elektronenbuizen of
halfgeleidertechniek zijn verwerkt, kan worden gestuurd. (Wikipedia)
Al onze informatie moet uiteindelijk elektronische stroom worden, hoe doen we dat? Hoe kan bv. een
handschrift, gevoel, idee, elektronische stroom worden?
Digitaal
Def.: Digitaal signaal geeft gegevens weer als een reeks discrete waarden: op een bepaald moment
kan het hoogstens één van een eindig aantal waarden aannemen (Wikipedia)
=> een digitaal signaal betekent dat informatie wordt weergegeven met duidelijke stapjes/ discrete
waarden. Het kan maar een beperkt aantal waarden aannemen, meestal 0 of 1. Er bestaan geen
tussenwaarden. Bv. een lamp: kan enkel aan of uit, dus in stapjes:
(Het tegenovergestelde van digitaal is analoog, dan zijn er oneindig veel mogelijke waarden. Bv. de
zon, die sterker of zwakker kan schijnen.)
Informatie kan waarden aannemen aan een grote schaal van nummers.
1
,Wanneer is informatie digitaal?
Het woord ‘digitaal’ komt van ‘digit’, wat cijfer betekent. Dat komt dan weer van
het Latijnse ‘digiti’, dat aangaf dat vingers werden gebruikt om te tellen.
Digitale informatie betekent dus dat je kunt tellen hoeveel mogelijke waarden
er zijn.
Bv. een digitaal signaal kan 0 of 1 zijn, je kunt dus altijd een eindig aantal
mogelijkheden opsommen. Bij analoog is dit niet mogelijk, omdat er oneindig veel waarden zijn.
Analoog versus digitaal? Oefening
1. FM-radio-uitzending analoog, het geluid wordt als een
radiogolf verstuurd. Die golf kan vloeiend veranderen.
2. HDMI-videotransmissie digitaal, HDMI stuurt beeld en
geluid via nullen en enen. Er zijn geen tussenwaarden,
alleen duidelijke stapjes.
3. Vinyl platenspeler analoog, de naald volgt de groeven
in de plaat. De groeven zijn een directe/vloeiende kopie van het geluidsignaal.
4. Bluetooth audio gegevensstromen digitaal, geluid wordt eerst gecomprimeerd (omgezet in
nullen en enen). Daarna wordt het draadloos verzonden als digitale pakketjes.
Ezelsbruggetje:
Radio en vinyl = ouderwets analoog
HDMI en bluetooth = modern digitaal, apparaten die communiceren met computers
houden zich aan het digitale signaal
In het begin was er het bit
Een bit is de kleinste eenheid van informatie. Het kan maar twee waarden hebben: 0 of 1. Met een
tijdseenheid/klok wordt bepaald wanneer zo’n bit gelezen of verzonden wordt. Belangrijk om te weten
is dat een bit geen fysiek ding is, maar puur informatie. Ze kunnen op verschillende manieren worden
gecodeerd en opgeslagen.
Alles digitaal begint met bits, en met veel bits samen kun je cijfers, letters, muziek of video
voorstellen.
Alle informatie is zoals een schakelaar, ‘ja of nee’, alles of niets doorgeven
Een voorloper van bits? Morsecode
Morsecode is een vroeg voorbeeld van informatie doorgeven. Met puntjes en
streepjes worden lange (‘dah’) en korte signalen (‘dit’) doorgegeven en die
combinatie geeft letters van het alfabet weer. Zo legde morsecode in de 19e
eeuw al de basis voor de binaire codering die computers nu gebruiken. =
voorloper van digitale communicatie.
2
,Punchcards: Eerste opslag van bits
Punchcards of ponskaarten waren één van de eerste manieren om informatie (bits) op te slaan. Ze
zaten in de eerste computers, ca. jaren 40-50. Computers lazen de frequentie van de posities in de
kaart. De kaart heeft een heleboel posities. Als er een gat in een positie zit, betekent dit 1. Geen gat
betekent 0. Deze combinatie vormden instructies of gegevens voor
een computer.
De ponskaarten liggen dus aan de basis van elektrische
computers. Je kan het zien als de eerste harde schijf of USB-stick,
maar dan van karton.
The bit (een ja of een nee)
De bit is de kleinste eenheid van informatie (0 of 1)
Claude Elwood Shannon (1916-2001) gaf de eerste defintie van het bit in 1948. Hij wordt de vader
van de informatietheorie genoemd.
Een bit kan opgeslagen worden in verschillende vormen:
Flip-flop (reeksen transistors): elektronisch schakelingetje dat 0 of 1 kan onthouden
Elektrische schakelaar: aan = 1, uit = 0
Ponskaart: gat = 1, geen gat = 0
Bits en bytes
8 bits samen maken 1 byte. Bytes zijn de bouwstenen waarmee computers tekst, beelden, muziek,
etc. opslaan.
De grootte van een document wordt aangegeven in bytes. Hoe langer de reeks van de bits, hoe groter
de hoeveelheid aan informatie die opgeslagen kan worden.
Historische context: aanvankelijk gaf een byte meestal een reeks bits aan die werd gebruikt om één
enkel teken tekst te coderen.
Het combineren van bits:
1 bit 2 mogelijkheden:
0 of 1
2 bits 4 mogelijkheden:
00, 01, 10, 11
3 bits 8 mogelijkheden:
000, 001, 010, 011, 100, 101, 110, 111
Algemene regel: N bits= 2n mogelijkheden
Dus: een byte bestaat uit 8 bits 28=256 mogelijkheden
3
, Belangrijk omdat: hoe meer bits je hebt, hoe meer verschillende waarden of combinaties je kunt
maken. Dit betekent dat je meer informatie kunt opslaan en verwerken.
In de praktijk worden bits meestal in groepen verwerkt, zoals in bytes. Dat maakt het mogelijk om een
breed scala aan complexere gegevens te coderen zoals:
Tekst: elke letter of symbool is een byte
Afbeeldingen: de kleur van elke pixel wordt in bytes opgeslagen
Geluid: frequentie en volume van geluidsgolven in bytes
Video: combinatie van beeld en geluid vereist veel bytes
Software/programma’s: instructie en gegevens van programma’s in bytes
Overige data zoals bv. sensorgegevens, configuratiebestanden, … ook in bytes
Cijfers
Decimale codering van gehele getallen
Dagelijks gebruiken we het decimale stelsel, oftewel basis 10. Dit systeem werkt met 10
verschillende cijfers: 0,1,2,3,4,5,6,7,8,9. De waarde van elk cijfer hangt af van de positie waar het
staat. Elke positie in een getal vertegenwoordigt een macht van 10:
Eerste positie (het meest rechtste nummer van het getal) = eenheden = 100 = 1
Tweede positie = tientallen = 101 = 10
Derde positie = honderdtallen = 102 = 100
Vierde positie = duizendtallen = 103 = 1000
Enzovoort
Dus de plaats van het cijfer in het getal bepaalt hoeveel het waart is
Voorbeeld:
We splitsen dit getal op in posities:
Cijfer 2 staat op de eenheden-positie
→ 2 × 100 = 2 × 1 = 2
Cijfer 5 staat op de tientallen-positie
→ 5 × 101 = 5 × 10 = 50
Cijfer 1 staat op de honderdtallen-positie
→ 1 × 10^2 = 1 × 100 = 100
152 kan worden geschreven als: 1×10²+5×101+2×100
Dat komt neer op: 100 + 50 + 2 = 152
Conclusie:
Elk cijfer vertegenwoordigt een specifieke macht van tien, afhankelijk van zijn positie: de
nummer van de macht is ‘n’. Door deze machten van tien bij elkaar op te tellen, krijgen we het
oorspronkelijke getal
4