BI: H1 GEGEVENSOPSLAG (1.8 – 1.9)
1.8 GEGEVENSCOMPRESSIE
• hoe lager strook = beter = meer gecomprimeerd
• Blauwe blokje = tijd nodig voor comprimeren
• Compressie= omvang verkleinen voor opslaan of versturen
1.8.1 MANIEREN (4)
A. Run-length encoding
• Veel dezelfde getallen samennemen
• Goed bij veel HH
o Ipv 253 nullen op te slaan → 253 x 0 opslaan
o “253, 0”
B. Relative encoding
• Zelfde blokken info → beeldmateriaal
• Enkel verschillen tussen blokken opslaan
o Verschil frame 1—frame 2
C. Frequency-dependent encoding
• Ipv 7 bits per letter → kijken naar hoe vaak 1letter voorkomt
• Meest voorkomend = kortste patroon
o Lengte bitpatroon = omgekeerd evenredig met frequentie voorkomen
• → codes met variabele lengtes (ook in ZIP-files gebruikt)
D. Dictionary encoding
• Zoekt naar patronen → 2 woorden hetzelfde
o Referentie naar plaats 1ste woord ipv 2e keer het woord op te slaan
o Variant gebruikt in ZIP
1.8.2 VOOR BEDRIJVEN
• ZIP bestanden, png (foto), compressed http (=veel sneller)
• Google
o Eigen ZIP implementatie = zopfli
o Compressie duurt langer
o 3-8% kleiner maken → data sneller versturen MAAR nog steeds = standaard ZIP
• Vaak verstuurde data
o Snellere data transmissie = minder 4G gebruiken
o Sneller websites laden tov andere zoekmachines → minder batterijverbruik
1.8.3 LOSSY – LOSSLESS
= gegevens verloren bij comprimeren of niet
• Lossless compressie
o Na decompressie → bevat alle bits van originele bestand
o Alle info = voll. Hersteld ( → 4manieren bij 1.8.1)
o Voor tekstbestanden, ZIP
, • Lossy compressie
o Permanente verkleining door deel originele info te elimineren
o Bij decompressie = deel info =weg
o Bij video + geluid → verlies = niet merkbaar voor gebruikers
o JPEG = foto’s+ video→ gebruiker kiest grootte verlies = bestandsgrootte & kwaliteit
o MP3
1.8.4 AFBEELDINGEN COMPRIMEREN
• GIF
o Afbeelding bestaande uit scherpe, afgetekende bokken met egale kleur
o Cartoon… + beperkt kleuren tot 256 = 1byte per pixel
• JPEG
o Foto’s
o Verschil in kleur tussen opeenvolgende pixels + tot 5% van orig. Grootte RAW image
• VIDEO
o MPEG → ook relative encoding voor opeenvolgende beelden
o 1ste shot =pixel → 2e = relative encoding = verschillen ertussen opslaan
1.9 COMMUNICATIEFOUTEN
1.9.1 NOOD AAN DETECTIE
• Invullen bankrek.nr. → fout opsporen = foute betaling tegengaan
• CD uitlezen ondanks krassen → via extra info op CD
• Storingen wifi → slecht signaal → gsm zoekt zelf beter signaal
• Correctheid bestand verifiëren
• …
A. BANK → BE68 5390 0754 7034
• BE = landcode
• 68 = controlegetal 1
• 34 = laatste 2 = controlegetal 2
o Berekening→ deling met rest = 34 ANDERS = fout
o 5390 (= grootste priemgetal onder 100) → 55567788 + 34 REST
B. PARITEIT
• Afspraak: alle opgeslagen bitpatronen moeten even zijn MAAR ze zijn oneven
• Pariteitsbit = extra bit om patroon oneven te maken
o P-bit komt aan begin patroon (meestal)
• Vb: patroon = 1011011 = oneven aantal eentjes→ afspraak = even aantal eentjes
o P-bit erbij → 1 1011011 = even aantal eentjes
• Fouten detecteren
o 1 0011011 → 1 fout gedetecteerd want met p-bit zijn ze nog steeds oneven
o 1 1001001 → 2 fouten MAAR kunnen we niet detecteren want patroon is terug even
ondanks fouten
1.8 GEGEVENSCOMPRESSIE
• hoe lager strook = beter = meer gecomprimeerd
• Blauwe blokje = tijd nodig voor comprimeren
• Compressie= omvang verkleinen voor opslaan of versturen
1.8.1 MANIEREN (4)
A. Run-length encoding
• Veel dezelfde getallen samennemen
• Goed bij veel HH
o Ipv 253 nullen op te slaan → 253 x 0 opslaan
o “253, 0”
B. Relative encoding
• Zelfde blokken info → beeldmateriaal
• Enkel verschillen tussen blokken opslaan
o Verschil frame 1—frame 2
C. Frequency-dependent encoding
• Ipv 7 bits per letter → kijken naar hoe vaak 1letter voorkomt
• Meest voorkomend = kortste patroon
o Lengte bitpatroon = omgekeerd evenredig met frequentie voorkomen
• → codes met variabele lengtes (ook in ZIP-files gebruikt)
D. Dictionary encoding
• Zoekt naar patronen → 2 woorden hetzelfde
o Referentie naar plaats 1ste woord ipv 2e keer het woord op te slaan
o Variant gebruikt in ZIP
1.8.2 VOOR BEDRIJVEN
• ZIP bestanden, png (foto), compressed http (=veel sneller)
o Eigen ZIP implementatie = zopfli
o Compressie duurt langer
o 3-8% kleiner maken → data sneller versturen MAAR nog steeds = standaard ZIP
• Vaak verstuurde data
o Snellere data transmissie = minder 4G gebruiken
o Sneller websites laden tov andere zoekmachines → minder batterijverbruik
1.8.3 LOSSY – LOSSLESS
= gegevens verloren bij comprimeren of niet
• Lossless compressie
o Na decompressie → bevat alle bits van originele bestand
o Alle info = voll. Hersteld ( → 4manieren bij 1.8.1)
o Voor tekstbestanden, ZIP
, • Lossy compressie
o Permanente verkleining door deel originele info te elimineren
o Bij decompressie = deel info =weg
o Bij video + geluid → verlies = niet merkbaar voor gebruikers
o JPEG = foto’s+ video→ gebruiker kiest grootte verlies = bestandsgrootte & kwaliteit
o MP3
1.8.4 AFBEELDINGEN COMPRIMEREN
• GIF
o Afbeelding bestaande uit scherpe, afgetekende bokken met egale kleur
o Cartoon… + beperkt kleuren tot 256 = 1byte per pixel
• JPEG
o Foto’s
o Verschil in kleur tussen opeenvolgende pixels + tot 5% van orig. Grootte RAW image
• VIDEO
o MPEG → ook relative encoding voor opeenvolgende beelden
o 1ste shot =pixel → 2e = relative encoding = verschillen ertussen opslaan
1.9 COMMUNICATIEFOUTEN
1.9.1 NOOD AAN DETECTIE
• Invullen bankrek.nr. → fout opsporen = foute betaling tegengaan
• CD uitlezen ondanks krassen → via extra info op CD
• Storingen wifi → slecht signaal → gsm zoekt zelf beter signaal
• Correctheid bestand verifiëren
• …
A. BANK → BE68 5390 0754 7034
• BE = landcode
• 68 = controlegetal 1
• 34 = laatste 2 = controlegetal 2
o Berekening→ deling met rest = 34 ANDERS = fout
o 5390 (= grootste priemgetal onder 100) → 55567788 + 34 REST
B. PARITEIT
• Afspraak: alle opgeslagen bitpatronen moeten even zijn MAAR ze zijn oneven
• Pariteitsbit = extra bit om patroon oneven te maken
o P-bit komt aan begin patroon (meestal)
• Vb: patroon = 1011011 = oneven aantal eentjes→ afspraak = even aantal eentjes
o P-bit erbij → 1 1011011 = even aantal eentjes
• Fouten detecteren
o 1 0011011 → 1 fout gedetecteerd want met p-bit zijn ze nog steeds oneven
o 1 1001001 → 2 fouten MAAR kunnen we niet detecteren want patroon is terug even
ondanks fouten