Lecture 1 KMPA
Course topics
Een bedrijfsproces (business process) beschrijft activiteiten binnen een organisatie om een
doel te bereiken, bijvoorbeeld het maken van een factuur. Deze activiteiten vereisen kennis
(knowledge), bijvoorbeeld in het geval van het maken van een factuur is het nodig om
kennis te hebben over het uurtarief, aantal gewerkte uren etc. De kennis die nodig is voor
bedrijfsprocessen kan complex en domeinspecifiek zijn, en moet worden gemodelleerd en
geïmplementeerd.
Knowledge Systems
Een kennissysteem (knowledge (based) system of KBS) is een systeem dat expliciete
kennis, meestal geleverd door experts, gebruikt om een taak uit te voeren. Dit verschilt van
machine learning, waarbij impliciete kennis gebruikt wordt.*
- Expliciete kennis is kennis uitgedrukt in woorden, cijfers, afbeeldingen, feiten etc.
- Impliciete kennis is kennis uit ervaring, inzichten, intuïties, vaardigheden etc.*
Kennissystemen hebben een aantal doelen. Ze helpen bij:
- het benutten van kennis, door kennis te behouden en te hergebruiken.
- het begeleiden van een project, door kennis te delen en uit te wisselen.
- innovatie, door gebruik te maken van kennisbronnen voor toekomstige voordelen.
- kostenreductie, door processen vanaf de eerste keer goed uit te voeren.
Kennis (knowledge) is het vermogen of de instructies om informatie te interpreteren en te
gebruiken voor specifieke taken. Er zijn twee categorieën taken:
● Analytische taken
Hierbij wordt kennis gebruikt om een gebruiker te informeren, bijvoorbeeld met een KBS.
● Synthetische taken
Hierbij wordt kennis gebruikt om een product of dienst te creëren, zoals een planning, advies
of KBS.
,Een KBS is onderdeel van een kennismanagementproces (knowledge management
process). Andere onderdelen zijn:
- Kennismodellering
- Kennisacquisitie
- Data- en systeemintegratie
- Software engineering/programmeren
- Bedrijfsimplementatie
History
Een van de vroegste KBS is MYCIN, een beslissingsondersteunend systeem uit de jaren 70,
dat werd gebruikt voor de diagnose van bacteriële infecties en bloedstollingsziekten. Het
was een regelgebaseerd systeem, wat betekende dat het op basis van vooraf gedefinieerde
(if-then) regels conclusies trok. Bijvoorbeeld, als de kleuring van het organisme gramnegatief
is, de morfologie staafvormig is, en het organisme aeroob is, dan geeft dit sterk suggestief
bewijs (met een kans van 0,8) dat het organisme behoort tot de klasse van de
Enterobacteriaceae.
De MYCIN liet de kennisbank (knowledge base / KB) en de inferentie-engine (de
denkmachine van het systeem) gescheiden. Dit is een veelgebruikte aanpak van
kennissystemen. Hierbij wordt kennis (van een expert) opgeslagen in een kennisbank en
verwerkt door een inferentie-engine. Een niet-expert gebruiker kan via een
gebruikersinterface vragen stellen (query) een advies krijgen op basis van de opgeslagen
kennis. Dit maakt het mogelijk om kennis te kunnen bijwerken zonder de inferentie-engine te
wijzigen, en andersom. Echter is het niet noodzakelijk om het gescheiden te houden, en is
het soms onpraktisch voor synthetische taken.
Vroege kennissystemen ondervonden verschillende moeilijkheden:
1. Het verzamelen van kennis van experts en het formaliseren in regels bleek moeilijk,
omdat
- complexe informatie en kennis moeilijk vast te leggen zijn.
- experts van elkaar verschillen.
- kennis in verschillende vormen kunnen voorkomen, zoals tekst, afbeeldingen etc.
2. Beperkte expressiviteit van het if-then-formaat (niet alle kennis konden in if-then
regels worden geformuleerd).
3. Het implementeren in de praktijk is niet altijd haalbaar
,Research developments
Een belangrijk onderzoeksgebied binnen kennismanagement is het formaliseren van
modellen, zowel van kennis als van organisaties (business process models).
*Kennismanagement omvat de reeks bedrijfsprocessen die zijn ontwikkeld om in een
organisatie kennis te verwerven, op te slaan, te verspreiden (delen) en toe te passen.* Het is
nuttig voor bedrijfsbegrip, databegrip en modellering. Er zijn verschillende rollen binnen
kennismanagement:
- de kennisleverancier
- de kennisingenieur/analist
- de kennis systeemontwikkelaar
- de kennisgebruiker
- de projectmanager
- de kennismanager.
Bij kennismodellering volgen we een aantal principes:
1. Organiseer kennis in ontologieën
2. Formaliseer eigenschappen en relaties
3. Probabilistische kennis
4. Creëer links tussen kennisbanken
Het CRISP-DM (CRoss-Industry Standard Process for Data Mining)-model is een
methodologie die veel wordt gebruikt in data-analyse en kennismanagement. Het helpt bij
het formaliseren en structureren van kennis in een organisatie, en bestaat uit zes fasen:
Een ander belangrijk onderzoeksgebied binnen kennismanagement is het analyseren van
bedrijfsprocessen (Process Mining).
Machine Learning
Binnen een kennissysteem kan machine learning (een deel van de) regels,
waarschijnlijkheden en feature selectie bieden. Bekende voorbeelden zijn IBM Watson en
Project Debater. Dat laatste is een systeem dat debatten kan voeren met mensen en volgt
, een formele debatstructuur met een openingsverklaring, tegenargumenten en een
slotverklaring. Het combineert expliciete kennis met machine learning op basis van een
grote corpus (dataset) om argumenten te genereren en te beoordelen.
Bij een debat moet het systeem argumenten vinden op basis van een onderwerp. Dit proces,
bekend als argument mining, doorzoekt een dataset naar zinnen die claims over het
onderwerp bevatten (claim detection). De selectie van zinnen gebeurt op basis van vaste
patronen. Dit kan bijvoorbeeld door te zoeken naar zinnen met de structuur:
- "dat" + onderwerp + sentimentwoord
- Actiewerkwoord + onderwerp + normaal werkwoord
De volgende stap is het rangschikken van de zinnen met een neuraal netwerk om de meest
relevante argumenten te selecteren. Dit rangschikkingsproces combineert kennis en
machine learning. Alleen kennis is niet voldoende om de beste zinnen te selecteren. Aan de
andere kant kan machine learning zonder een voorafgaande selectie problematisch zijn.
De volgende stappen zijn het zoeken naar bewijs voor een claim (evidence detection) en het
bepalen van de mening van dit bewijs ten opzichte van het onderwerp (stance detection).
Om de kwaliteit van argumenten te verbeteren, gebruikt Project Debater een
argumentkennisbank. Dit is een verzameling domeinspecifieke kennis en sjablonen van
debatelementen voor verschillende onderwerpen. Deze kennisbank is handmatig
samengesteld door experts en levert argumenten van hoge kwaliteit, maar heeft minder
onderwerpen dan een corpus.
Een manier om kennis te modelleren is via kennisgrafieken (knowledge graphs), waarin
entiteiten en relaties in een domein als een graaf worden weergegeven. Deze kennis kan
worden omgezet in een taalmodel (LM), waardoor nieuwe zinnen aan de graaf kunnen
worden gekoppeld of taken kunnen worden uitgevoerd met embeddings. Zo kan het systeem
vragen beantwoorden zoals: "In welke eeuw is Richard Dawkins geboren?"
Course topics
Een bedrijfsproces (business process) beschrijft activiteiten binnen een organisatie om een
doel te bereiken, bijvoorbeeld het maken van een factuur. Deze activiteiten vereisen kennis
(knowledge), bijvoorbeeld in het geval van het maken van een factuur is het nodig om
kennis te hebben over het uurtarief, aantal gewerkte uren etc. De kennis die nodig is voor
bedrijfsprocessen kan complex en domeinspecifiek zijn, en moet worden gemodelleerd en
geïmplementeerd.
Knowledge Systems
Een kennissysteem (knowledge (based) system of KBS) is een systeem dat expliciete
kennis, meestal geleverd door experts, gebruikt om een taak uit te voeren. Dit verschilt van
machine learning, waarbij impliciete kennis gebruikt wordt.*
- Expliciete kennis is kennis uitgedrukt in woorden, cijfers, afbeeldingen, feiten etc.
- Impliciete kennis is kennis uit ervaring, inzichten, intuïties, vaardigheden etc.*
Kennissystemen hebben een aantal doelen. Ze helpen bij:
- het benutten van kennis, door kennis te behouden en te hergebruiken.
- het begeleiden van een project, door kennis te delen en uit te wisselen.
- innovatie, door gebruik te maken van kennisbronnen voor toekomstige voordelen.
- kostenreductie, door processen vanaf de eerste keer goed uit te voeren.
Kennis (knowledge) is het vermogen of de instructies om informatie te interpreteren en te
gebruiken voor specifieke taken. Er zijn twee categorieën taken:
● Analytische taken
Hierbij wordt kennis gebruikt om een gebruiker te informeren, bijvoorbeeld met een KBS.
● Synthetische taken
Hierbij wordt kennis gebruikt om een product of dienst te creëren, zoals een planning, advies
of KBS.
,Een KBS is onderdeel van een kennismanagementproces (knowledge management
process). Andere onderdelen zijn:
- Kennismodellering
- Kennisacquisitie
- Data- en systeemintegratie
- Software engineering/programmeren
- Bedrijfsimplementatie
History
Een van de vroegste KBS is MYCIN, een beslissingsondersteunend systeem uit de jaren 70,
dat werd gebruikt voor de diagnose van bacteriële infecties en bloedstollingsziekten. Het
was een regelgebaseerd systeem, wat betekende dat het op basis van vooraf gedefinieerde
(if-then) regels conclusies trok. Bijvoorbeeld, als de kleuring van het organisme gramnegatief
is, de morfologie staafvormig is, en het organisme aeroob is, dan geeft dit sterk suggestief
bewijs (met een kans van 0,8) dat het organisme behoort tot de klasse van de
Enterobacteriaceae.
De MYCIN liet de kennisbank (knowledge base / KB) en de inferentie-engine (de
denkmachine van het systeem) gescheiden. Dit is een veelgebruikte aanpak van
kennissystemen. Hierbij wordt kennis (van een expert) opgeslagen in een kennisbank en
verwerkt door een inferentie-engine. Een niet-expert gebruiker kan via een
gebruikersinterface vragen stellen (query) een advies krijgen op basis van de opgeslagen
kennis. Dit maakt het mogelijk om kennis te kunnen bijwerken zonder de inferentie-engine te
wijzigen, en andersom. Echter is het niet noodzakelijk om het gescheiden te houden, en is
het soms onpraktisch voor synthetische taken.
Vroege kennissystemen ondervonden verschillende moeilijkheden:
1. Het verzamelen van kennis van experts en het formaliseren in regels bleek moeilijk,
omdat
- complexe informatie en kennis moeilijk vast te leggen zijn.
- experts van elkaar verschillen.
- kennis in verschillende vormen kunnen voorkomen, zoals tekst, afbeeldingen etc.
2. Beperkte expressiviteit van het if-then-formaat (niet alle kennis konden in if-then
regels worden geformuleerd).
3. Het implementeren in de praktijk is niet altijd haalbaar
,Research developments
Een belangrijk onderzoeksgebied binnen kennismanagement is het formaliseren van
modellen, zowel van kennis als van organisaties (business process models).
*Kennismanagement omvat de reeks bedrijfsprocessen die zijn ontwikkeld om in een
organisatie kennis te verwerven, op te slaan, te verspreiden (delen) en toe te passen.* Het is
nuttig voor bedrijfsbegrip, databegrip en modellering. Er zijn verschillende rollen binnen
kennismanagement:
- de kennisleverancier
- de kennisingenieur/analist
- de kennis systeemontwikkelaar
- de kennisgebruiker
- de projectmanager
- de kennismanager.
Bij kennismodellering volgen we een aantal principes:
1. Organiseer kennis in ontologieën
2. Formaliseer eigenschappen en relaties
3. Probabilistische kennis
4. Creëer links tussen kennisbanken
Het CRISP-DM (CRoss-Industry Standard Process for Data Mining)-model is een
methodologie die veel wordt gebruikt in data-analyse en kennismanagement. Het helpt bij
het formaliseren en structureren van kennis in een organisatie, en bestaat uit zes fasen:
Een ander belangrijk onderzoeksgebied binnen kennismanagement is het analyseren van
bedrijfsprocessen (Process Mining).
Machine Learning
Binnen een kennissysteem kan machine learning (een deel van de) regels,
waarschijnlijkheden en feature selectie bieden. Bekende voorbeelden zijn IBM Watson en
Project Debater. Dat laatste is een systeem dat debatten kan voeren met mensen en volgt
, een formele debatstructuur met een openingsverklaring, tegenargumenten en een
slotverklaring. Het combineert expliciete kennis met machine learning op basis van een
grote corpus (dataset) om argumenten te genereren en te beoordelen.
Bij een debat moet het systeem argumenten vinden op basis van een onderwerp. Dit proces,
bekend als argument mining, doorzoekt een dataset naar zinnen die claims over het
onderwerp bevatten (claim detection). De selectie van zinnen gebeurt op basis van vaste
patronen. Dit kan bijvoorbeeld door te zoeken naar zinnen met de structuur:
- "dat" + onderwerp + sentimentwoord
- Actiewerkwoord + onderwerp + normaal werkwoord
De volgende stap is het rangschikken van de zinnen met een neuraal netwerk om de meest
relevante argumenten te selecteren. Dit rangschikkingsproces combineert kennis en
machine learning. Alleen kennis is niet voldoende om de beste zinnen te selecteren. Aan de
andere kant kan machine learning zonder een voorafgaande selectie problematisch zijn.
De volgende stappen zijn het zoeken naar bewijs voor een claim (evidence detection) en het
bepalen van de mening van dit bewijs ten opzichte van het onderwerp (stance detection).
Om de kwaliteit van argumenten te verbeteren, gebruikt Project Debater een
argumentkennisbank. Dit is een verzameling domeinspecifieke kennis en sjablonen van
debatelementen voor verschillende onderwerpen. Deze kennisbank is handmatig
samengesteld door experts en levert argumenten van hoge kwaliteit, maar heeft minder
onderwerpen dan een corpus.
Een manier om kennis te modelleren is via kennisgrafieken (knowledge graphs), waarin
entiteiten en relaties in een domein als een graaf worden weergegeven. Deze kennis kan
worden omgezet in een taalmodel (LM), waardoor nieuwe zinnen aan de graaf kunnen
worden gekoppeld of taken kunnen worden uitgevoerd met embeddings. Zo kan het systeem
vragen beantwoorden zoals: "In welke eeuw is Richard Dawkins geboren?"