Bayesiaanse netwerken: definitie, voorbeelden en hoe ze werken

Inhoudsopgave:

Bayesiaanse netwerken: definitie, voorbeelden en hoe ze werken
Bayesiaanse netwerken: definitie, voorbeelden en hoe ze werken
Anonim

Een geloof, beslissingsnetwerk, Bayesiaans (ian) model of probabilistisch aangedreven acyclisch grafiekmodel is een variantschema (een soort statistisch model) dat een reeks variabelen en hun voorwaardelijke afhankelijkheden vertegenwoordigt via een gerichte acyclische grafiek (DAG).

Een Bayesiaans netwerk kan bijvoorbeeld probabilistische relaties tussen ziekten en symptomen vertegenwoordigen. Gezien het laatste kan het netwerk worden gebruikt om de mogelijkheid van verschillende ziekten te berekenen. In onderstaande video zie je een voorbeeld van een Bayesiaans geloofsnetwerk met berekeningen.

Image
Image

Efficiëntie

Efficiënte algoritmen kunnen gevolgtrekkingen en leren uitvoeren op Bayesiaanse netwerken. Netwerken die variabelen modelleren (zoals spraaksignalen of eiwitsequenties) worden dynamische netwerken genoemd. Generalisaties van Bayesiaanse netwerken die problemen onder onzekerheid kunnen weergeven en oplossen, worden invloedsdiagrammen genoemd.

Essentie

FormeelBayesiaanse netwerken zijn DAG's waarvan de knooppunten variabelen in de Bayesiaanse zin vertegenwoordigen: het kunnen waargenomen waarden, verborgen variabelen, onbekende parameters of hypothesen zijn. Omdat het erg interessant is.

Bayesiaans netwerkvoorbeeld

Twee gebeurtenissen kunnen ervoor zorgen dat gras nat wordt: een actieve sproeier of regen. Regen heeft een direct effect op het gebruik van de sproeier (namelijk dat bij regen de sproeier meestal niet actief is). Deze situatie kan worden gemodelleerd met behulp van een Bayesiaans netwerk.

Typische formule
Typische formule

Simulatie

Omdat het Bayesiaanse netwerk een compleet model is voor zijn variabelen en hun relaties, kan het worden gebruikt om probabilistische vragen hierover te beantwoorden. Het kan bijvoorbeeld worden gebruikt om kennis over de toestand van een subset van variabelen bij te werken wanneer andere gegevens (bewijsvariabelen) worden waargenomen. Dit interessante proces wordt probabilistische gevolgtrekking genoemd.

A posteriori geeft een universeel voldoende statistiek voor ontdekkingstoepassingen bij het kiezen van waarden voor een subset van variabelen. Dit algoritme kan dus worden beschouwd als een mechanisme voor het automatisch toepassen van de stelling van Bayes op complexe problemen. Op de afbeeldingen in het artikel zie je voorbeelden van Bayesiaanse geloofsnetwerken.

Praktisch Bayesiaans netwerk
Praktisch Bayesiaans netwerk

Uitvoermethoden

De meest gebruikelijke exacte inferentiemethoden zijn: variabele eliminatie, die (door integratie of sommatie) het niet-waarneembare elimineertniet-query parameters één voor één door het bedrag aan het product toe te wijzen.

Klik op de verspreiding van een "boom" die berekeningen opslaat, zodat veel variabelen tegelijk kunnen worden opgevraagd en nieuwe bewijzen snel kunnen worden doorgegeven; en recursief matchen en/of zoeken, die een afweging tussen ruimte en tijd mogelijk maken en de efficiëntie van variabele eliminatie evenaren wanneer er voldoende ruimte wordt gebruikt.

Al deze methoden hebben een speciale complexiteit die exponentieel afhangt van de lengte van het netwerk. De meest gebruikelijke geschatte gevolgtrekkingsalgoritmen zijn eliminatie van minisegmenten, cyclische geloofsvoortplanting, gegeneraliseerde geloofsvoortplanting en variatiemethoden.

Soorten netwerken
Soorten netwerken

Netwerken

Om het Bayesiaanse netwerk volledig te specificeren en dus de gezamenlijke kansverdeling volledig weer te geven, is het noodzakelijk om voor elk knooppunt X de kansverdeling voor X te specificeren vanwege de ouders van X.

De voorwaardelijk verdeling van X door zijn ouders kan elke vorm hebben. Het is gebruikelijk om met discrete of Gauss-verdelingen te werken, omdat dit de berekeningen vereenvoudigt. Soms zijn alleen distributiebeperkingen bekend. U kunt dan entropie gebruiken om de enkele distributie te bepalen die de hoogste entropie heeft, gegeven de beperkingen.

Evenzo, in de specifieke context van een dynamisch Bayesiaans netwerk, is de voorwaardelijke verdeling voor de tijdelijke evolutie van de latentestaat is meestal ingesteld om de entropiesnelheid van het impliciete willekeurige proces te maximaliseren.

Bayesiaans web van vertrouwen
Bayesiaans web van vertrouwen

Directe maximalisatie van de waarschijnlijkheid (of latere waarschijnlijkheid) is vaak lastig gezien de aanwezigheid van niet-geobserveerde variabelen. Dit geldt met name voor een Bayesiaans beslissingsnetwerk.

Klassieke aanpak

De klassieke benadering van dit probleem is het verwachtingsmaximalisatie-algoritme, dat het berekenen van de verwachte waarden van niet-geobserveerde variabelen, afhankelijk van de waargenomen gegevens, afwisselt met het maximaliseren van de totale waarschijnlijkheid (of posterieure waarde), ervan uitgaande dat de eerder berekende verwachte waarden kloppen. Onder omstandigheden van matige regelmaat convergeert dit proces in de maximale (of maximale a posteriori) waarden van de parameters.

Een meer complete Bayesiaanse benadering van parameters is om ze te behandelen als extra niet-geobserveerde variabelen en de volledige posterieure verdeling over alle knooppunten te berekenen op basis van de waargenomen gegevens, en vervolgens de parameters te integreren. Deze benadering kan kostbaar zijn en resulteren in grote modellen, waardoor klassieke benaderingen voor het afstemmen van parameters toegankelijker worden.

In het eenvoudigste geval wordt een Bayesiaans netwerk gedefinieerd door een expert en vervolgens gebruikt om gevolgtrekkingen uit te voeren. In andere toepassingen is de taak van het bepalen te moeilijk voor een mens. In dit geval moeten de structuur van het Bayesiaanse neurale netwerk en de parameters van lokale distributies uit de gegevens worden geleerd.

Bayesiaanse netwerken
Bayesiaanse netwerken

Alternatieve methode

Een alternatieve methode voor gestructureerd leren maakt gebruik van optimalisatiezoekopdrachten. Dit vereist de toepassing van een evaluatiefunctie en een zoekstrategie. Een veelgebruikt scoringsalgoritme is de posterieure waarschijnlijkheid van een structuur gegeven trainingsgegevens zoals BIC of BDeu.

De tijd die nodig is voor een uitputtende zoekopdracht die een structuur retourneert die de score maximaliseert, is superexponentieel in het aantal variabelen. De lokale zoekstrategie brengt incrementele wijzigingen aan om de schatting van de structuur te verbeteren. Friedman en zijn collega's overwogen om wederzijdse informatie tussen variabelen te gebruiken om de gewenste structuur te vinden. Ze beperken de reeks bovenliggende kandidaten tot k-knooppunten en doorzoeken deze grondig.

Een bijzonder snelle methode om BN precies te bestuderen, is om het probleem voor te stellen als een optimalisatieprobleem en het op te lossen met behulp van geheeltallige programmering. Acycliciteitsbeperkingen worden toegevoegd aan het integer-programma (IP) tijdens de oplossing in de vorm van snijvlakken. Een dergelijke methode kan problemen tot 100 variabelen aan.

Grafieken en netwerken
Grafieken en netwerken

Probleemoplossing

Om problemen met duizenden variabelen op te lossen, is een andere aanpak nodig. Een daarvan is om eerst één volgorde te kiezen en vervolgens de optimale BN-structuur te vinden met betrekking tot die volgorde. Dit impliceert het werken in de zoekruimte van mogelijke ordening, wat handig is omdat deze kleiner is dan de ruimte van netwerkstructuren. Vervolgens worden verschillende bestellingen geselecteerd en beoordeeld. Deze methode bleekbest beschikbaar in de literatuur wanneer het aantal variabelen enorm is.

Een andere methode is om te focussen op een subklasse van ontleedbare modellen waarvoor MLE's gesloten zijn. Dan kun je een consistente structuur vinden voor honderden variabelen.

Het bestuderen van Bayesiaanse netwerken met een beperkte breedte van drie lijnen is nodig om nauwkeurige, interpreteerbare gevolgtrekkingen te verkrijgen, aangezien de complexiteit van de laatstgenoemde in het slechtste geval exponentieel is in boomlengte k (volgens de exponentiële tijdhypothese). Als globale eigenschap van de grafiek verhoogt het echter de complexiteit van het leerproces aanzienlijk. In deze context kan K-tree gebruikt worden voor effectief leren.

Kort netwerk
Kort netwerk

Ontwikkeling

Ontwikkeling van een Bayesiaans Web of Trust begint vaak met het creëren van een DAG G zodat X voldoet aan een lokale Markov-eigenschap met betrekking tot G. Soms is dit een causale DAG. De voorwaardelijke kansverdelingen van elke variabele over zijn ouders in G worden geschat. In veel gevallen, met name wanneer de variabelen discreet zijn, als de gezamenlijke verdeling van X het product is van deze voorwaardelijke verdelingen, wordt X een Bayesiaans netwerk met betrekking tot G.

Markov's "knoopdeken" is een reeks knopen. De Markov-quilt maakt het knooppunt onafhankelijk van de rest van de blanco van het knooppunt met dezelfde naam en is voldoende kennis om de verdeling ervan te berekenen. X is een Bayesiaans netwerk met betrekking tot G als elk knooppunt voorwaardelijk onafhankelijk is van alle andere knooppunten, gegeven zijn Markoviaansedeken.

Aanbevolen: