Verdelingsfuncties van een willekeurige variabele. Hoe de verdelingsfunctie van een willekeurige variabele te vinden

Inhoudsopgave:

Verdelingsfuncties van een willekeurige variabele. Hoe de verdelingsfunctie van een willekeurige variabele te vinden
Verdelingsfuncties van een willekeurige variabele. Hoe de verdelingsfunctie van een willekeurige variabele te vinden
Anonim

Om de distributiefuncties van willekeurige variabelen en hun variabelen te vinden, is het noodzakelijk om alle kenmerken van dit kennisgebied te bestuderen. Er zijn verschillende methoden om de betreffende waarden te vinden, waaronder het wijzigen van een variabele en het genereren van een moment. Distributie is een concept gebaseerd op elementen als spreiding, variaties. Ze karakteriseren echter alleen de mate van verstrooiingsamplitude.

Verdelingsfuncties van een willekeurige variabele
Verdelingsfuncties van een willekeurige variabele

De belangrijkste functies van willekeurige variabelen zijn die welke gerelateerd en onafhankelijk zijn en gelijk verdeeld zijn. Als X1 bijvoorbeeld het gewicht is van een willekeurig gekozen persoon uit een mannelijke populatie, X2 het gewicht is van een ander, …, en Xn het gewicht is van nog een persoon uit de mannelijke populatie, dan moeten we weten hoe de willekeurige functie X wordt uitgedeeld. In dit geval is de klassieke stelling, de centrale limietstelling, van toepassing. Hiermee kunt u laten zien dat voor grote n de functie standaardverdelingen volgt.

Functies van één willekeurige variabele

De centrale limietstelling is voor het benaderen van discrete waarden die worden overwogen, zoals binomiaal en Poisson. Verdelingsfuncties van willekeurige variabelen worden in de eerste plaats beschouwd op eenvoudige waarden van één variabele. Als X bijvoorbeeld een continue willekeurige variabele is met een eigen kansverdeling. In dit geval onderzoeken we hoe we de dichtheidsfunctie van Y kunnen vinden met behulp van twee verschillende benaderingen, namelijk de distributiefunctiemethode en de verandering in variabele. Ten eerste worden alleen één-op-één waarden beschouwd. Vervolgens moet u de techniek van het wijzigen van de variabele aanpassen om de waarschijnlijkheid ervan te vinden. Ten slotte moeten we leren hoe de inverse cumulatieve distributiefunctie kan helpen bij het modelleren van willekeurige getallen die bepaalde opeenvolgende patronen volgen.

Verdelingsmethode van beschouwde waarden

De methode van de kansverdelingsfunctie van een willekeurige variabele is van toepassing om de dichtheid ervan te vinden. Bij gebruik van deze methode wordt een cumulatieve waarde berekend. Dan, door het te differentiëren, kunt u de kansdichtheid krijgen. Nu we de distributiefunctiemethode hebben, kunnen we nog een paar voorbeelden bekijken. Laat X een continue willekeurige variabele zijn met een bepaalde kansdichtheid.

Wat is de kansdichtheidsfunctie van x2? Als u de functie (boven en rechts) y \u003d x2 bekijkt of er een grafiek van maakt, kunt u zien dat het een toenemende X en 0 <y<1 is. Nu moet je de overwogen methode gebruiken om Y te vinden. Eerst wordt de cumulatieve verdelingsfunctie gevonden, je hoeft alleen maar te differentiëren om de kansdichtheid te krijgen. Als we dit doen, krijgen we: 0<y<1. De distributiemethode is succesvol geïmplementeerd om Y te vinden wanneer Y een toenemende functie van X is. Trouwens, f(y) integreert in 1 over y.

In het laatste voorbeeld is er veel zorg besteed aan het indexeren van de cumulatieve functies en kansdichtheid met X of Y om aan te geven tot welke willekeurige variabele ze behoorden. Als we bijvoorbeeld de cumulatieve verdelingsfunctie van Y vinden, krijgen we X. Als je een willekeurige variabele X en zijn dichtheid moet vinden, hoef je deze alleen maar te differentiëren.

Variabele veranderingstechniek

Laat X een continue willekeurige variabele zijn, gegeven door een verdelingsfunctie met een gemeenschappelijke noemer f (x). Als je in dit geval de waarde van y in X=v (Y) zet, krijg je de waarde van x, bijvoorbeeld v (y). Nu moeten we de verdelingsfunctie van een continue willekeurige variabele Y krijgen. Waar de eerste en tweede gelijkheid plaatsvinden uit de definitie van cumulatieve Y. De derde gelijkheid geldt omdat het deel van de functie waarvoor u (X) ≦ y is ook waar dat X ≦ v (Y). En de laatste wordt gedaan om de kans te bepalen in een continue willekeurige variabele X. Nu moeten we de afgeleide van FY (y), de cumulatieve verdelingsfunctie van Y, nemen om de kansdichtheid Y te krijgen.

Verdelingsfunctie van een continue willekeurige variabele
Verdelingsfunctie van een continue willekeurige variabele

Generalisatie voor de afnamefunctie

Laat X een continue willekeurige variabele zijn met gemeenschappelijke f (x) gedefinieerd over c1<x<c2. En laat Y=u (X) een afnemende functie zijn van X met inverse X=v (Y). Aangezien de functie continu en afnemend is, is er een inverse functie X=v (Y).

Om dit probleem aan te pakken, kunt u kwantitatieve gegevens verzamelen en de empirische cumulatieve distributiefunctie gebruiken. Met deze informatie en er een beroep op doen, moet u steekproeven, standaarddeviaties, mediagegevens, enzovoort combineren.

Evenzo kan zelfs een vrij eenvoudig probabilistisch model een enorm aantal resultaten hebben. Als u bijvoorbeeld 332 keer een munt opgooit. Dan is het aantal resultaten van flips groter dan dat van google (10100) - een aantal, maar niet minder dan 100 triljoen keer hoger dan elementaire deeltjes in het bekende universum. Niet geïnteresseerd in een analyse die op elke mogelijke uitkomst een antwoord geeft. Er zou een eenvoudiger concept nodig zijn, zoals het aantal koppen of de langste slag van de staarten. Om zich te concentreren op onderwerpen die van belang zijn, wordt een specifiek resultaat geaccepteerd. De definitie is in dit geval als volgt: een willekeurige variabele is een reële functie met een kansruimte.

Het bereik S van een willekeurige variabele wordt soms de toestandsruimte genoemd. Dus als X de waarde in kwestie is, dan geldt dus N=X2, exp ↵X, X2 + 1, tan2 X, bXc, enzovoort. De laatste hiervan, waarbij X wordt afgerond op het dichtstbijzijnde gehele getal, wordt de verdiepingsfunctie genoemd.

Distributiefuncties

Zodra de van belang zijnde distributiefunctie voor een willekeurige variabele x is bepaald, wordt de vraag meestal: "Wat is de kans dat X in een subset van B-waarden v alt?". Bijvoorbeeld, B={oneven getallen}, B={groter dan 1}, of B={tussen 2 en 7} om de resultaten aan te geven die X hebben, de waardewillekeurige variabele, in deelverzameling A. In het bovenstaande voorbeeld kunt u de gebeurtenissen dus als volgt beschrijven.

{X is een oneven getal}, {X is groter dan 1}={X> 1}, {X is tussen 2 en 7}={2 <X <7} om overeen te komen met de drie bovenstaande opties voor deelverzameling B. Veel eigenschappen van willekeurige grootheden zijn niet gerelateerd aan een bepaalde X. Ze zijn eerder afhankelijk van hoe X zijn waarden toewijst. Dit leidt tot een definitie die als volgt klinkt: de verdelingsfunctie van een willekeurige variabele x is cumulatief en wordt bepaald door kwantitatieve waarnemingen.

Verdelingsfunctie van een discrete willekeurige variabele
Verdelingsfunctie van een discrete willekeurige variabele

Willekeurige variabelen en distributiefuncties

Zo kun je de kans berekenen dat de verdelingsfunctie van een willekeurige variabele x waarden in het interval aanneemt door af te trekken. Denk na over het opnemen of uitsluiten van eindpunten.

We noemen een willekeurige variabele discreet als deze een eindige of aftelbare oneindige toestandsruimte heeft. Dus X is het aantal kop op drie onafhankelijke flips van een bevooroordeelde munt dat stijgt met kans p. We moeten de cumulatieve distributiefunctie van een discrete willekeurige variabele FX voor X vinden. Laat X het aantal pieken zijn in een verzameling van drie kaarten. Dan Y=X3 via FX. FX begint bij 0, eindigt bij 1, en neemt niet af naarmate x-waarden toenemen. De cumulatieve FX-verdelingsfunctie van een discrete willekeurige variabele X is constant, behalve voor sprongen. Bij het springen is de FX continu. Bewijs de bewering over de juistede continuïteit van de verdelingsfunctie van de waarschijnlijkheidseigenschap is mogelijk met behulp van de definitie. Het klinkt als volgt: een constante willekeurige variabele heeft een cumulatieve FX die differentieerbaar is.

Om te laten zien hoe dit kan gebeuren, kunnen we een voorbeeld geven: een doelwit met een eenheidsstraal. Vermoedelijk. de dart wordt gelijkmatig verdeeld over het opgegeven gebied. Voor sommige λ> 0. De verdelingsfuncties van continue willekeurige variabelen nemen dus geleidelijk toe. FX heeft de eigenschappen van een distributiefunctie.

Een man wacht bij de bush alte tot de bus arriveert. Hij heeft voor zichzelf besloten dat hij zal weigeren wanneer het wachten 20 minuten bereikt. Hier is het nodig om de cumulatieve verdelingsfunctie voor T te vinden. Het tijdstip waarop een persoon nog op het busstation zal zijn of niet zal vertrekken. Ondanks het feit dat de cumulatieve verdelingsfunctie voor elke willekeurige variabele is gedefinieerd. Toch zullen andere kenmerken vrij vaak worden gebruikt: de massa voor een discrete variabele en de distributiedichtheidsfunctie van een willekeurige variabele. Gewoonlijk wordt de waarde uitgevoerd via een van deze twee waarden.

Vind de verdelingsfunctie van een willekeurige variabele
Vind de verdelingsfunctie van een willekeurige variabele

Massafuncties

Deze waarden worden beschouwd door de volgende eigenschappen, die een algemeen (massa) karakter hebben. De eerste is gebaseerd op het feit dat de kansen niet negatief zijn. De tweede volgt uit de observatie dat de verzameling voor alle x=2S, de toestandsruimte voor X, een partitie vormt van de probabilistische vrijheid van X. Voorbeeld: het opgooien van een bevooroordeelde munt waarvan de uitkomsten onafhankelijk zijn. Je kunt blijven doenbepaalde acties totdat je hoofden krijgt. Laat X een willekeurige variabele aanduiden die het aantal staarten voor de eerste kop geeft. En p geeft de kans op een bepaalde actie aan.

De massakansfunctie heeft dus de volgende karakteristieke kenmerken. Omdat de termen een numerieke reeks vormen, wordt X een geometrische willekeurige variabele genoemd. Geometrisch schema c, cr, cr2,.,,, crn heeft een som. En daarom heeft sn een limiet als n 1. In dit geval is de oneindige som de limiet.

De bovenstaande massafunctie vormt een meetkundige rij met een verhouding. Daarom natuurlijke getallen a en b. Het verschil in de waarden in de verdelingsfunctie is gelijk aan de waarde van de massafunctie.

De dichtheidswaarden in kwestie hebben een definitie: X is een willekeurige variabele waarvan de FX-verdeling een afgeleide heeft. FX die voldoet aan Z xFX (x)=fX (t) dt-1 wordt de kansdichtheidsfunctie genoemd. En X wordt een continue willekeurige variabele genoemd. In de fundamentele stelling van de calculus is de dichtheidsfunctie de afgeleide van de verdeling. Je kunt kansen berekenen door bepaalde integralen te berekenen.

Omdat gegevens worden verzameld uit meerdere waarnemingen, moet meer dan één willekeurige variabele tegelijk worden overwogen om de experimentele procedures te modelleren. Daarom betekent de verzameling van deze waarden en hun gezamenlijke verdeling voor de twee variabelen X1 en X2 het bekijken van gebeurtenissen. Voor discrete willekeurige variabelen zijn gezamenlijke probabilistische massafuncties gedefinieerd. Voor continue worden fX1, X2 beschouwd, waarbijaan de gezamenlijke kansdichtheid is voldaan.

Onafhankelijke willekeurige variabelen

Twee willekeurige variabelen X1 en X2 zijn onafhankelijk als twee daarmee samenhangende gebeurtenissen hetzelfde zijn. In woorden, de kans dat twee gebeurtenissen {X1 2 B1} en {X2 2 B2} tegelijkertijd plaatsvinden, y, is gelijk aan het product van de bovenstaande variabelen, dat elk van hen afzonderlijk voorkomt. Voor onafhankelijke discrete willekeurige variabelen is er een gezamenlijke probabilistische massafunctie, die het product is van het beperkende ionenvolume. Voor continue willekeurige variabelen die onafhankelijk zijn, is de gezamenlijke kansdichtheidsfunctie het product van de marginale dichtheidswaarden. Ten slotte beschouwen we n onafhankelijke waarnemingen x1, x2,.,,, xn voortkomend uit een onbekende dichtheids- of massafunctie f. Bijvoorbeeld een onbekende parameter in functies voor een exponentiële willekeurige variabele die de wachttijd voor een bus beschrijft.

De willekeurige variabele wordt gegeven door de verdelingsfunctie
De willekeurige variabele wordt gegeven door de verdelingsfunctie

Imitatie van willekeurige variabelen

Het belangrijkste doel van dit theoretische veld is om de tools te bieden die nodig zijn om inferentieprocedures te ontwikkelen op basis van degelijke statistische wetenschappelijke principes. Een zeer belangrijke use case voor software is dus de mogelijkheid om pseudo-gegevens te genereren om feitelijke informatie na te bootsen. Dit maakt het mogelijk om analysemethoden te testen en te verbeteren voordat ze in echte databases moeten worden gebruikt. Dit is nodig om de eigenschappen van de gegevens te verkennen via:modellering. Voor veel veelgebruikte families van willekeurige variabelen biedt R opdrachten om ze te genereren. Voor andere omstandigheden zijn methoden nodig voor het modelleren van een reeks onafhankelijke willekeurige variabelen die een gemeenschappelijke verdeling hebben.

Discrete willekeurige variabelen en opdrachtpatroon. Het sample-commando wordt gebruikt om eenvoudige en gestratificeerde willekeurige steekproeven te maken. Als resultaat, als een reeks x wordt ingevoerd, selecteert sample(x, 40) 40 records uit x zodat alle keuzes van grootte 40 dezelfde kans hebben. Dit gebruikt de standaard R-opdracht voor ophalen zonder vervanging. Kan ook worden gebruikt om discrete willekeurige variabelen te modelleren. Om dit te doen, moet je een toestandsruimte in de vector x en de massafunctie f voorzien. Een oproep om te vervangen=TRUE geeft aan dat bemonstering plaatsvindt bij vervanging. Om vervolgens een steekproef te geven van n onafhankelijke willekeurige variabelen die een gemeenschappelijke massafunctie f hebben, wordt de steekproef (x, n, vervangen=WAAR, kans=f) gebruikt.

Bepaald dat 1 de kleinste waarde is die wordt weergegeven en 4 de grootste van allemaal. Als het commando prob=f wordt weggelaten, zal het monster uniform bemonsteren uit de waarden in vector x. U kunt de simulatie vergelijken met de massafunctie die de gegevens heeft gegenereerd door naar het dubbele isgelijkteken te kijken,==. En herberekenen van de waarnemingen die elke mogelijke waarde voor x aannemen. Je kunt een tafel maken. Herhaal dit voor 1000 en vergelijk de simulatie met de bijbehorende massafunctie.

Illustratie van kanstransformatie

Eerstesimuleer homogene verdelingsfuncties van willekeurige variabelen u1, u2,.,,, un op het interval [0, 1]. Ongeveer 10% van de getallen moet binnen [0, 3, 0, 4] liggen. Dit komt overeen met 10% van de simulaties op het interval [0, 28, 0, 38] voor een willekeurige variabele met de weergegeven FX-verdelingsfunctie. Evenzo moet ongeveer 10% van de willekeurige getallen in het interval [0, 7, 0, 8] liggen. Dit komt overeen met 10% simulaties op het interval [0, 96, 1, 51] van de willekeurige variabele met de verdelingsfunctie FX. Deze waarden op de x-as kunnen worden verkregen door de inverse van FX te nemen. Als X een continue willekeurige variabele is met overal in zijn domein dichtheid fX positief, dan is de verdelingsfunctie strikt toenemend. In dit geval heeft FX een inverse FX-1-functie die bekend staat als de kwantielfunctie. FX (x) u alleen als x FX-1 (u). De kanstransformatie volgt uit de analyse van de willekeurige variabele U=FX (X).

Kansverdelingsfunctie van een willekeurige variabele
Kansverdelingsfunctie van een willekeurige variabele

FX heeft een bereik van 0 tot 1. Het kan niet onder 0 of boven 1 zijn. Voor waarden van u tussen 0 en 1. Als U kan worden gesimuleerd, dan moet een willekeurige variabele met FX-verdeling worden gesimuleerd via een kwantielfunctie. Neem de afgeleide om te zien dat de dichtheid u binnen 1 varieert. Aangezien de willekeurige variabele U een constante dichtheid heeft over het interval van zijn mogelijke waarden, wordt deze uniform genoemd op het interval [0, 1]. Het is gemodelleerd in R met het runif-commando. De identiteit wordt een probabilistische transformatie genoemd. Je kunt zien hoe het werkt in het voorbeeld van het dartbord. X tussen 0 en 1, functieverdeling u=FX (x)=x2, en dus de kwantielfunctie x=FX-1 (u). Het is mogelijk om onafhankelijke waarnemingen van de afstand vanaf het midden van het dartpaneel te modelleren en zo uniforme willekeurige variabelen U1, U2, te creëren.,, On. De verdelingsfunctie en de empirische functie zijn gebaseerd op 100 simulaties van de verdeling van een dartbord. Voor een exponentiële willekeurige variabele, vermoedelijk u=FX (x)=1 - exp (- x), en dus x=- 1 ln (1 - u). Soms bestaat logica uit equivalente uitspraken. In dit geval moet u de twee delen van het argument samenvoegen. De identiteit van het snijpunt is vergelijkbaar voor alle 2 {S i i} S, in plaats van een bepaalde waarde. De unie Ci is gelijk aan de toestandsruimte S en elk paar sluit elkaar uit. Aangezien Bi - is verdeeld in drie axioma's. Elke controle is gebaseerd op de overeenkomstige kans P. Voor elke subset. Een identiteit gebruiken om ervoor te zorgen dat het antwoord niet afhangt van het feit of de interval-eindpunten zijn opgenomen.

De verdelingswet van de functie van een willekeurige variabele
De verdelingswet van de functie van een willekeurige variabele

Exponentiële functie en zijn variabelen

Voor elke uitkomst in alle gebeurtenissen wordt uiteindelijk de tweede eigenschap van de continuïteit van kansen gebruikt, die als axiomatisch wordt beschouwd. De verdelingswet van de functie van een willekeurige variabele laat hier zien dat elk zijn eigen oplossing en antwoord heeft.

Aanbevolen: