Pearson-distributie: definitie, toepassing

Inhoudsopgave:

Pearson-distributie: definitie, toepassing
Pearson-distributie: definitie, toepassing
Anonim

Wat is de distributiewet van Pearson? Het antwoord op deze brede vraag kan niet eenvoudig en beknopt zijn. Het Pearson-systeem is oorspronkelijk ontworpen om zichtbare vervormde waarnemingen te modelleren. Destijds was het algemeen bekend hoe een theoretisch model kon worden afgestemd op de eerste twee cumulanten of momenten van waargenomen gegevens: elke kansverdeling kan direct worden uitgebreid om een groep locatieschalen te vormen.

Pearsons hypothese over de normale verdeling van criteria

Behalve in pathologische gevallen kan de locatieschaal op willekeurige wijze worden aangepast aan het waargenomen gemiddelde (eerste cumulant) en variantie (tweede cumulant). Het was echter niet bekend hoe kansverdelingen moesten worden geconstrueerd waarin scheefheid (gestandaardiseerde derde cumulant) en kurtosis (gestandaardiseerde vierde cumulant) even vrij konden worden gecontroleerd. Deze behoefte werd duidelijk toen we probeerden bekende theoretische modellen in te passen in geobserveerde gegevens,die asymmetrie vertoonde.

In de onderstaande video zie je de analyse van Pearson's chi-distributie.

Image
Image

Geschiedenis

In zijn oorspronkelijke werk identificeerde Pearson vier soorten verdelingen (genummerd van I tot IV) naast de normale verdeling (die oorspronkelijk bekend stond als type V). De classificatie hangt af van het feit of de verdelingen worden ondersteund over een beperkt interval, op een halve as of op de gehele reële lijn, en of ze mogelijk scheef of noodzakelijkerwijs symmetrisch waren.

Twee omissies werden gecorrigeerd in het tweede artikel: hij herdefinieerde de type V-verdeling (oorspronkelijk was het alleen de normale verdeling, maar nu met inverse gamma) en introduceerde de type VI-verdeling. Samen behandelen de eerste twee artikelen de vijf hoofdtypen van het Pearson-systeem (I, III, IV, V en VI). In het derde artikel introduceerde Pearson (1916) aanvullende subtypen.

Pearson-distributiefuncties
Pearson-distributiefuncties

Verbeter het concept

Rind bedacht een eenvoudige manier om de parameterruimte van het Pearson-systeem (of de verdeling van criteria) te visualiseren, die hij later overnam. Tegenwoordig gebruiken veel wiskundigen en statistici deze methode. De soorten Pearson-verdelingen worden gekenmerkt door twee grootheden, gewoonlijk β1 en β2 genoemd. De eerste is het kwadraat van asymmetrie. De tweede is de traditionele kurtosis, of het vierde gestandaardiseerde moment: β2=γ2 + 3.

Moderne wiskundige methoden definiëren kurtosis γ2 als cumulanten in plaats van momenten, dus voor een normaalverdeling hebben we γ2=0 en β2=3. Hier is het de moeite waard om het historische precedent te volgen en β2 te gebruiken. Het diagram aan de rechterkant laat zien welk type een bepaalde Pearson-verdeling is (aangegeven met de punt (β1, β2).

Pearson-statistieken
Pearson-statistieken

Veel van de scheve en/of niet-mesokurtische verdelingen die we tegenwoordig kennen, waren begin jaren 1890 nog niet bekend. Wat nu bekend staat als de bètaverdeling, werd door Thomas Bayes gebruikt als de achterste parameter van de Bernoulli-verdeling in zijn artikel uit 1763 over inverse waarschijnlijkheid.

De bèta-distributie kreeg bekendheid vanwege zijn aanwezigheid in het Pearson-systeem en stond tot de jaren veertig bekend als de Pearson type I-distributie. De Type II-distributie is een speciaal geval van Type I, maar wordt meestal niet langer uitgelicht.

De Gamma-distributie is ontstaan uit zijn eigen werk en stond bekend als de Pearson Type III Normal Distribution voordat het in de jaren dertig en veertig zijn moderne naam kreeg. Een artikel uit 1895 van een wetenschapper presenteerde de Type IV-distributie, die de Student's t-distributie bevat, als een speciaal geval, dat meerdere jaren ouder is dan William Seely Gosset's latere gebruik. Zijn artikel uit 1901 presenteerde een distributie met inverse gamma (type V) en beta-priemgetallen (type VI).

Een andere mening

Volgens Ord ontwikkelde Pearson de basisvorm van vergelijking (1) op basis van de formule voor de afgeleide van de logaritme van de normale verdelingsdichtheidsfunctie (die een lineaire deling door de kwadratischestructuur). Veel specialisten zijn nog bezig met het testen van de hypothese over de verdeling van de Pearson-criteria. En het bewijst zijn doeltreffendheid.

Alternatieve Pearson-distributie
Alternatieve Pearson-distributie

Wie was Karl Pearson

Karl Pearson was een Engelse wiskundige en biostatisticus. Hij wordt gecrediteerd met het creëren van de discipline van wiskundige statistiek. In 1911 richtte hij 's werelds eerste afdeling statistiek op aan het University College London en leverde hij belangrijke bijdragen op het gebied van biometrie en meteorologie. Pearson was ook een aanhanger van sociaal darwinisme en eugenetica. Hij was de protégé en biograaf van Sir Francis G alton.

Biometrie

Karl Pearson speelde een belangrijke rol bij het creëren van de school voor biometrie, een concurrerende theorie voor het beschrijven van de evolutie en overerving van populaties aan het begin van de 20e eeuw. Zijn reeks van achttien artikelen "Mathematical Contributions to the Theory of Evolution" vestigde hem als de grondlegger van de biometrische school van overerving. In feite wijdde Pearson in 1893-1904 veel van zijn tijd aan ontwikkeling van statistische methoden voor biometrie. Deze methoden, die tegenwoordig veel worden gebruikt voor statistische analyse, omvatten de chikwadraattoets, standaarddeviatie, correlatie- en regressiecoëfficiënten.

De correlatiecoëfficiënt van Pearson
De correlatiecoëfficiënt van Pearson

De kwestie van erfelijkheid

De erfelijkheidswet van Pearson stelde dat het kiemplasma bestaat uit elementen die zijn geërfd van zowel ouders als van verder weg gelegen voorouders, waarvan de verhouding varieerde volgens verschillende kenmerken. Karl Pearson was een volgeling van G alton, en hoewel hunOmdat de werken in sommige opzichten verschilden, gebruikte Pearson een aanzienlijk deel van de statistische concepten van zijn leraar bij het formuleren van een biometrische school voor overerving, zoals de wet van regressie.

Pearson distributie
Pearson distributie

Schoolfuncties

De biometrische school was, in tegenstelling tot de Mendelianen, niet gericht op het verschaffen van een mechanisme voor overerving, maar op het verschaffen van een wiskundige beschrijving die niet causaal van aard was. Terwijl G alton een discontinue evolutietheorie voorstelde waarin soorten met grote sprongen zouden veranderen in plaats van kleine veranderingen die zich in de loop van de tijd opstapelden, wees Pearson op tekortkomingen in dit argument en gebruikte hij zijn ideeën om een continue evolutietheorie te ontwikkelen. De Mendeliërs gaven de voorkeur aan de discontinue evolutietheorie.

Terwijl G alton zich voornamelijk richtte op de toepassing van statistische methoden voor de studie van erfelijkheid, breidden Pearson en zijn collega Weldon hun redenering uit op dit gebied, variatie, correlaties van natuurlijke en seksuele selectie.

Typische verdeling
Typische verdeling

Een blik op evolutie

Voor Pearson was de evolutietheorie niet bedoeld om het biologische mechanisme te identificeren dat de patronen van overerving verklaart, terwijl de Mendeliaanse benadering verklaarde dat het gen het overervingsmechanisme was.

Pearson bekritiseerde Bateson en andere biologen omdat ze geen biometrische methoden gebruikten in hun studie van evolutie. Hij veroordeelde wetenschappers die zich niet concentreerden opstatistische validiteit van hun theorieën, onder vermelding van:

"Voordat we [elke oorzaak van progressieve verandering] als factor kunnen accepteren, moeten we niet alleen de aannemelijkheid ervan aantonen, maar, indien mogelijk, het kwantitatieve vermogen ervan."

Biologen zijn bezweken voor "bijna metafysische speculaties over de oorzaken van erfelijkheid" die het proces van het verzamelen van experimentele gegevens hebben vervangen, waardoor wetenschappers mogelijk potentiële theorieën kunnen beperken.

statistische brug
statistische brug

Natuurwetten

Voor Pearson waren de natuurwetten nuttig voor het maken van nauwkeurige voorspellingen en voor het samenvatten van trends in waargenomen gegevens. De reden was de ervaring "dat een bepaalde reeks zich in het verleden heeft voorgedaan en herhaald."

Het identificeren van een bepaald genetisch mechanisme was dus geen waardige onderneming voor biologen, die zich in plaats daarvan zouden moeten concentreren op wiskundige beschrijvingen van de empirische gegevens. Dit leidde deels tot een bitter geschil tussen biometrie en Mendelianen, waaronder Bateson.

Nadat laatstgenoemde een van Pearsons manuscripten had afgewezen waarin een nieuwe theorie over variatie of homotypie van nakomelingen werd beschreven, richtten Pearson en Weldon in 1902 het bedrijf Biometrika op. Hoewel de biometrische benadering van overerving uiteindelijk zijn Mendeliaanse perspectief verloor, zijn de methoden die ze destijds ontwikkelden van vitaal belang voor de studie van biologie en evolutie van vandaag.

Aanbevolen: