Basisconcepten van wiskundige statistiek. Toepassing van wiskundige statistiek

Inhoudsopgave:

Basisconcepten van wiskundige statistiek. Toepassing van wiskundige statistiek
Basisconcepten van wiskundige statistiek. Toepassing van wiskundige statistiek
Anonim

Wiskundige statistiek is een methode waarmee u weloverwogen beslissingen kunt nemen in onzekere omstandigheden. De studie van methoden voor het verzamelen en systematiseren van gegevens, het verwerken van de uiteindelijke resultaten van experimenten en experimenten met massale willekeur en het ontdekken van eventuele patronen is wat deze tak van de wiskunde doet. Overweeg de basisconcepten van wiskundige statistiek.

Verschil met kansrekening

Methoden van wiskundige statistiek sluiten nauw aan bij de kansrekening. Beide takken van de wiskunde houden zich bezig met de studie van talrijke willekeurige verschijnselen. De twee disciplines zijn verbonden door limietstellingen. Er is echter een groot verschil tussen deze wetenschappen. Als de kanstheorie de kenmerken van een proces in de echte wereld bepa alt op basis van een wiskundig model, dan doet wiskundige statistiek het tegenovergestelde: het stelt de eigenschappen van het model in opgebaseerd op waargenomen informatie.

Kansrekening en mat. statistieken
Kansrekening en mat. statistieken

Stappen

De toepassing van wiskundige statistieken kan alleen worden uitgevoerd met betrekking tot willekeurige gebeurtenissen of processen, of liever, gegevens die zijn verkregen door ze te observeren. En dit gebeurt in verschillende fasen. Ten eerste ondergaan de gegevens van experimenten en experimenten een bepaalde verwerking. Ze zijn geordend voor duidelijkheid en gemak van analyse. Vervolgens wordt een exacte of benaderende schatting gemaakt van de vereiste parameters van het waargenomen willekeurige proces. Ze kunnen zijn:

  • beoordeling van de waarschijnlijkheid van een gebeurtenis (de waarschijnlijkheid ervan is aanvankelijk onbekend);
  • het gedrag van een onbepaalde verdelingsfunctie bestuderen;
  • verwachting schatting;
  • variantieschatting
  • etc.
Grondbeginselen van mat. statistieken
Grondbeginselen van mat. statistieken

De derde fase is de verificatie van eventuele hypothesen die vóór de analyse zijn gesteld, d.w.z. het verkrijgen van een antwoord op de vraag hoe de resultaten van de experimenten overeenkomen met de theoretische berekeningen. In feite is dit de belangrijkste fase van wiskundige statistiek. Een voorbeeld zou zijn om te overwegen of het gedrag van een waargenomen willekeurig proces binnen de normale verdeling v alt.

Bevolking

De basisconcepten van wiskundige statistiek omvatten algemene populaties en steekproefpopulaties. Deze discipline houdt zich bezig met de studie van een reeks bepaalde objecten met betrekking tot een bepaald eigendom. Een voorbeeld is het werk van een taxichauffeur. Overweeg deze willekeurige variabelen:

  • lading of aantal klanten: per dag, voor de lunch, na de lunch, …;
  • gemiddelde reistijd;
  • aantal inkomende aanvragen of hun bijlage bij stadsdistricten en nog veel meer.

Het is ook vermeldenswaard dat het mogelijk is om een reeks vergelijkbare willekeurige processen te bestuderen, die ook een willekeurige variabele zullen zijn die kan worden waargenomen.

Bevolking
Bevolking

Dus, in de methoden van wiskundige statistiek wordt de hele reeks objecten die worden bestudeerd of de resultaten van verschillende waarnemingen die onder dezelfde omstandigheden op een bepaald object worden uitgevoerd, de algemene bevolking genoemd. Met andere woorden, wiskundig strikter, het is een willekeurige variabele die wordt gedefinieerd in de ruimte van elementaire gebeurtenissen, met een klasse van subsets erin, waarvan de elementen een bekende waarschijnlijkheid hebben.

Steekproefpopulatie

Er zijn gevallen waarin het om de een of andere reden (kosten, tijd) onmogelijk of onpraktisch is om een continue studie uit te voeren om elk object te bestuderen. Het is bijvoorbeeld een twijfelachtige beslissing om elke pot met verzegelde jam te openen om de kwaliteit ervan te controleren, en het is onmogelijk om de baan van elk luchtmolecuul in een kubieke meter te schatten. In dergelijke gevallen wordt de methode van selectieve observatie gebruikt: een bepaald aantal objecten wordt (meestal willekeurig) uit de algemene populatie geselecteerd en onderworpen aan hun analyse.

Voorbeeld van de generaalaggregaten
Voorbeeld van de generaalaggregaten

Deze concepten lijken in eerste instantie misschien ingewikkeld. Om het onderwerp volledig te begrijpen, moet je daarom het leerboek van V. E. Gmurman "Probability Theory and Mathematical Statistics" bestuderen. Een bemonsteringsset of monster is dus een reeks objecten die willekeurig uit de algemene verzameling is geselecteerd. Strikt wiskundige termen is dit een opeenvolging van onafhankelijke, uniform verdeelde willekeurige variabelen, voor elk waarvan de verdeling samenv alt met die aangegeven voor de algemene willekeurige variabele.

Basisconcepten

Laten we kort een aantal andere basisconcepten van wiskundige statistiek bekijken. Het aantal objecten in de algemene populatie of steekproef wordt volume genoemd. De voorbeeldwaarden die tijdens het experiment worden verkregen, worden de voorbeeldrealisatie genoemd. Om een schatting van de algemene populatie op basis van een steekproef betrouwbaar te maken, is het van belang om te beschikken over een zogenaamde representatieve of representatieve steekproef. Dit betekent dat de steekproef de populatie volledig moet vertegenwoordigen. Dit kan alleen worden bereikt als alle elementen van de populatie een gelijke kans hebben om in de steekproef te zitten.

Basisconcepten
Basisconcepten

Voorbeelden maken onderscheid tussen retour en niet-retour. In het eerste geval, in de inhoud van het monster, wordt het herhaalde element teruggestuurd naar de algemene verzameling, in het tweede geval niet. In de praktijk wordt meestal gebruik gemaakt van steekproeven zonder vervanging. Er moet ook worden opgemerkt dat de grootte van de algemene populatie altijd aanzienlijk groter is dan de grootte van de steekproef. Bestaanveel opties voor het bemonsteringsproces:

  • simple - items worden willekeurig één voor één geselecteerd;
  • typed - de algemene bevolking is verdeeld in typen, en er wordt uit elk een keuze gemaakt; een voorbeeld is een enquête onder bewoners: mannen en vrouwen apart;
  • mechanical - selecteer bijvoorbeeld elk 10e element;
  • serial - selectie wordt gemaakt in reeksen van elementen.

Statistische verdeling

Volgens Gmurman zijn kansrekening en wiskundige statistiek uiterst belangrijke disciplines in de wetenschappelijke wereld, vooral in het praktische deel ervan. Houd rekening met de statistische verdeling van de steekproef.

Stel dat we een groep leerlingen hebben die getest zijn op wiskunde. Als resultaat hebben we een reeks schattingen: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - dit is ons primaire statistische materiaal.

Allereerst moeten we het sorteren, of een rangschikkingsbewerking uitvoeren: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - en zo een variatiereeks krijgen. Het aantal herhalingen van elk van de beoordelingen wordt de beoordelingsfrequentie genoemd en hun verhouding tot de steekproefomvang wordt de relatieve frequentie genoemd. Laten we een tabel maken van de statistische verdeling van de steekproef, of gewoon een statistische reeks:

ai 1 2 3 4 5
pi 1 1 2 4 3

of

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Laten we een willekeurige variabele nemen waarop we een reeks experimenten zullen uitvoeren en kijken welke waarde deze variabele aanneemt. Stel dat ze de waarde a1 - m1 keer nam; a2 - m2 keer, enz. De grootte van deze steekproef is m1 + … + mk=m. De verzameling ai, waarbij i varieert van 1 tot k, is een statistische reeks.

Intervalverdeling

In het boek van VE Gmurman "Probability Theory and Mathematical Statistics" wordt ook een statistische intervalreeks gepresenteerd. De compilatie is mogelijk wanneer de waarde van de functie die wordt bestudeerd continu is in een bepaald interval en het aantal waarden groot is. Beschouw een groep studenten, of liever hun lengte: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 studenten in totaal. Het is duidelijk dat de lengte van een persoon een continue waarde is. We moeten de intervalstap definiëren. Hiervoor wordt de Sturges-formule gebruikt.

h= max - min = 190 - 156 = 33 = 5, 59
1+log2m 1+log230 5, 9

De waarde van 6 kan dus worden genomen als de grootte van het interval. Er moet ook worden gezegd dat de waarde 1+log2m de formule is voorhet aantal intervallen bepalen (uiteraard met afronding). Volgens de formules worden dus 6 intervallen verkregen, die elk een grootte van 6 hebben. En de eerste waarde van het initiële interval zal het getal zijn dat wordt bepaald door de formule: min - h / 2=156 - 6/2=153. Laten we een tabel maken die intervallen bevat en het aantal leerlingen waarvan de groei binnen een bepaald interval viel.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Natuurlijk is dit niet alles, want er zijn veel meer formules in wiskundige statistiek. We hebben slechts enkele basisconcepten overwogen.

Distributieschema

Distributiegrafieken
Distributiegrafieken

De basisconcepten van wiskundige statistiek omvatten ook een grafische weergave van de verdeling, die zich onderscheidt door duidelijkheid. Er zijn twee soorten grafieken: polygoon en histogram. De eerste wordt gebruikt voor een discrete statistische reeks. En voor continue distributie respectievelijk de tweede.

Aanbevolen: