In de methode van statistische groeperingen wordt het geheel van de bestudeerde verschijnselen verdeeld in klassen en subklassen, die een homogene structuur hebben volgens bepaalde kenmerken. Elke indeling wordt beschreven door een systeem van statistische indicatoren. Gegroepeerde gegevens kunnen in tabellen worden weergegeven.
Deze actie is de belangrijkste methode die wordt gebruikt bij de feitelijke studie van sociale verschijnselen. Het ontstaat als een voorwaarde voor de toepassing van verschillende groepen statistieken, procedures en analytische methoden. Classificatie is bijvoorbeeld nodig om gegeneraliseerde indices te gebruiken, zoals gemiddelden.
Bijdrage van V. I. Lenina
In pre-revolutionaire Russische statistieken, met name in verschillende zemstvo's (dit zijn lokale overheden), werd veel ervaring opgedaan met het groeperen van verschillende soorten organisaties. En ook in die tijd werd er veel werk verzet om niet alleen tabellen te ontwikkelen met één voor één classificatiekenmerken, maar ook complexere schema's. Daarin zijn alle gegevens gegroepeerd op twee of meer parameters. Theoretische problemen met betrekking tot het gebruik van statistische groeperingsmethoden hebben echter geen wetenschappelijke onderbouwing gekregen. Deze stand van zaken bleef bestaan tot de werken van V. I. Lenin. Hij had een hoge dunk van de cognitieve waarde en het praktische belang van classificatie. Met betrekking tot tabellen die gebaseerd zijn op de tekenen van een statistische groepering van meer dan één kenmerk, schreef Lenin: "Er kan zonder overdrijving worden gezegd dat ze een revolutie teweeg zullen brengen in de wetenschap en, natuurlijk, de landbouweconomie."
Vladimir Iljitsj's aanbevelingen over de noodzaak van een voorlopige politieke en economische analyse van de aard van patronen en het bepalen van de soorten verschijnselen voordat experimenten met de classificatie van initiële gegevens worden gestart, zijn van fundamenteel belang.
Stappen van statistische groeperingen
Systematisering wordt niet alleen gebruikt bij de analyse van de structuur van de populatie, maar ook bij het bepalen van de soorten verschijnselen en bij de studie van de relatie tussen verschillende kenmerken of factoren. Voorbeelden van groepen die de bevolkingsstructuur uitdrukken, zijn classificaties van mensen naar leeftijd (met tussenpozen van één jaar of, vaker, vijf jaar) en bedrijven naar grootte.
Door klassen te combineren of ongelijke intervallen in te stellen, is het mogelijk om kwalitatieve verschillen tussen individuele systemen vast te stellen en vervolgens de techno-economische of sociaaleconomische typen van de relevante onderwerpen te bepalen(bijvoorbeeld bedrijven of boerderijen). Zo kan de bevolkingsgroepering van een land naar leeftijd worden uitgevoerd op basis van, naast eenvoudige chronologische objecten, van speciale indelingen als vrouwen van 16 tot 54 jaar en mannen van 16 tot 59 jaar. Het gebruik van deze speciale klassen maakt het mogelijk om de nationale economische index te berekenen, ook wel de beroepsbevolking van het land genoemd. De intervalgrenzen zijn enigszins willekeurig en kunnen van staat tot staat verschillen.
Taak
Gedetailleerde kwantitatieve classificatie van ondernemingen en bedrijven stelt ons in staat om over te gaan tot de definitie van verschillende kwalitatieve basisgroepen, zoals kleine, middelgrote en grote organisaties. Daarna kan een aantal algemene economische problemen worden opgehelderd, bijvoorbeeld het proces van concentratie van productie, de groei van industriële efficiëntie en de toename van de arbeidsproductiviteit. De nieuwe gegevens van Vladimir Iljitsj Lenin over de wetten die de ontwikkeling van het kapitalisme in de landbouw beheersen, zijn een schitterend voorbeeld van diepgaande analyse waarbij groepering wordt gebruikt om de complexe aard van patronen aan te tonen. En ook de relatie tussen de grootte van de onderneming en de algehele productiviteit.
De belangrijkste en moeilijkste taak van statistische groeperingen is om de soorten sociaal-economische verschijnselen in detail te identificeren en te beschrijven. Dergelijke onderwerpen vertegenwoordigen de uitdrukking van vormen van een bepaald sociaal proces of basiskenmerken. Ze lijken gemeenschappelijk te zijn voor veel individuele verschijnselen. In zijn analyse van de gelaagdheid van de boeren, gebruikte Vladimir Iljitsj Lenin de groeperinggrondig en uitgebreid. Allereerst onthulde hij het vormingsproces van de belangrijkste sociale klassen in het pre-revolutionaire Rusland, op het West-Europese platteland en in de Amerikaanse landbouw.
En het bleek dat Sovjetgegevens veel ervaring hebben met typologische en statistische groeperingen. De balans van de nationale economie van de USSR veronderstelt bijvoorbeeld een complex en vertakt classificatiesysteem. Andere voorbeelden van typologische statistische groepering in de Sovjet-ruimte zijn de systematisering van de bevolking naar sociale klasse. Evenals de eenwording van vaste productiemiddelen door sociaal-economische typen industriële eenheden. En je kunt ook zo'n voorbeeld geven als de groepering van de statistische populatie van het sociale product.
Bourgeois classificatie maakt niet genoeg gebruik van systematisering. Wanneer gebruik wordt gemaakt van groepering, is dat voor het grootste deel onjuist en draagt het niet bij aan het karakteriseren van de ware stand van zaken in de kapitalistische landen. Zo overdrijft de indeling van landbouwbedrijven naar landoppervlak de positie van kleinschalige productie in deze geest. En de groepering van de bevolking naar beroep onthult niet de ware klassenstructuur van de burgerlijke samenleving.
De sociaal-economische kenmerken van een socialistische staat bieden nieuwe toepassingen voor statistische groepering. De classificatie wordt gebruikt om de uitvoering van nationale economische plannen te analyseren, om de redenen voor de achterstand van sommige ondernemingen en sectoren vast te stellen. En identificeer ook ongebruikte bronnen. Bijvoorbeeld bedrijvenkunnen worden gegroepeerd volgens de mate van uitvoering van het plan of het niveau van winstgevendheid. Van groot belang voor het karakteriseren van de introductie van wetenschappelijke en technologische vooruitgang in de industrie is de groepering van ondernemingen, volgens technische en economische gegevens zoals de mate van automatisering en mechanisatie en de hoeveelheid elektriciteit die beschikbaar is voor werk.
Gegroepeerde gegevens zijn informatie gevormd door het combineren van individuele groepen statistische observaties over de aanwezigheid van een variabele in afzonderlijke klassen, zodat de frequentieverdeling van deze systemen een handig middel is om alle materialen samen te vatten en te analyseren.
Informatie
Gegevens kunnen worden gedefinieerd als groepen materiaal die kwalitatieve of kwantitatieve kenmerken van een variabele of een reeks variabelen vertegenwoordigen. Dit is analoog aan het zeggen dat klassen elke verzameling informatie kunnen zijn die een entiteit beschrijft. Systemen kunnen bij het groeperen van statistische gegevens worden ingedeeld in gegroepeerde en niet-gegroepeerde objecten.
Alle informatie die een persoon eerst verzamelt, is niet geclassificeerd. Niet-gegroepeerde statistische groeperingen zijn gegevens, maar alleen in onverwerkte vorm. Een voorbeeld van zulke systemen is elke lijst met getallen die je kunt bedenken.
Eerste type classificaties
Gegroepeerde gegevens is informatie die is georganiseerd in groepen die klassen worden genoemd. Dit type is al geclassificeerd, en dus sommigeniveau van analyse. Dit betekent dat alle informatie niet langer onbewerkt is.
Een gegevensklasse is een groep die is gekoppeld aan een specifieke aangepaste eigenschap. Als de manager van een onderneming bijvoorbeeld de mensen verzamelt die hij in een bepaald jaar in dienst neemt, kan hij ze in systemen indelen op leeftijd: twintig, dertig, veertig, enzovoort. En elk van deze groepen wordt een klas genoemd.
Dit is op zijn beurt niet de laatste divisie. Elk van deze klassen heeft een bepaalde breedte en dit wordt spatiëring of grootte genoemd. Dit concept is erg belangrijk als het gaat om het plotten van histogrammen en frequentieplots. Alle klassen kunnen dezelfde of verschillende groottes hebben, afhankelijk van hoe alle informatie wordt gegroepeerd. Het systeeminterval is altijd een geheel getal.
Klasse beperkingen en grenzen
Het eerste concept verwijst naar de werkelijke waarden die te zien zijn in de finaletafel. De klassebeperkingen vallen in twee categorieën: de ondergrens van het systeem en de bovengrens. Uiteraard worden alle indelingen in de tabellen gebruikt om de correctheid en informatiefheid te waarborgen.
Maar aan de andere kant worden klassengrenzen niet altijd gerespecteerd in de frequentietabel. Dit concept geeft het ware interval van systemen weer en is, net als verschillende beperkingen, ook verdeeld in grenzen van de onderste en bovenste waarden.
Levende en niet-levende bands
Wetenschap probeert natuurlijke fenomenen te begrijpen en te verklaren. Wetenschappers begrijpen dingen door ze te classificeren. Het behoortzowel levende wezens als niet-levende groepen van statistisch materiaal.
Deze typen kunnen op hun beurt worden onderverdeeld in groepen, afhankelijk van de contrasteigenschappen. Als studenten bijvoorbeeld in hun wetenschappelijke tijdschriften lijsten hebben gemaakt over de verschillende materialen en onderwerpen die ze hebben bestudeerd, kunnen ze deze gegevens gebruiken om kennis en informatie over de systemen die ze hebben bestudeerd uit te breiden.
Alle kennis kan worden gesorteerd of geclassificeerd volgens verschillende contrasteigenschappen. Hier zijn enkele voorbeelden:
- Metalen versus verschillende niet-metalen.
- Stenen terrein in plaats van woestijn of weide.
- Zichtbare kristallen versus onzichtbare mineralen.
- Een natuurlijk proces in plaats van een kunstmatig proces.
- Stoffen dichter dan water of minder zwaar dan een bepaalde vloeistof.
- Magnetisch versus niet-magnetisch.
En je kunt ook groepsverschillen maken op basis van de volgende kenmerken:
- De toestand van materie bij kamertemperatuur (vast, vloeibaar, gas).
- Smeltbaarheid van metalen.
- Fysieke eigenschappen enzovoort.
Materialen:
- Diverse artikelen die de bovenstaande categorieën illustreren.
- Magneten voor het testen van de eigenschappen van materialen.
- Een bak met water om te controleren of dingen drijven of zinken.
- Wetenschappelijke tijdschriften.
Bedieningsprocedure
Precies hoe de dingen gebeuren:
- Studenten werken in groepen. Elk krijgt wat materiaal en wordt gevraagd om manieren te vinden om te groeperenartikelen per categorie. Ze ontwikkelen de criteria die ze zullen gebruiken en sorteren de items dienovereenkomstig. Tabellen met resultaten zijn opgenomen in hun wetenschappelijke tijdschriften.
- Nadat de materialen zijn gegroepeerd, worden ze opnieuw gesorteerd volgens andere criteria. De volgende stap is ook het samenstellen van een lijst met resultaten. En daarna wordt een extra rij met elementen geschreven, die anders zijn gesorteerd vanwege veranderende criteria.
- Studenten noteren observaties en tabellen in hun wetenschappelijke tijdschriften.
Resultaten
Studenten repareren een reeks tabellen die laten zien hoe hun onderwerpen zijn gesorteerd op basis van elk van de criteria. Een groep studenten heeft bijvoorbeeld een paperclip, een klein stukje graniet, een kurk, een plastic speelgoed. En dan kunnen een paar sorteertabellen er als volgt uitzien.
-
Artikelen gesorteerd op magnetisme.
Reageren op magneet: paperclip, graniet. Reageert niet: kurk, plastic.
-
Items gesorteerd op dichtheid in vergelijking met water.
Pop-up: kurk, plastic. Verdrinking: paperclip, graniet.
Daarna maken de leerlingen presentaties voor de klas. Ze bespreken waarom verschillende items verschillend worden geclassificeerd op basis van de gebruikte criteria.
Leerlingen herhalen deze observaties elke keer, waarbij ze andere eigenschappen toepassen.
Praten
In dit stadium:
- Studenten kunnen deze observaties uitbreiden naar andere materialen zonder enigepraktisch onderzoek.
- Voorbeelden zijn voorbeelden van verschillende soorten gesteente. Studenten leren hoe ze nauwkeuriger kunnen observeren en precies kunnen schrijven wat ze zien met vergrootglazen en andere items die ze gebruiken.
- Als leerlingen een indexbestand hebben gemaakt met eigenschappen die op kaarten zijn geschreven, kunnen ze ook worden gesorteerd. Dit is handig als de index extra materiaal bevat dat niet in de klas zit.
Een gebruikelijke manier om continue kwantitatieve gegevens te verwerken, is om het hele scala aan betekenissen onder te verdelen in verschillende subbereiken. Het is noodzakelijk om aan elk materiaal een constante waarde toe te kennen van de klasse waarin het v alt. Merk op dat de dataset verandert van continu naar discreet.
Het concept van statistische groepering
Organisatie wordt gedaan door een reeks bereiken te definiëren en vervolgens de hoeveelheid gegevens te tellen die in elk van hen v alt. De deelgebieden overlappen elkaar niet. Ze moeten het volledige bereik van de dataset bestrijken.
Een van de meest succesvolle manieren om gegroepeerde systemen te visualiseren is het histogram. Het is een reeks rechthoeken waarbij de basis van de figuur de waarden overspant in het bijbehorende bereik. En de hoogte komt overeen met de hoeveelheid informatie.