Κύριος » αλγοριθμική διαπραγμάτευση » Διαστρωματωμένη τυχαία δειγματοληψία

Διαστρωματωμένη τυχαία δειγματοληψία

αλγοριθμική διαπραγμάτευση : Διαστρωματωμένη τυχαία δειγματοληψία
Τι είναι οι διαστρεβλωμένες τυχαίες δειγματοληψίες;

Η στρωματοποιημένη τυχαία δειγματοληψία είναι μια μέθοδος δειγματοληψίας που περιλαμβάνει τη διάσπαση ενός πληθυσμού σε μικρότερες υποομάδες που είναι γνωστές ως στρώματα. Σε διαστρωματωμένη τυχαία δειγματοληψία ή στρωματοποίηση, τα στρώματα σχηματίζονται βάσει των κοινών χαρακτηριστικών ή χαρακτηριστικών των μελών, όπως το εισόδημα ή το μορφωτικό επίπεδο.

Η στρωματοποιημένη τυχαία δειγματοληψία καλείται επίσης αναλογική τυχαία δειγματοληψία ή τυχαία δειγματοληψία ποσοστώσεων

[Σημαντικό: Η στρωματοποιημένη δειγματοληψία χρησιμοποιείται για να επισημάνει τις διαφορές μεταξύ των ομάδων ενός πληθυσμού, σε αντίθεση με την απλή τυχαία δειγματοληψία, η οποία αντιμετωπίζει όλα τα μέλη ενός πληθυσμού ως ίσα με την ίδια πιθανότητα να δειγματοληφθούν.]

1:40

Διαστρωματωμένη τυχαία δειγματοληψία

Πώς λειτουργεί η στρωματοποιημένη τυχαία δειγματοληψία

Κατά την ολοκλήρωση της ανάλυσης ή της έρευνας σε μια ομάδα οντοτήτων με παρόμοια χαρακτηριστικά, ένας ερευνητής μπορεί να διαπιστώσει ότι το μέγεθος του πληθυσμού είναι πολύ μεγάλο για να ολοκληρωθεί η έρευνα. Για να εξοικονομήσετε χρόνο και χρήμα, ένας αναλυτής μπορεί να υιοθετήσει μια πιο εφικτή προσέγγιση επιλέγοντας μια μικρή ομάδα από τον πληθυσμό. Η μικρή ομάδα αναφέρεται ως μέγεθος δείγματος, το οποίο είναι ένα υποσύνολο του πληθυσμού που χρησιμοποιείται για να αντιπροσωπεύει ολόκληρο τον πληθυσμό. Ένα δείγμα μπορεί να επιλεγεί από έναν πληθυσμό με διάφορους τρόπους, εκ των οποίων η μία είναι η στρωματοποιημένη τυχαία μέθοδος δειγματοληψίας.

Μια στρωματοποιημένη τυχαία δειγματοληψία περιλαμβάνει τη διαίρεση ολόκληρου του πληθυσμού σε ομογενείς ομάδες που ονομάζονται στρώματα (πληθυντικός για το στρώμα). Στη συνέχεια επιλέγονται τυχαία δείγματα από κάθε στρώμα. Για παράδειγμα, εξετάστε έναν ακαδημαϊκό ερευνητή που θα ήθελε να μάθει τον αριθμό των φοιτητών MBA το 2007 που έλαβαν προσφορά εργασίας εντός τριών μηνών από την αποφοίτηση.

Σύντομα θα διαπιστώσει ότι υπήρχαν σχεδόν 200.000 πτυχιούχοι MBA για το έτος. Μπορεί να αποφασίσει να πάρει απλά ένα απλό τυχαίο δείγμα 50.000 αποφοίτων και να εκτελέσει μια έρευνα. Καλύτερα, θα μπορούσε να διαιρέσει τον πληθυσμό σε στρώματα και να πάρει ένα τυχαίο δείγμα από τα στρώματα. Για να γίνει αυτό, θα δημιουργούσε ομάδες πληθυσμού με βάση το φύλο, την ηλικιακή ομάδα, τη φυλή, τη χώρα της εθνικότητας και την ιστορία της σταδιοδρομίας. Ένα τυχαίο δείγμα από κάθε στρώμα λαμβάνεται σε αριθμό ανάλογο με το μέγεθος του στρώματος σε σύγκριση με τον πληθυσμό. Αυτά τα υποσύνολα των στρωμάτων στη συνέχεια συγκεντρώνονται για να σχηματίσουν ένα τυχαίο δείγμα.

Βασικές τακτικές

  • Η στρωματοποιημένη τυχαία δειγματοληψία επιτρέπει στους ερευνητές να αποκτήσουν δείγμα πληθυσμού που αντιπροσωπεύει καλύτερα ολόκληρο τον πληθυσμό που μελετάται.
  • Η στρωματοποιημένη τυχαία δειγματοληψία περιλαμβάνει τη διάσπαση ολόκληρου του πληθυσμού σε ομοιογενείς ομάδες που ονομάζονται στρώματα.
  • Η στρωματοποιημένη τυχαία δειγματοληψία διαφέρει από την απλή τυχαία δειγματοληψία, η οποία περιλαμβάνει την τυχαία επιλογή δεδομένων από ολόκληρο τον πληθυσμό, επομένως κάθε πιθανό δείγμα είναι εξίσου πιθανό να συμβεί.

Παράδειγμα διαστρωματωμένης τυχαίας δειγματοληψίας

Ας υποθέσουμε ότι μια ερευνητική ομάδα θέλει να καθορίσει τη ΣΔΣ των φοιτητών σε όλο τον κόσμο. Η ερευνητική ομάδα δυσκολεύεται να συλλέξει δεδομένα από τα 21 εκατομμύρια φοιτητές. αποφασίζει να πάρει ένα τυχαίο δείγμα του πληθυσμού χρησιμοποιώντας 4.000 μαθητές.

Τώρα υποθέστε ότι η ομάδα εξετάζει τα διαφορετικά χαρακτηριστικά των συμμετεχόντων στο δείγμα και αναρωτιέται εάν υπάρχουν διαφορές στις συμφωνίες GPA και τις μεγάλες εταιρείες σπουδαστών. Ας υποθέσουμε ότι 560 φοιτητές είναι αγγλικές μεγάλες εταιρείες, 1.135 είναι επιστήμες, 800 είναι μεγαλύτερες επιστήμες υπολογιστών, 1.090 είναι μηχανολόγοι και 415 είναι μαθηματικά. Η ομάδα θέλει να χρησιμοποιήσει ένα ανάλογο στρωματοποιημένο τυχαίο δείγμα όπου το στρώμα του δείγματος είναι ανάλογο του τυχαίου δείγματος στον πληθυσμό.

Ας υποθέσουμε ότι η ομάδα ερευνά τα δημογραφικά στοιχεία των φοιτητών στις ΗΠΑ και βρίσκει το ποσοστό των σπουδαστών με 12% σπουδές στα αγγλικά, 28% σημαντικοί στην επιστήμη, 24% σημαντικοί στην επιστήμη των υπολογιστών, 21% σημαντικοί μηχανικοί και 15% στα μαθηματικά. Έτσι, δημιουργούνται πέντε στρώματα από τη στρωματοποιημένη τυχαία διαδικασία δειγματοληψίας.

Στη συνέχεια, η ομάδα πρέπει να επιβεβαιώσει ότι το στρώμα του πληθυσμού είναι ανάλογο με το στρώμα του δείγματος. Ωστόσο, διαπιστώνουν ότι οι αναλογίες δεν είναι ίσες. Η ομάδα πρέπει στη συνέχεια να δειγματοληψία 4.000 φοιτητές από τον πληθυσμό και να επιλέξει τυχαία 480 αγγλικά, 1.120 επιστήμες, 960 επιστήμες υπολογιστών, 840 μηχανικούς και 600 σπουδαστές μαθηματικών.

Με αυτά, έχει ένα ανάλογο στρωματοποιημένο τυχαίο δείγμα φοιτητών, το οποίο παρέχει καλύτερη αντιπροσώπευση των μεγάλων σχολών των φοιτητών στις ΗΠΑ. Οι ερευνητές μπορούν στη συνέχεια να επισημάνουν συγκεκριμένο στρώμα, να παρατηρήσουν τις διαφορετικές μελέτες των Αμερικανών φοιτητών και να παρατηρήσουν τους διάφορους μέσους βαθμούς .

Απλά Τυχαία Αντίσταση με Διαστρωμένα Τυχαία Δείγματα

Τα απλά τυχαία δείγματα και τα στρωματοποιημένα τυχαία δείγματα είναι και τα δύο εργαλεία στατιστικής μέτρησης. Ένα απλό τυχαίο δείγμα χρησιμοποιείται για να αντιπροσωπεύει ολόκληρο τον πληθυσμό των δεδομένων. Ένα στρωματοποιημένο τυχαίο δείγμα διαιρεί τον πληθυσμό σε μικρότερες ομάδες ή σε στρώματα, με βάση τα κοινά χαρακτηριστικά.

Το απλό τυχαίο δείγμα χρησιμοποιείται συχνά όταν υπάρχουν πολύ λίγες διαθέσιμες πληροφορίες σχετικά με τον πληθυσμό των δεδομένων, όταν ο πληθυσμός των δεδομένων έχει πάρα πολλές διαφορές για να χωριστεί σε διάφορα υποσύνολα ή όταν υπάρχει μόνο ένα ξεχωριστό χαρακτηριστικό μεταξύ του πληθυσμού των δεδομένων.

Για παράδειγμα, μια εταιρεία καραμελών μπορεί να θέλει να μελετήσει τις αγοραστικές συνήθειες των πελατών της προκειμένου να καθορίσει το μέλλον της σειράς προϊόντων της. Εάν υπάρχουν 10.000 πελάτες, μπορεί να επιλέξει να επιλέξει 100 από αυτούς τους πελάτες ως τυχαίο δείγμα. Στη συνέχεια, μπορεί να εφαρμόσει αυτό που βρίσκει από αυτούς τους 100 πελάτες στην υπόλοιπη βάση. Σε αντίθεση με τη στρωματοποίηση, θα δειγματίζει 100 μέλη καθαρά τυχαία χωρίς να λαμβάνει υπόψη τα μεμονωμένα χαρακτηριστικά τους.

Αναλογική και δυσανάλογη διαστρωμάτωση

Η στρωματοποιημένη τυχαία δειγματοληψία εξασφαλίζει ότι κάθε υποομάδα ενός συγκεκριμένου πληθυσμού αντιπροσωπεύεται επαρκώς σε ολόκληρο το δείγμα πληθυσμού μιας ερευνητικής μελέτης. Η διαστρωμάτωση μπορεί να είναι αναλογική ή δυσανάλογη. Σε αναλογική στρωματοποιημένη μέθοδο, το μέγεθος δείγματος κάθε στρώματος είναι ανάλογο του μεγέθους του πληθυσμού του στρώματος.

Για παράδειγμα, εάν ο ερευνητής ήθελε ένα δείγμα 50.000 αποφοίτων χρησιμοποιώντας ηλικιακή κλίμακα, το ανάλογο στρωματοποιημένο τυχαίο δείγμα θα ληφθεί χρησιμοποιώντας τον ακόλουθο τύπο: (μέγεθος δείγματος / μέγεθος πληθυσμού) x μέγεθος στρώματος. Ο παρακάτω πίνακας προϋποθέτει ένα πληθυσμό 180.000 πτυχιούχων MBA ανά έτος.

Ηλικιακή ομάδα


24-28


29-33


34-37


Σύνολο


Αριθμός ατόμων στο στρώμα


90.000


60.000


30.000


180.000


Δοκιμαστικό μέγεθος δείγματος


25.000


16, 667


8, 333


50.000


Το μέγεθος δείγματος στρωμάτων για πτυχιούχους MBA ηλικίας 24 έως 28 ετών υπολογίζεται ως (50.000 / 180.000) x 90.000 = 25.000. Η ίδια μέθοδος χρησιμοποιείται για τις άλλες ομάδες ηλικιακών ομάδων. Τώρα που το μέγεθος του δείγματος των στρωμάτων είναι γνωστό, ο ερευνητής μπορεί να πραγματοποιήσει απλή τυχαία δειγματοληψία σε κάθε στρώμα για να επιλέξει τους συμμετέχοντες στην έρευνα. Με άλλα λόγια, 25.000 απόφοιτοι της ηλικιακής ομάδας 24-28 θα επιλέγονται τυχαία από ολόκληρο τον πληθυσμό, 16.667 απόφοιτοι ηλικίας 29-33 θα επιλέγονται από τον πληθυσμό τυχαία και ούτω καθεξής.

Σε ένα δυσανάλογο στρωματοποιημένο δείγμα, το μέγεθος κάθε στρώματος δεν είναι ανάλογο του μεγέθους του στον πληθυσμό. Ο ερευνητής μπορεί να αποφασίσει να δοκιμάσει το 1/2 των πτυχιούχων στην ηλικιακή ομάδα 34-37 και το 1/3 των αποφοίτων στην ηλικιακή ομάδα 29-33 ετών.

Είναι σημαντικό να σημειωθεί ότι ένα άτομο δεν μπορεί να χωρέσει σε πολλαπλά στρώματα. Κάθε οντότητα πρέπει να ταιριάζει μόνο σε ένα στρώμα. Η ύπαρξη αλληλοεπικαλυπτόμενων υποομάδων σημαίνει ότι ορισμένα άτομα θα έχουν μεγαλύτερες πιθανότητες να επιλεγούν για την έρευνα, πράγμα που καταργεί εντελώς την έννοια της στρωματοποιημένης δειγματοληψίας ως ένα είδος δειγματοληψίας πιθανότητας.

[Σημαντικό: Οι διαχειριστές χαρτοφυλακίων μπορούν να χρησιμοποιήσουν διαστρωματωμένη τυχαία δειγματοληψία για τη δημιουργία χαρτοφυλακίων με την αναπαραγωγή ενός ευρετηρίου, όπως ενός δείκτη ομολόγων].

Πλεονεκτήματα της διαστρωματωμένης τυχαίας δειγματοληψίας

Το κύριο πλεονέκτημα της στρωματοποιημένης τυχαίας δειγματοληψίας είναι ότι καταγράφει βασικά χαρακτηριστικά του πληθυσμού στο δείγμα. Παρόμοια με τον σταθμισμένο μέσο όρο, αυτή η μέθοδος δειγματοληψίας παράγει χαρακτηριστικά στο δείγμα που είναι ανάλογα με τον συνολικό πληθυσμό. Η στρωματοποιημένη τυχαία δειγματοληψία λειτουργεί καλά για πληθυσμούς με ποικίλα χαρακτηριστικά, αλλά διαφορετικά δεν είναι αποτελεσματικός εάν δεν είναι δυνατή η δημιουργία υποομάδων.

Η διαστρωμάτωση δίνει μικρότερο σφάλμα στην εκτίμηση και μεγαλύτερη ακρίβεια από την απλή τυχαία μέθοδο δειγματοληψίας. Όσο μεγαλύτερες είναι οι διαφορές μεταξύ των στρωμάτων, τόσο μεγαλύτερο είναι το κέρδος στην ακρίβεια.

Μειονεκτήματα της διαστρωματωμένης τυχαίας δειγματοληψίας

Δυστυχώς, αυτή η μέθοδος έρευνας δεν μπορεί να χρησιμοποιηθεί σε κάθε μελέτη. Το μειονέκτημα της μεθόδου είναι ότι πρέπει να πληρούνται αρκετές προϋποθέσεις για να χρησιμοποιηθεί σωστά. Οι ερευνητές πρέπει να προσδιορίσουν κάθε μέλος ενός πληθυσμού που μελετάται και να ταξινομήσουν το καθένα σε έναν και μόνο έναν υποπληθυσμό. Ως αποτέλεσμα, η στρωματοποιημένη τυχαία δειγματοληψία είναι μειονεκτική όταν οι ερευνητές δεν μπορούν να ταξινομήσουν με βεβαιότητα κάθε μέλος του πληθυσμού σε μια υποομάδα. Επίσης, η εξεύρεση ενός εξαντλητικού και οριστικού καταλόγου ολόκληρου του πληθυσμού μπορεί να είναι προκλητική.

Η αλληλεπικάλυψη μπορεί να είναι ένα ζήτημα, εάν υπάρχουν θέματα που εμπίπτουν σε πολλές υποομάδες. Όταν γίνεται απλή τυχαία δειγματοληψία, είναι πιθανότερο να επιλεγούν όσοι βρίσκονται σε πολλαπλές υποομάδες. Το αποτέλεσμα θα μπορούσε να είναι ψευδής παρουσίαση ή ανακριβής αντανάκλαση του πληθυσμού.

Τα παραπάνω παραδείγματα το καθιστούν εύκολο: οι προπτυχιακοί, μεταπτυχιακοί, οι άνδρες και οι γυναίκες είναι σαφώς καθορισμένες ομάδες. Σε άλλες περιπτώσεις, ωστόσο, μπορεί να είναι πολύ πιο δύσκολη. Φανταστείτε ότι ενσωματώνετε χαρακτηριστικά όπως η φυλή, η εθνικότητα ή η θρησκεία. Η διαδικασία διαλογής γίνεται πιο δύσκολη, καθιστώντας τη στρωματοποιημένη τυχαία δειγματοληψία μια αναποτελεσματική και λιγότερο ιδανική μέθοδο.

Σύγκριση επενδυτικών λογαριασμών Όνομα παροχέα Περιγραφή Αποκάλυψη διαφημιζόμενου × Οι προσφορές που εμφανίζονται σε αυτόν τον πίνακα προέρχονται από συνεργασίες από τις οποίες η Investopedia λαμβάνει αποζημίωση.

Σχετικοί όροι

Δείγμα Ένα δείγμα είναι μια μικρότερη, διαχειρίσιμη έκδοση μιας μεγαλύτερης ομάδας. Τα δείγματα χρησιμοποιούνται στη στατιστική δοκιμή όταν τα μεγέθη του πληθυσμού είναι πολύ μεγάλα. περισσότερα Πώς δουλεύουν απλά τυχαία δείγματα Ένα απλό τυχαίο δείγμα είναι ένα υποσύνολο στατιστικού πληθυσμού στο οποίο κάθε μέλος του υποσυνόλου έχει ίσες πιθανότητες επιλογής. Ένα απλό τυχαίο δείγμα πρέπει να είναι μια αμερόληπτη αναπαράσταση μιας ομάδας. περισσότερο Αντιπροσωπευτικό δείγμα χρησιμοποιείται συχνά για την εξαγωγή ευρύτερης αντίληψης Ένα αντιπροσωπευτικό δείγμα είναι ένα υποσύνολο ενός πληθυσμού που αντανακλά τα χαρακτηριστικά ολόκληρου του πληθυσμού. περισσότερα Η είσοδος και η έξοδος της συστηματικής δειγματοληψίας Η συστηματική δειγματοληψία είναι μια μέθοδος δειγματοληψίας πιθανότητας στην οποία επιλέγεται ένα τυχαίο δείγμα από μεγαλύτερο πληθυσμό. περισσότερα Δειγματοληψία Ορισμός Η δειγματοληψία είναι μια διαδικασία που χρησιμοποιείται στη στατιστική ανάλυση στην οποία μια ομάδα παρατηρήσεων εξάγεται από μεγαλύτερο πληθυσμό. περισσότερος ορισμός T-Test Μια t-test είναι ένας τύπος στατιστικής εισφοράς που χρησιμοποιείται για να προσδιοριστεί εάν υπάρχει σημαντική διαφορά μεταξύ των μέσων των δύο ομάδων, τα οποία μπορεί να σχετίζονται με ορισμένα χαρακτηριστικά. περισσότερες συνδέσεις συνεργατών
Συνιστάται
Αφήστε Το Σχόλιό Σας