Κύριος » επιχειρηματίες » Chi Square (χ2) Στατιστικός ορισμός

Chi Square (χ2) Στατιστικός ορισμός

επιχειρηματίες : Chi Square (χ2) Στατιστικός ορισμός
Τι είναι η τετραγωνική στατιστική Chi;

Μια πλατεία chi ( χ 2 ) η στατιστική είναι μια δοκιμή που μετρά τον τρόπο σύγκρισης των προσδοκιών με τα πραγματικά παρατηρούμενα δεδομένα (ή τα αποτελέσματα των μοντέλων). Τα δεδομένα που χρησιμοποιούνται για τον υπολογισμό μιας τετραγωνικής στατιστικής chi πρέπει να είναι τυχαία, ακατέργαστη, αμοιβαία αποκλειστική, να προέρχεται από ανεξάρτητες μεταβλητές και να προέρχεται από ένα αρκετά μεγάλο δείγμα. Για παράδειγμα, τα αποτελέσματα της τοποθέτησης ενός νομίσματος 100 φορές πληρούν αυτά τα κριτήρια.

Οι τετραγωνικές δοκιμές Chi χρησιμοποιούνται συχνά σε δοκιμές υποθέσεων.

Η φόρμουλα για την πλατεία Chi είναι

(ε) E = αναμενόμενη τιμή \ begin {ευθυγραμμισμένη} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) ^ 2} {E_i} \\ & \ textbf {where:} \\ & c = \ text {βαθμοί ελευθερίας} \\ & O = \ text { )} \\ \ end {ευθυγραμμισμένο} χc2 = ΣEi (Oi -Ei) 2 όπου: c = βαθμοί ελευθερίαςO = παρατηρούμενες τιμές E =

Τι σημαίνει μια τετράγωνη τεστ τεσσάρων να σας πω;

Υπάρχουν δύο κύριοι τύποι chi τετραγώνων δοκιμών: η δοκιμή της ανεξαρτησίας, η οποία θέτει ένα ζήτημα σχέσης, όπως, "Υπάρχει σχέση μεταξύ φύλου και SAT αποτελέσματα;"? και τη δοκιμασία καλής κατάστασης, η οποία ζητάει κάτι σαν "Αν ένα νόμισμα πεταχτεί 100 φορές, θα βγει 50 φορές και ουρές 50 φορές";

Για αυτές τις δοκιμές, χρησιμοποιούνται βαθμοί ελευθερίας για να προσδιοριστεί εάν μια συγκεκριμένη μηδενική υπόθεση μπορεί να απορριφθεί με βάση τον συνολικό αριθμό μεταβλητών και δειγμάτων στο πλαίσιο του πειράματος.

Για παράδειγμα, όταν εξετάζουμε τους μαθητές και την επιλογή μαθημάτων, ένα μέγεθος δείγματος 30 ή 40 φοιτητών πιθανότατα δεν είναι αρκετά μεγάλο για να δημιουργήσει σημαντικά δεδομένα. Η απόκτηση των ίδιων ή παρόμοιων αποτελεσμάτων από μια μελέτη που χρησιμοποιεί μέγεθος δείγματος 400 ή 500 φοιτητών είναι πιο έγκυρη.

Σε ένα άλλο παράδειγμα, σκεφτείτε να πετάξετε ένα νόμισμα 100 φορές. Το αναμενόμενο αποτέλεσμα της τοποθέτησης ενός δίκαιου νομίσματος 100 φορές είναι ότι τα κεφάλια θα φτάσουν 50 φορές και οι ουρές θα φτάσουν 50 φορές. Το πραγματικό αποτέλεσμα μπορεί να είναι ότι τα κεφάλια εμφανίζονται 45 φορές και οι ουρές έρχονται 55 φορές. Η τετραγωνική στατιστική chi δείχνει τυχόν αποκλίσεις μεταξύ των αναμενόμενων αποτελεσμάτων και των πραγματικών αποτελεσμάτων.

Βασικές τακτικές

  • Μια πλατεία chi (χ 2 ) η στατιστική είναι μια δοκιμή που μετρά τον τρόπο σύγκρισης των προσδοκιών με τα πραγματικά παρατηρούμενα δεδομένα.
  • Υπάρχουν δύο κύριοι τύποι chi τετραγωνικών δοκιμών: η δοκιμή της ανεξαρτησίας για τα δεδομένα και οι δοκιμές της καλής καταλληλότητας για ένα μοντέλο.
  • Αυτές οι δοκιμές μπορούν να χρησιμοποιηθούν για να προσδιοριστεί εάν μια ορισμένη μηδενική υπόθεση μπορεί να απορριφθεί στην δοκιμή της υπόθεσης.

Παράδειγμα δοκιμής Chi Squared

Φανταστείτε ότι μια τυχαία δημοσκόπηση έγινε σε 2.000 διαφορετικούς ψηφοφόρους, τόσο άνδρες όσο και γυναίκες. Οι άνθρωποι που απάντησαν ταξινομήθηκαν ανάλογα με το φύλο τους και αν ήταν δημοκράτες, δημοκράτες ή ανεξάρτητοι. Φανταστείτε ένα πλέγμα με τις στήλες ονομαζόμενες δημοκρατικές, δημοκρατικές και ανεξάρτητες, και δύο σειρές με την ονομασία αρσενικό και θηλυκό. Υποθέστε ότι τα δεδομένα από τους 2.000 ερωτηθέντες έχουν ως εξής:

ΔημοκρατικόςΔημοκράτηςΑνεξάρτητοςΣύνολο
Αρσενικός400300100800
Θηλυκός5006001001200
Σύνολο9009002002000

Το πρώτο βήμα για τον υπολογισμό του τετραγωνισμένου στατιστικού στοιχείου chi είναι η εύρεση των αναμενόμενων συχνοτήτων. Αυτά υπολογίζονται για κάθε "κελί" στο πλέγμα. Δεδομένου ότι υπάρχουν δύο κατηγορίες φύλου και τρεις κατηγορίες πολιτικής άποψης, υπάρχουν έξι συνολικές αναμενόμενες συχνότητες. Ο τύπος για την αναμενόμενη συχνότητα είναι:

Ε (r, c) = n (r) x c (r) nunde: r = γραμμή in questionc = \ times {r}} {n} \\ & \ textbf {where:} \\ & r = \ text {η εν λόγω σειρά} \\ & c = \ text { } \\ \ end {ευθυγραμμισμένο} E (r, c) = nn (r) × c (r) όπου: r = row in questionc =

Σε αυτό το παράδειγμα, οι αναμενόμενες συχνότητες είναι:

  • Ε (1, 1) = (900 χ 800) / 2, 000 = 360
  • Ε (1, 2) = (900 χ 800) / 2, 000 = 360
  • Ε (1, 3) = (200 χ 800) / 2, 000 = 80
  • E (2, 1) = (900 x 1, 200) / 2, 000 = 540
  • E (2, 2) = (900 x 1, 200) / 2, 000 = 540
  • E (2, 3) = (200 x 1, 200) / 2, 000 = 120

Στη συνέχεια, αυτές είναι οι τιμές που χρησιμοποιούνται για τον υπολογισμό του τετραγωνικού σχήματος chi χρησιμοποιώντας τον ακόλουθο τύπο:

(R, c)] 2E (r, c) όπου: O (r, c) = παρατηρούμενα δεδομένα για τη δεδομένη σειρά και στήλη \ begin {aligned} \ text {Chi-squared} = \ sum \ frac {[O (r, c) - E (r, c)] ^ 2} {E (r, c)} \\ & \ textbf {where:} \\ (R, c) -E (r, c) = \ text {παρατηρούμενα δεδομένα για τη δεδομένη σειρά και στήλη} \\ \ end { c)] 2 όπου: O (r, c) = παρατηρούμενα δεδομένα για τη δεδομένη σειρά και στήλη

Σε αυτό το παράδειγμα, η έκφραση για κάθε παρατηρούμενη τιμή είναι:

  • O (1, 1) = (400 - 360) 2/360 = 4, 44
  • O (1, 2) = (300 - 360) 2/360 = 10
  • O (1, 3) = (100-80) 2/80 = 5
  • Ο (2, 1) = (500-540) 2/540 = 2, 96
  • Ο (2, 2) = (600-540) 2/540 = 6, 67
  • O (2, 3) = (100-120) 2/120 = 3, 33

Το τετραγωνικό τετράγωνο chi ισούται τότε με το άθροισμα της τιμής αυτής, ή 32.41. Μπορούμε λοιπόν να δούμε ένα τετραγωνικό τετραγωνικό τραπέζι για να δούμε, λαμβάνοντας υπόψη τους βαθμούς ελευθερίας στη σύστασή μας, εάν το αποτέλεσμα είναι στατιστικά σημαντικό ή όχι.

Σύγκριση επενδυτικών λογαριασμών Όνομα παροχέα Περιγραφή Αποκάλυψη διαφημιζόμενου × Οι προσφορές που εμφανίζονται σε αυτόν τον πίνακα προέρχονται από συνεργασίες από τις οποίες η Investopedia λαμβάνει αποζημίωση.

Σχετικοί όροι

Ο βαθμός ελευθερίας Ο βαθμός ελευθερίας αναφέρεται στον μέγιστο αριθμό λογικά ανεξάρτητων αξιών, οι οποίες είναι αξίες που έχουν την ελευθερία να ποικίλουν, στο δείγμα δεδομένων. περισσότερος ορισμός T-Test Μια t-test είναι ένας τύπος στατιστικής εισφοράς που χρησιμοποιείται για να προσδιοριστεί εάν υπάρχει σημαντική διαφορά μεταξύ των μέσων των δύο ομάδων, τα οποία μπορεί να σχετίζονται με ορισμένα χαρακτηριστικά. περισσότερα Αντίστροφη συσχέτιση μας λέει Μια αντίστροφη συσχέτιση, επίσης γνωστή ως αρνητική συσχέτιση, είναι μια αντίθετη σχέση ανάμεσα σε δύο μεταβλητές που κινούνται σε αντίθετες κατευθύνσεις. περισσότερα Πώς λειτουργεί η υπολειπόμενη τυπική απόκλιση Η υπολειπόμενη τυπική απόκλιση είναι ένας στατιστικός όρος που χρησιμοποιείται για να περιγράψει τη διαφορά στις τυπικές αποκλίσεις των παρατηρηθεισών τιμών έναντι των προβλεπόμενων τιμών όπως φαίνεται από τα σημεία σε μια ανάλυση παλινδρόμησης. (ANOVA) είναι ένα εργαλείο στατιστικής ανάλυσης που χωρίζει τη συνολική μεταβλητότητα που βρέθηκε μέσα σε ένα σύνολο δεδομένων σε δύο συνιστώσες: τυχαίους και συστηματικούς παράγοντες. περισσότερος συσχετισμός συσχετισμού είναι ένα στατιστικό μέτρο για το πώς δύο κινητές αξίες κινούνται σε σχέση μεταξύ τους. περισσότερες συνδέσεις συνεργατών
Συνιστάται
Αφήστε Το Σχόλιό Σας