Κύριος » αλγοριθμική διαπραγμάτευση » Άθροισμα των τετραγώνων

Άθροισμα των τετραγώνων

αλγοριθμική διαπραγμάτευση : Άθροισμα των τετραγώνων
Ποιο είναι το άθροισμα των τετραγώνων;

Το άθροισμα των τετραγώνων είναι μια στατιστική τεχνική που χρησιμοποιείται στην ανάλυση παλινδρόμησης για τον προσδιορισμό της διασποράς των σημείων δεδομένων. Σε μια ανάλυση παλινδρόμησης, ο στόχος είναι να καθοριστεί πόσο καλά μια σειρά δεδομένων μπορεί να προσαρμοστεί σε μια λειτουργία που θα μπορούσε να βοηθήσει να εξηγήσει πώς δημιουργήθηκε η σειρά δεδομένων. Το άθροισμα των τετραγώνων χρησιμοποιείται ως μαθηματικός τρόπος για να βρεθεί η συνάρτηση που ταιριάζει καλύτερα (ποικίλλει λιγότερο) από τα δεδομένα.

Η φόρμουλα για το άθροισμα των τετραγώνων είναι

Για ένα σύνολο X από n τεμάχια: Άθροισμα τετραγώνων = Σi = 0n (Xi-X~) 2 όπου: Xi = Το i-όριο στο setX~ = Ο μέσος όρος όλων των αντικειμένων στο σετ (Xi-X~) Η απόκλιση κάθε στοιχείου από το μέσο \ begin {aligned} & \ text {Για μια σειρά} X \ text {of} n \ text {items:} \\ & 0} ^ {n} \ left (X_i- \ overline {X} \ right} ^ 2 \\ & \ textbf {where:} \\ & X_i = set} \\ & \ overline {X} = \ text {Ο μέσος όρος όλων των αντικειμένων στο σύνολο} \\ & \ αριστερά (X_i- \ overline {X} \ right} = \ text { (xi-x) 2 where: Xi = Το στοιχείο i στο setX = Ο μέσος όρος όλων αντικείμενα στο σετ (Xi -X) = Η απόκλιση κάθε στοιχείου από το μέσο

Το άθροισμα των τετραγώνων είναι επίσης γνωστό ως παραλλαγή.

Τι σας λέει το άθροισμα των τετραγώνων;

Το άθροισμα των τετραγώνων είναι ένα μέτρο απόκλισης από τον μέσο όρο. Στις στατιστικές, ο μέσος όρος είναι ο μέσος όρος ενός συνόλου αριθμών και είναι το πιο συχνά χρησιμοποιούμενο μέτρο της κεντρικής τάσης. Ο αριθμητικός μέσος υπολογίζεται απλά συγκεντρώνοντας τις τιμές στο σύνολο δεδομένων και διαιρώντας με τον αριθμό των τιμών.

Ας υποθέσουμε ότι οι τιμές κλεισίματος της Microsoft (MSFT) τις τελευταίες πέντε ημέρες ήταν 74, 01, 74, 77, 73, 94, 73, 61 και 73, 40 σε δολάρια ΗΠΑ. Το άθροισμα των συνολικών τιμών είναι 369, 73 δολάρια και η μέση ή μέση τιμή του εγχειριδίου θα ήταν έτσι $ 369, 73 / 5 = 73, 95 δολάρια.

Αλλά η γνώση του μέσου ενός σετ μετρήσεων δεν είναι πάντα αρκετό. Μερικές φορές, είναι χρήσιμο να γνωρίζετε πόση παραλλαγή υπάρχει σε ένα σύνολο μετρήσεων. Πόσο μακριά είναι οι μεμονωμένες τιμές από τη μέση μπορεί να δώσει κάποια εικόνα για το πώς ταιριάζουν οι παρατηρήσεις ή οι τιμές στο μοντέλο παλινδρόμησης που δημιουργείται.

Για παράδειγμα, εάν ένας αναλυτής ήθελε να μάθει αν η τιμή της μετοχής της MSFT κινείται σε συνδυασμό με την τιμή της Apple (AAPL), μπορεί να παρουσιάσει το σύνολο των παρατηρήσεων για τη διαδικασία των δύο αποθεμάτων για μια ορισμένη περίοδο, π.χ. 1, 2, ή 10 χρόνια και δημιουργήστε ένα γραμμικό μοντέλο με κάθε μία από τις παρατηρήσεις ή μετρήσεις που καταγράφηκαν. Αν η σχέση μεταξύ των δύο μεταβλητών (δηλαδή, η τιμή του AAPL και η τιμή του MSFT) δεν είναι ευθεία, τότε υπάρχουν διαφορές στο σύνολο δεδομένων που πρέπει να εξεταστούν προσεκτικά.

Στα στατιστικά στοιχεία μιλάμε, αν η γραμμή στο γραμμικό μοντέλο που δημιουργείται δεν περνάει από όλες τις μετρήσεις της αξίας, τότε κάποια από τη μεταβλητότητα που παρατηρήθηκε στις τιμές των μετοχών είναι ανεξήγητη. Το άθροισμα των τετραγώνων χρησιμοποιείται για να υπολογιστεί εάν υπάρχει μια γραμμική σχέση μεταξύ δύο μεταβλητών και κάθε ανεξήγητη μεταβλητότητα αναφέρεται ως το εναπομένον άθροισμα τετραγώνων.

Το άθροισμα των τετραγώνων είναι το άθροισμα του τετραγώνου της μεταβολής, όπου η διακύμανση ορίζεται ως η διαφορά μεταξύ κάθε μεμονωμένης τιμής και του μέσου όρου. Για να προσδιοριστεί το άθροισμα των τετραγώνων, η απόσταση μεταξύ κάθε σημείου δεδομένων και της γραμμής καλύτερης προσαρμογής είναι τετράγωνη και στη συνέχεια συνόψισε. Η γραμμή καλύτερης προσαρμογής θα ελαχιστοποιήσει αυτήν την τιμή.

Πώς να υπολογίσετε το άθροισμα των τετραγώνων

Τώρα μπορείτε να δείτε γιατί η μέτρηση ονομάζεται άθροισμα των τετραγωνικών αποκλίσεων, ή το άθροισμα των τετραγώνων για συντομία. Χρησιμοποιώντας το παράδειγμα MSFT παραπάνω, το άθροισμα των τετραγώνων μπορεί να υπολογιστεί ως:

  • SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95)
  • SS = (0.06) 2 + (0.82) 2 + (-0.01) 2 + (-0.34) 2 + (-0.55) 2
  • SS = 1, 0942

Η προσθήκη του αθροίσματος των αποκλίσεων μόνο χωρίς τετραγωνισμό θα έχει ως αποτέλεσμα έναν αριθμό ίσο ή κοντά στο μηδέν αφού οι αρνητικές αποκλίσεις θα αντισταθμίσουν σχεδόν τέλεια τις θετικές αποκλίσεις. Για να έχουμε έναν πιο ρεαλιστικό αριθμό, το άθροισμα των αποκλίσεων πρέπει να είναι τετράγωνο. Το άθροισμα των τετραγώνων θα είναι πάντα ένας θετικός αριθμός επειδή το τετράγωνο οποιουδήποτε αριθμού, θετικό ή αρνητικό, είναι πάντα θετικό.

Παράδειγμα του τρόπου χρήσης του αθροίσματος των τετραγώνων

Με βάση τα αποτελέσματα του υπολογισμού MSFT, ένα υψηλό άθροισμα τετραγώνων υποδεικνύει ότι οι περισσότερες από τις τιμές είναι μακρύτερα από το μέσο όρο και, επομένως, υπάρχει μεγάλη μεταβλητότητα στα δεδομένα. Ένα χαμηλό άθροισμα τετραγώνων αναφέρεται σε χαμηλή μεταβλητότητα στο σύνολο των παρατηρήσεων.

Στο παραπάνω παράδειγμα, το 1, 0942 δείχνει ότι η μεταβλητότητα της τιμής των μετοχών της MSFT τις τελευταίες πέντε ημέρες είναι πολύ χαμηλή και οι επενδυτές που επιθυμούν να επενδύσουν σε μετοχές που χαρακτηρίζονται από σταθερότητα τιμών και χαμηλή μεταβλητότητα μπορούν να επιλέξουν το MSFT.

Βασικές τακτικές

  • Το άθροισμα των τετραγώνων μετρά την απόκλιση των σημείων δεδομένων από τη μέση τιμή.
  • Ένα υψηλότερο αποτέλεσμα αθροίσματος τετραγώνων υποδηλώνει μεγάλο βαθμό μεταβλητότητας μέσα στο σύνολο δεδομένων, ενώ ένα χαμηλότερο αποτέλεσμα υποδηλώνει ότι τα δεδομένα διαφέρουν σημαντικά από τη μέση τιμή.

Περιορισμοί χρήσης του αθροίσματος των τετραγώνων

Η λήψη επενδυτικής απόφασης σχετικά με το απόθεμα για αγορά απαιτεί πολύ περισσότερες παρατηρήσεις από αυτές που αναφέρονται εδώ. Ένας αναλυτής μπορεί να χρειαστεί να συνεργαστεί με χρόνια δεδομένα για να γνωρίζει με μεγαλύτερη βεβαιότητα πόσο υψηλή ή χαμηλή είναι η μεταβλητότητα ενός περιουσιακού στοιχείου. Καθώς προστίθενται περισσότερα σημεία δεδομένων στο σετ, το άθροισμα των τετραγώνων γίνεται μεγαλύτερο, καθώς οι τιμές θα είναι πιο απλωμένες.

Οι πιο ευρέως χρησιμοποιούμενες μετρήσεις της μεταβολής είναι η τυπική απόκλιση και διακύμανση. Ωστόσο, για να υπολογίσετε μία από τις δύο μετρήσεις, πρέπει πρώτα να υπολογιστεί το άθροισμα των τετραγώνων. Η διακύμανση είναι ο μέσος όρος του αθροίσματος των τετραγώνων (δηλαδή το άθροισμα των τετραγώνων διαιρούμενο με τον αριθμό των παρατηρήσεων). Η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης.

Υπάρχουν δύο μέθοδοι ανάλυσης παλινδρόμησης που χρησιμοποιούν το άθροισμα των τετραγώνων: τη μέθοδο γραμμικών ελαχίστων τετραγώνων και τη μέθοδο μη γραμμικών ελαχίστων τετραγώνων. Η μέθοδος των ελάχιστων τετραγώνων αναφέρεται στο γεγονός ότι η συνάρτηση παλινδρόμησης ελαχιστοποιεί το άθροισμα των τετραγώνων της διακύμανσης από τα πραγματικά σημεία δεδομένων. Με αυτόν τον τρόπο, είναι δυνατόν να σχεδιαστεί μια λειτουργία που παρέχει στατιστικά την καλύτερη προσαρμογή για τα δεδομένα. Σημειώστε ότι μια συνάρτηση παλινδρόμησης μπορεί να είναι γραμμική (ευθεία γραμμή) ή μη γραμμική (καμπύλη γραμμή).

Σύγκριση επενδυτικών λογαριασμών Όνομα παροχέα Περιγραφή Αποκάλυψη διαφημιζόμενου × Οι προσφορές που εμφανίζονται σε αυτόν τον πίνακα προέρχονται από συνεργασίες από τις οποίες η Investopedia λαμβάνει αποζημίωση.

Σχετικοί όροι

Πώς λειτουργεί η μέθοδος των ελαχίστων τετραγώνων Η μέθοδος των ελαχίστων τετραγώνων είναι μια στατιστική τεχνική για τον προσδιορισμό της γραμμής που ταιριάζει καλύτερα σε ένα μοντέλο, που καθορίζεται από μια εξίσωση με ορισμένες παραμέτρους στα παρατηρούμενα δεδομένα. more Πώς λειτουργεί η μέθοδος κριτηρίων των ελάχιστων τετραγώνων Το κριτήριο των ελαχίστων τετραγώνων είναι μια μέθοδος μέτρησης της ακρίβειας μιας γραμμής στην απεικόνιση των δεδομένων που χρησιμοποιήθηκαν για την παραγωγή της. Δηλαδή, ο τύπος καθορίζει τη γραμμή της καλύτερης προσαρμογής. πιο τυπική απόκλιση Ορισμός Η τυπική απόκλιση είναι ένα στατιστικό στοιχείο που μετρά τη διασπορά ενός συνόλου δεδομένων σε σχέση με τον μέσο όρο του και υπολογίζεται ως η τετραγωνική ρίζα της διακύμανσης. Υπολογίζεται ως η τετραγωνική ρίζα της διακύμανσης προσδιορίζοντας την διακύμανση μεταξύ κάθε σημείου δεδομένων σε σχέση με τον μέσο όρο. περισσότερα Χρησιμοποιώντας την Εξίσωση Εξισώσεων Διακύμανση είναι μια μέτρηση της διαφοράς μεταξύ αριθμών σε ένα σύνολο δεδομένων. Οι επενδυτές χρησιμοποιούν την εξίσωση διακύμανσης για να αξιολογήσουν την κατανομή ενεργητικού ενός χαρτοφυλακίου. περισσότερα Πώς λειτουργεί η υπολειπόμενη τυπική απόκλιση Η υπολειπόμενη τυπική απόκλιση είναι ένας στατιστικός όρος που χρησιμοποιείται για να περιγράψει τη διαφορά στις τυπικές αποκλίσεις των παρατηρηθεισών τιμών έναντι των προβλεπόμενων τιμών όπως φαίνεται από τα σημεία σε μια ανάλυση παλινδρόμησης. περισσότερα Πώς λειτουργεί ο συντελεστής προσδιορισμού Ο συντελεστής προσδιορισμού είναι ένα μέτρο που χρησιμοποιείται στη στατιστική ανάλυση για να εκτιμηθεί πόσο καλά ένα μοντέλο εξηγεί και προβλέπει μελλοντικά αποτελέσματα. περισσότερες συνδέσεις συνεργατών
Συνιστάται
Αφήστε Το Σχόλιό Σας