Κύριος » επιχείρηση » Αντίστροφη επαγωγή

Αντίστροφη επαγωγή

επιχείρηση : Αντίστροφη επαγωγή
Τι είναι η επαγωγή προς τα πίσω;

Η οπίσθια επαγωγή στη θεωρία των παιχνιδιών είναι μια επαναληπτική διαδικασία λογικής προς τα πίσω στο χρόνο, από το τέλος ενός προβλήματος ή μιας κατάστασης, για την επίλυση της πεπερασμένης εκτεταμένης μορφής και των διαδοχικών παιχνιδιών και για την εξαγωγή μιας σειράς βέλτιστων ενεργειών.

Επεξήγηση προς τα πίσω

Η οπίσθια επαγωγή χρησιμοποιήθηκε για την επίλυση των παιχνιδιών, καθώς ο John von Neumann και ο Oskar Morgenstern καθιέρωσαν τη θεωρία των παιχνιδιών ως ακαδημαϊκό θέμα όταν δημοσίευσαν το βιβλίο τους, Theory of Games and Economic Behavior, το 1944.

Σε κάθε στάδιο του παιχνιδιού, η οπίσθια επαγωγή καθορίζει τη βέλτιστη στρατηγική του παίκτη που κάνει την τελευταία κίνηση στο παιχνίδι. Στη συνέχεια, καθορίζεται η βέλτιστη δράση του επόμενου κινούμενου παίκτη, λαμβάνοντας τη δράση του τελευταίου παίκτη όπως έχει δοθεί. Αυτή η διαδικασία συνεχίζεται προς τα πίσω έως ότου προσδιοριστεί η καλύτερη δράση για κάθε χρονική στιγμή. Στην πραγματικότητα, κάποιος καθορίζει την ισορροπία Nash κάθε υπογέμου του αρχικού παιχνιδιού.

Ωστόσο, τα αποτελέσματα που προκύπτουν από την αντίστροφη πρόκληση συχνά αποτυγχάνουν να προβλέψουν το πραγματικό ανθρώπινο παιχνίδι. Πειραματικές μελέτες έχουν δείξει ότι η "ορθολογική" συμπεριφορά (όπως προβλέπεται από τη θεωρία των παιχνιδιών) σπάνια εκτίθεται στην πραγματική ζωή. Οι παράλογοι παίκτες μπορούν στην πραγματικότητα να καταλήξουν σε υψηλότερες αποδόσεις από ό, τι προβλέπεται από την οπίσθια επαγωγή, όπως απεικονίζεται στο παιχνίδι των σαρανταποδίων.

Στο παιχνίδι των σαρανταποδίων, δύο παίκτες παίρνουν εναλλακτικά την ευκαιρία να πάρουν μεγαλύτερο μερίδιο από ένα αυξανόμενο ποτ χρημάτων ή να περάσουν το ποτ στον άλλο παίκτη. Οι αποδόσεις είναι διευθετημένες έτσι ώστε εάν το δοχείο μεταβιβάζεται στον αντίπαλό του και ο αντίπαλος παίρνει το ποτ στον επόμενο γύρο, κάποιος παίρνει ελαφρώς λιγότερα από ό, τι αν κάποιος πήρε το ποτ σε αυτόν τον γύρο. Το παιχνίδι ολοκληρώνεται μόλις ένας παίκτης πάρει το στοίχημα, με τον παίκτη να πάρει το μεγαλύτερο τμήμα και ο άλλος παίκτης να πάρει το μικρότερο τμήμα.

Παράδειγμα αναδρομικής επαγωγής

Για παράδειγμα, υποθέστε ότι ο παίκτης Α πηγαίνει πρώτος και πρέπει να αποφασίσει αν θα πρέπει να «πάρει» ή να «περάσει» την απόρριψη, η οποία ανέρχεται σήμερα σε $ 2. Εάν παίρνει, τότε το Α και το Β παίρνουν $ 1 το καθένα, αλλά εάν ο Α περάσει, η απόφαση να πάρει ή να περάσει τώρα πρέπει να γίνει από τον Παίκτη Β. Αν το B παίρνει, παίρνει $ 3 (δηλαδή το προηγούμενο stash $ 2 + $ 1) και ο Α παίρνει $ 0. Αλλά αν το Β περάσει, ο Α παίρνει τώρα να αποφασίσει αν θα πάρει ή να περάσει και ούτω καθεξής. Εάν και οι δύο παίκτες πάντοτε επιλέξουν να περάσουν, παίρνουν το καθένα μια πληρωμή $ 100 στο τέλος του παιχνιδιού.

Το σημείο του παιχνιδιού είναι αν και οι δύο και οι δύο συνεργάζονται και συνεχίζουν να περάσουν μέχρι το τέλος του παιχνιδιού, παίρνουν τη μέγιστη πληρωμή των $ 100 η κάθε μία. Αν όμως δεν εμπιστεύονται τον άλλο παίκτη και αναμένουν να πάρουν την πρώτη ευκαιρία, η ισορροπία Nash προβλέπει ότι οι παίκτες θα πάρουν τη χαμηλότερη πιθανή αξίωση ($ 1 στην περίπτωση αυτή).

Η ισορροπία Nash αυτού του παιχνιδιού, όπου κανένας παίκτης δεν έχει κίνητρο να παρεκκλίνει από την επιλεγείσα στρατηγική του αφού εξετάσει την επιλογή ενός αντιπάλου, υποδεικνύει ότι ο πρώτος παίκτης θα πάρει το ποτ στον πρώτο γύρο του παιχνιδιού. Ωστόσο, στην πραγματικότητα, σχετικά λίγοι παίκτες το κάνουν. Ως αποτέλεσμα, λαμβάνουν υψηλότερη απολαβή από την πληρωμή που προβλέπεται από την ανάλυση ισορροπίας.

Επίλυση διαδοχικών παιχνιδιών με χρήση οπίσθιας επαγωγής

Παρακάτω είναι ένα απλό διαδοχικό παιχνίδι μεταξύ δύο παικτών. Οι ετικέτες με τον Παίκτη 1 και τον Παίκτη 2 μέσα σε αυτά είναι τα σύνολα πληροφοριών για τους παίκτες ένα ή δύο, αντίστοιχα. Οι αριθμοί στις παρενθέσεις στο κάτω μέρος του δέντρου είναι οι αποδόσεις σε κάθε αντίστοιχο σημείο. Το παιχνίδι είναι επίσης διαδοχικό, οπότε ο Παίκτης 1 κάνει την πρώτη απόφαση (αριστερά ή δεξιά) και ο Παίκτης 2 κάνει την απόφασή του μετά τον Παίκτη 1 (πάνω ή κάτω).

Φιγούρα 1

Η οπίσθια επαγωγή, όπως όλες οι θεωρίες παιχνιδιών, χρησιμοποιεί τις υποθέσεις ορθολογισμού και μεγιστοποίησης, πράγμα που σημαίνει ότι ο Παίκτης 2 θα μεγιστοποιήσει την απολαβή του σε οποιαδήποτε δεδομένη κατάσταση. Σε κάθε πληροφορία έχουμε δύο επιλογές, τέσσερις συνολικά. Με την κατάργηση των επιλογών που δεν θα επιλέξει ο Παίκτης 2, μπορούμε να περιορίσουμε το δέντρο μας. Με αυτόν τον τρόπο, θα τραβήξουμε τις γραμμές που μεγιστοποιούν την πληρωμή του παίκτη στο δεδομένο σύνολο πληροφοριών.

Σχήμα 2

Μετά από αυτή τη μείωση, ο παίκτης 1 μπορεί να μεγιστοποιήσει τις απολαβές του τώρα που οι επιλογές του παίκτη 2 γίνονται γνωστές. Το αποτέλεσμα είναι μια ισορροπία που διαπιστώνεται με την οπίσθια επαγωγή του Παίκτη 1 επιλέγοντας "δεξιά" και τον Παίκτη 2 επιλέγοντας "up". Παρακάτω είναι η λύση στο παιχνίδι με την διαδρομή ισορροπίας με έντονη γραφή.

Σχήμα 3

Για παράδειγμα, θα μπορούσε κανείς εύκολα να δημιουργήσει ένα παιχνίδι παρόμοιο με το παραπάνω χρησιμοποιώντας εταιρείες ως παίκτες. Αυτό το παιχνίδι θα μπορούσε να περιλαμβάνει σενάρια έκδοσης προϊόντων. Εάν η Εταιρεία 1 ήθελε να κυκλοφορήσει ένα προϊόν, τι θα μπορούσε να κάνει η Εταιρεία 2 για την πρόβλεψη πωλήσεων αυτού του νέου προϊόντος σε διαφορετικά σενάρια, μπορούμε να δημιουργήσουμε ένα παιχνίδι για να προβλέψουμε πώς μπορούν να εκδηλωθούν τα συμβάντα. ένα τέτοιο παιχνίδι.

Σχήμα 4

Σύγκριση επενδυτικών λογαριασμών Όνομα παροχέα Περιγραφή Αποκάλυψη διαφημιζόμενου × Οι προσφορές που εμφανίζονται σε αυτόν τον πίνακα προέρχονται από συνεργασίες από τις οποίες η Investopedia λαμβάνει αποζημίωση.

Σχετικοί όροι

Οροφή εξονυχιστικών παιγνιδιών Το κεκτημένο του παιχνιδιού στη θεωρία των παιχνιδιών περιλαμβάνει δύο παίκτες που παίρνουν εναλλακτικά την ευκαιρία να πάρουν το μεγαλύτερο μερίδιο μιας αυξανόμενης απόσβεσης χρημάτων. περισσότερα Πώς λειτουργεί η θεωρία των παιχνιδιών Η θεωρία των παιχνιδιών είναι ένα πλαίσιο για τη μοντελοποίηση σεναρίων στις οποίες υπάρχουν συγκρούσεις συμφερόντων μεταξύ των παικτών. more Zero-Sum Game Μια κατάσταση στην οποία το κέρδος ενός ατόμου ισοδυναμεί με απώλεια άλλου ατόμου, έτσι ώστε η καθαρή μεταβολή του πλούτου ή του οφέλους να είναι μηδέν. Ένα παιχνίδι με μηδενικό άθροισμα μπορεί να έχει μόνο δύο παίκτες ή εκατομμύρια συμμετέχοντες. περισσότερα ισορροπία Nash Η ισορροπία Nash είναι μια ιδέα μέσα στη θεωρία των παιχνιδιών όπου το βέλτιστο αποτέλεσμα ενός παιχνιδιού είναι εκεί όπου δεν υπάρχει κίνητρο να παρεκκλίνει από την αρχική του στρατηγική. περισσότερο Δίλημμα του Ταξιδιώτη Ορισμός Το δίλημμα του ταξιδιώτη καταδεικνύει το παράδοξο της ορθολογικότητας - ότι η λήψη αποφάσεων παράλογα συχνά παράγει μια καλύτερη απολαβή στη θεωρία των παιχνιδιών. περισσότερη αντιστοίχιση Pennies Ορισμός Matching pennies είναι ένα βασικό παράδειγμα θεωρίας παιχνιδιών που δείχνει πόσο ορθολογικοί φορείς λήψης αποφάσεων επιδιώκουν να μεγιστοποιήσουν τις απολαβές τους. περισσότερες συνδέσεις συνεργατών
Συνιστάται
Αφήστε Το Σχόλιό Σας