In SpieltheorieWie können Spieler jemals ein Ende haben, wenn es noch eine bessere Choice gibt, sich zu entscheiden? Vielleicht möchte ein Spieler immer noch seine Entscheidung ändern. Aber wenn dies der Fall ist, möchte sich der andere Spieler auch ändern. Wie können sie jemals hoffen, aus diesem Teufelskreis zu entkommen? Um dieses Drawback zu lösen, ist das Konzept eines Nash -Gleichgewichts, das ich in diesem Artikel erklären werde, für die Spieltheorie von grundlegender Bedeutung.

Dieser Artikel ist der zweite Teil einer Vierkapitelserie zur Spieltheorie. Wenn Sie nicht ausgecheckt haben Das erste Kapitel Ich würde Sie jedoch ermutigen, dies zu tun, um sich mit den Hauptbegriffen und Konzepten der Spieltheorie vertraut zu machen. Wenn Sie dies getan haben, sind Sie auf die nächsten Schritte unserer Reise durch die Spieltheorie vorbereitet. Lass uns gehen!

Finden der Lösung

Manchmal kann es schwierig sein, eine Lösung für ein Spiel in der Spieltheorie zu finden. Foto von Mel Poole An Unplash

Wir werden jetzt versuchen, eine Lösung für ein Spiel in der Spieltheorie zu finden. A Lösung ist eine Reihe von Aktionen, bei denen jeder Spieler maximiert ihren Nutzen und verhält sich daher rational. Das bedeutet nicht unbedingt, dass jeder Spieler das Spiel gewinnt, sondern dass er das Beste tun kann, da er nicht weiß, was die anderen Spieler tun werden. Betrachten wir das folgende Spiel:

Wenn Sie mit dieser Matrix-Notation nicht vertraut sind, möchten Sie möglicherweise einen Rückblick auf Kapitel 1 werfen und Ihr Gedächtnis aktualisieren. Erinnern Sie sich, dass diese Matrix Ihnen die Belohnung für jeden Spieler gibt, der ein bestimmtes Aktionenpaar beigetragen hat? Wenn beispielsweise Spieler 1 Motion Y und Spieler 2 auswählen, wird Motion B eine Belohnung von 1 und Spieler 2 eine Belohnung von 3 erhalten.

Okay, welche Aktionen sollten die Spieler für den Second entscheiden? Spieler 1 weiß nicht, was Spieler 2 tun wird, aber sie können trotzdem versuchen, herauszufinden, was die beste Aktion abhängig von der Wahl von Participant 2 ist. Wenn wir die Dienstprogramme von Aktionen y und z (angezeigt durch die blauen und roten Kästchen in der nächsten Abbildung) vergleichen, bemerken wir etwas Interessantes: Wenn Spieler 2 Motion A (erste Spalte der Matrix) wählt, erhält Spieler 1 eine Belohnung von 3, wenn sie Motion Y und eine Belohnung von 2 auswählen, wenn sie Motion Z wählen, additionally ist Motion Y in diesem Fall besser. Aber was passiert, wenn Participant 2 sich für Aktion B (zweite Spalte) entscheidet? In diesem Fall gibt Motion y eine Belohnung von 1 und Motion z eine Belohnung von 0, additionally ist y wieder besser als Z. Und wenn Spieler 2 Motion C (dritte Spalte) wählt, ist y immer noch besser als z (Belohnung von 2 gegen Belohnung von 1). Das bedeutet, dass Spieler 1 niemals Aktion Z verwenden sollte, da die Aktion y immer besser ist.

Wir vergleichen die Belohnungen für Spieler 1 für Aktionen y und z.

Mit den oben genannten Überlegungen kann Participant 2 erwarten, dass Spieler 1 niemals Motion Z verwenden würde und dass Participant 2 sich nicht um die Belohnungen kümmern muss, die zu Motion Z gehören. Dies macht das Spiel viel kleiner, da jetzt nur noch zwei Optionen für Spieler 1 übrig sind, und dies hilft auch bei Spieler 2, sich für ihre Aktion zu entscheiden.

Wir haben herausgefunden, dass für Spieler 1 Y immer besser ist als Z, additionally betrachten wir nicht Z mehr.

Wenn wir uns das abgeschnittene Spiel ansehen, sehen wir, dass Choice B für Spieler 2 immer besser ist als Motion A. Wenn Spieler 1 x auswählt, ist Motion B (mit einer Belohnung von 2) besser als Choice A (mit einer Belohnung von 1), und dies gilt, wenn Spieler 1 Motion Y. Wir haben jedoch bereits gesehen, dass Motion Z sowieso nie von Spieler 1 gespielt werden wird.

Wir vergleichen die Belohnungen für Spieler 2 für Aktionen A und B.

Infolgedessen würde Participant 2 niemals Motion A verwenden. Wenn Spieler 1 nun vorwegnimmt, dass Spieler 2 niemals Motion A verwendet, wird das Spiel wieder kleiner und weniger Optionen müssen berücksichtigt werden.

Wir haben gesehen, dass für Spieler 2 Motion B immer besser als Motion A ist, sodass wir nicht mehr in Betracht ziehen müssen.

Wir können leicht in einer Weise fortfahren und sehen, dass X für Spieler 1 jetzt immer besser ist als Y (2> 1 und 4> 2). Wenn Spieler 1 Motion A wählt, wählt Spieler 2 Motion B, was besser als C (2> 0) ist. Am Ende bleiben nur die Aktion X (für Spieler 1) und B (für Spieler 2) übrig. Das ist die Lösung unseres Spiels:

Am Ende bleibt nur noch eine Choice übrig, nämlich Spieler 1 mit X und Participant 2 mit B.

Für Spieler 1 wäre es rational wissen Was der andere Spieler tun würde. Wir haben nur erwartet, dass einige Aktionen niemals ergriffen würden, weil sie immer schlechter sind als andere Aktionen. Solche Handlungen werden genannt streng dominiert. Zum Beispiel wird Aktion Z streng von Aktion y dominiert, da y immer besser ist als Z.

Die beste Antwort

Scrabble ist eines dieser Spiele, bei denen die Suche nach der besten Antwort ewig dauern kann. Foto von Freysteinn G. Jonsson An Unplash

Solche streng dominierten Handlungen existieren nicht immer, aber es gibt ein ähnliches Konzept, das für uns von Bedeutung ist und als a genannt wird Beste Antwort. Sagen Sie, wir wissen, welche Aktion der andere Spieler wählt. In diesem Fall wird die Entscheidung für eine Aktion sehr einfach: Wir ergreifen nur die Aktion, die die höchste Belohnung hat. Wenn Spieler 1 wusste, dass Participant 2 Choice A auswählte, wäre die beste Antwort für Spieler 1 Y, da Y die höchste Belohnung in dieser Spalte hat. Sehen Sie, wie wir immer nach den besten Antworten gesucht haben? Für jede mögliche Aktion des anderen Spielers haben wir nach der besten Antwort gesucht, wenn der andere Spieler diese Aktion ausgewählt hat. Formell ist die beste Antwort von Spieler I auf eine bestimmte Aktion aller anderen Spieler die Aktion von Spieler 1, die das Dienstprogramm angesichts der Aktionen der anderen Spieler maximiert. Beachten Sie auch, dass eine streng dominierte Aktion niemals eine beste Antwort sein kann.

Kommen wir zu einem Spiel zurück, das wir im ersten Kapitel vorgestellt haben: das Dilemma der Gefangenen. Was sind die besten Antworten hier?

Dilemma der Gefangenen

Wie sollte Participant 1 entscheiden, ob Spieler 2 gesteht oder leugnet? Wenn Spieler 2 gesteht, sollte auch Spieler 1 gestehen, da eine Belohnung von -3 besser ist als eine Belohnung von -6. Und was passiert, wenn Spieler 2 leugnet? In diesem Fall ist das Bekenntnis wieder besser, denn es würde eine Belohnung von 0 geben, was besser ist als eine Belohnung von -1 für das Leugnen. Das heißt, für Spieler 1 ist das Bekenntnis die beste Antwort auf beide Aktionen von Spieler 2. Spieler 1 muss sich überhaupt keine Sorgen um die Aktionen des anderen Spielers machen, sondern sollte immer gestehen. Aufgrund der Symmetrie des Spiels gilt dies auch für Spieler 2. Für sie ist das Bekenntnis auch die beste Antwort, egal was Spieler 1 tut.

Das Nash -Gleichgewicht

Das Nash-Gleichgewicht ähnelt dem Grasp-Schlüssel, der es uns ermöglicht, spieltheoretische Probleme zu lösen. Die Forscher waren sehr glücklich, als sie es fanden. Foto von RC.XYZ NFT Gallery An Unplash

Wenn alle Spieler ihre beste Antwort spielen, haben wir eine Lösung des Spiels erreicht, das genannt wird Nash -Gleichgewicht. Dies ist ein Schlüsselkonzept in der Spieltheorie aufgrund einer wichtigen Eigenschaft: In einem Nash -Gleichgewicht hat kein Spieler einen Grund, ihre Aktion zu ändern. Es sei denn, ein anderer Spieler tut es. Das bedeutet, dass alle Spieler so glücklich sind, wie sie in der Scenario sein können, und sie würden sich nicht ändern, selbst wenn sie könnten. Betrachten Sie das Dilemma des Gefangenen von oben: Das Nash -Gleichgewicht wird erreicht, wenn beide gestehen. In diesem Fall würde kein Spieler seine Aktion ohne den anderen ändern. Sie könnten besser werden, wenn beide änderte ihre Aktion und beschloss zu leugnen, aber da sie nicht kommunizieren können, erwarten sie keine Veränderung des anderen Spielers und ändern sich auch nicht.

Möglicherweise fragen Sie sich, ob für jedes Spiel immer ein einzelnes Nash -Gleichgewicht vorhanden ist. Lassen Sie mich Ihnen sagen, dass es auch mehrere geben kann, wie im Bach vs. Stravinsky -Spiel, in dem wir bereits wissen, in dem wir uns bereits kennengelernt haben Kapitel 1:

Bach gegen Strawinsky

Dieses Spiel hat zwei Nash -Gleichgewichte: (Bach, Bach) und (Strawinsky, Strawinsky). In beiden Szenarien können Sie sich leicht vorstellen, dass es keinen Grund für einen Spieler gibt, seine Aktion isoliert zu ändern. Wenn Sie mit Ihrem Freund im Bach -Konzert sitzen, lassen Sie Ihren Sitz nicht in das Stravinsky -Konzert in Ruhe, selbst wenn Sie Strawinsky gegenüber Bach bevorzugen. Ebenso würde der Bach -Fan nicht vom Stravinsky -Konzert verschwinden, wenn das seinen Freund in Ruhe lassen wollte. In den verbleibenden zwei Szenarien würden Sie jedoch anders denken: Wenn Sie alleine im Stravinsky -Konzert wären, möchten Sie dort raus und mit Ihrem Freund im Bach -Konzert anschließen. Das heißt, Sie würden Ihre Aktion ändern, auch wenn der andere Spieler ihre nicht ändert. Dies sagt Ihnen, dass das Szenario, in dem Sie sich befunden haben nicht Ein Nash -Gleichgewicht.

Es kann jedoch auch Spiele geben, die überhaupt kein Nash -Gleichgewicht haben. Stellen Sie sich vor, Sie sind ein Fußballwächter während eines Elfmeterschusses. Der Einfachheit halber gehen wir davon aus, dass Sie nach hyperlinks oder nach rechts springen können. Der Fußballspieler der gegnerischen Mannschaft kann auch in der linken oder rechten Ecke schießen, und wir gehen davon aus, dass Sie den Ball fangen, wenn Sie sich für die gleiche Ecke entscheiden wie sie und dass Sie ihn nicht fangen, wenn Sie sich für gegnerische Ecken entscheiden. Wir können dieses Spiel wie folgt anzeigen:

Eine Spielmatrix für ein Elfmeterwesen.

Sie werden hier kein Nash -Gleichgewicht finden. Jedes Szenario hat einen klaren Gewinner (Belohnung 1) und einen klaren Verlierer (Belohnung -1), und daher wird einer der Spieler immer ändern wollen. Wenn Sie nach rechts springen und den Ball fangen, möchte Ihr Gegner in die linke Ecke wechseln. Aber dann werden Sie wieder Ihre Entscheidung ändern wollen, wodurch Ihr Gegner wieder die andere Ecke auswählt und so weiter.

Zusammenfassung

Wir haben gelernt, einen Ausgleichspunkt zu finden, an dem sich niemand mehr ändern will. Das ist ein Nash -Gleichgewicht. Foto von Eran Menashri An Unplash

Dieses Kapitel zeigte, wie man Lösungen für Spiele findet, indem das Konzept eines Nash -Gleichgewichts verwendet wird. Fassen wir zusammen, was wir bisher gelernt haben:

  • Eine Lösung eines Spiels in der Spieltheorie maximiert das Dienstprogramm oder die Belohnung jedes Spielers.
  • Eine Aktion heißt streng dominiert Wenn es eine andere Aktion gibt, die immer besser ist. In diesem Fall wäre es irrational, jemals die streng dominierte Aktion zu spielen.
  • Die Maßnahmen, die die höchste Belohnung angesichts der Maßnahmen der anderen Spieler liefert, heißt a Beste Antwort.
  • A Nash -Gleichgewicht ist ein Zustand, in dem jeder Spieler seine beste Antwort spielt.
  • In einem Nash -Gleichgewicht möchte kein Spieler seine Aktion ändern, es sei denn, es ist ein anderes Spiel. In diesem Sinne sind Nash -Gleichgewichte optimale Zustände.
  • Einige Spiele haben mehrere Nash -Gleichgewichte und einige Spiele haben keiner.

Wenn Sie darüber traurig waren, dass es in einigen Spielen kein Nash -Gleichgewicht gibt, verzweifeln Sie nicht! Im nächsten Kapitel werden wir die Wahrscheinlichkeiten von Aktionen einführen, und dies ermöglicht es uns, mehr Gleichgewichte zu finden. Bleiben Sie dran!

Referenzen

Die hier eingeführten Themen werden normalerweise in Standardlehrbüchern zur Spieltheorie behandelt. Ich habe diesen hauptsächlich diesen verwendet, der jedoch auf Deutsch geschrieben ist:

  • Bartholomae, F. & Wiens, M. (2016). Spielheorie. Ein anwendungsorientieres lehrbuch. Wiesbaden: Springer Fachmedien Wiesbaden.

Eine Different in englischer Sprache könnte Folgendes sein:

  • Espinola-Arredondo, A. & Muñoz-Garcia, F. (2023). Spieltheorie: Eine Einführung mit Schritt-für-Schritt-Beispielen. Springer Natur.

Die Spieltheorie ist ein ziemlich junges Forschungsfeld, wobei das erste Hauptlehrbuch dieses ist:

  • Von Neumann, J. & Morgsenstern, O. (1944). Theorie der Spiele und des wirtschaftlichen Verhaltens.

Wie dieser Artikel? Folgen Sie mir über meine zukünftigen Beiträge informiert werden.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert