For faster navigation, this Iframe is preloading the Wikiwand page for ε均衡.

ε均衡

ゲーム理論において ε 均衡 (イプシロンきんこう,epsilon-equilibrium) または近似ナッシュ均衡 (near-Nash equilibrium) とは,ナッシュ均衡の条件を近似的にみたすような戦略プロファイルのことである.

定義

[編集]

ゲームと非負の実数 ε とを所与として,戦略プロファイルが ε 均衡であるとは,どのプレーヤーにとっても,自分の戦略からの単独での逸脱によって,期待利得を ε より大きく改善することができないことをいう.任意のナッシュ均衡は,ε = 0 の場合の ε 均衡に等しい.

形式的に書こう.N 人のプレーヤーがいて,各プレーヤーの行動集合が , 効用関数が u であるようなゲームを とする.戦略の組 G の ε 均衡であるとは,

であるときをいう.

[編集]

ε 均衡の概念は,無限に継続する可能性のある確率ゲームの理論において重要である.ナッシュ均衡が存在しないが,0 より厳密に大きい任意の ε について ε 均衡が存在するような,簡単な確率ゲームの例がある.

おそらくもっとも簡単な例は,エヴェレットにより提案された,次のようなマッチングペニーの変種だろう.プレーヤー 1 はペニー硬貨を隠し,プレーヤー 2 はそれが表か裏かを推測する.プレーヤー 2 が正しく当てたならば,プレーヤー 1 からペニーをもらってゲームが終了する.プレーヤー 2 が,表と推測して外したならば,両プレーヤーの利得を 0 としてゲームが終了する.プレーヤー 2 が裏と推測して外したならば,ゲームは繰りかえす.もしゲームが永久に続くならば,両プレーヤーの利得は 0 になる.

パラメータ ε > 0 を所与として,プレーヤー 2 が,(ゲームのステージによらず,それ以前のステージとも独立に) 表を確率 ε, 裏を確率 1 − ε と推測するような任意の戦略プロファイルは,このゲームの ε 均衡になる.このような戦略プロファイルにおけるプレーヤー 2の 期待利得は少なくとも 1 − ε になる.しかし,ちょうど 1 の期待利得を保証するようなプレーヤー 2 の戦略は存在しないことが簡単にわかる.したがって,このゲームはナッシュ均衡をもたない.

べつの簡単な例として,T 期間の有限回繰りかえし囚人のジレンマを考え,利得は T 期間の平均で与えられるものとしよう.このゲームの唯一のナッシュ均衡は,各期において裏切りを選ぶというものである.ここで,2 つの戦略,しっぺ返し戦略グリムトリガーを考えよう.しっぺ返しもグリムトリガーもこのゲームのナッシュ均衡にならないが,どちらもある正なる ε について ε 均衡になる.ε の許容される値は,ステージゲーム利得と繰りかえしの期間数 T に依存する.

経済学において,純粋戦略 ε 均衡の概念は,混合戦略によるアプローチが現実的でないとみなされるときに使われている.純粋戦略 ε 均衡においては,各プレーヤーは,最適な純粋戦略から ε 以内だけ離れた純粋戦略を選択する.例として,ベルトラン・エッジワースモデル英語版においては,純粋戦略均衡は存在しないが,純粋戦略 ε 均衡は存在しうる.

参考文献

[編集]
  • Dixon, H Approximate Bertrand Equilibrium in a Replicated Industry, Review of Economic Studies, 54 (1987), pages 47-62.
  • H. Everett. "Recursive Games". In H.W. Kuhn and A.W. Tucker, editors. Contributions to the theory of games, vol. III, volume 39 of Annals of Mathematical Studies. Princeton University Press, 1957.
  • Leyton-Brown, Kevin; Shoham, Yoav (2008), Essentials of Game Theory: A Concise, Multidisciplinary Introduction, San Rafael, CA: Morgan & Claypool Publishers, ISBN 978-1-59829-593-1, http://www.gtessentials.org . An 88-page mathematical introduction; see Section 3.7. Free online at many universities.
  • R. Radner. Collusive behavior in non-cooperative epsilon equilibria of oligopolies with long but finite lives, Journal of Economic Theory, 22, 121-157, 1980.
  • Shoham, Yoav; Leyton-Brown, Kevin (2009), Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations, New York: Cambridge University Press, ISBN 978-0-521-89943-7, http://www.masfoundations.org . A comprehensive reference from a computational perspective; see Section 3.4.7. Downloadable free online.
  • S.H. Tijs. Nash equilibria for noncooperative n-person games in normal form, Siam Review, 23, 225-237, 1981.
{{bottomLinkPreText}} {{bottomLinkText}}
ε均衡
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?