مروی بر مفاهیم بازیهای تکرارشونده
تکرار مکررات
طیف مطالعاتی نظریه بازی بسیار گسترده است و موضوعات مختلفی از علوم سیاسی، اجتماعی، اقتصادی تا تصمیمات ساده روزمره ما را شامل میشود. اما بهرغم گستردگی این زمینهها، یک اصل کلی در همه آنها مشترک است و آن هم تلاش نظریه بازی برای مدلسازی برهمکنش عوامل درگیر در یک موقعیت است.
طیف مطالعاتی نظریه بازی بسیار گسترده است و موضوعات مختلفی از علوم سیاسی، اجتماعی، اقتصادی تا تصمیمات ساده روزمره ما را شامل میشود. اما بهرغم گستردگی این زمینهها، یک اصل کلی در همه آنها مشترک است و آن هم تلاش نظریه بازی برای مدلسازی برهمکنش عوامل درگیر در یک موقعیت است. به این عوامل درگیر در اصطلاح بازیکن و به موقعیتی که میبایست تصمیمگیری درباره آن صورت گیرد، بازی گفته میشود. مبنای اصلی این تصمیمگیریها، پیامد حاصل از انتخاب هر تصمیم (راهبرد) است که بر مبنای رفتار عقلایی اتخاذ میشود. بر اساس نوع انتخاب راهبردها و نیز میزان اطلاعاتی که بازیکنان در یک بازی از آن بهره میبرند، نظریه بازی، گونههای مختلفی از بازی مانند همکارانه، غیرهمکارانه، اطلاعات کامل و ناقص و... را به ما معرفی میکند. اما گونه دیگری از بازی که در این نوشتار قصد معرفی آن را داریم، بازیهای تکرارشونده هستند. این بازیها در اصل گونهای تعمیمیافته از بازیهای تکمرحلهای هستند که در واقع از تکرار یک بازی اولیه تشکیل شدهاند. در ضمن، بازی اولیه هم معمولاً یک رقابت دونفره است. نکته اصلی در این بازی آن است که یک بازیکن در حین بازی
میبایست تاثیر عملکرد فعلی خود را بر عملکرد آتی دیگر بازیکنان در نظر بگیرد. علاوه بر این شناخت یا میزان اطلاعات یک بازیکن، از عملکرد قبلی بازیکن مقابل، میتواند بر تصمیمگیری او اثر بگذارد. به این سابقه و تصویر ذهنی از یک بازیکن، اصطلاحاً شهرت او گفته میشود.
در حالت کلی این نوع بازیها را میتوان بر اساس تعداد تکرارها، به دو صورت بازیهای متناهی (محدود یا با افق زمانی معین) و نامتناهی (نامحدود یا با افق زمانی نامعین) در نظر گرفت که نتیجه نهایی در هر حالت متفاوت خواهد بود. حتی در برخی موارد، ممکن است یک بازی تکراری محدود، لزوماً تعداد تکرار مشخصی نداشته باشد و بازیکن فقط احتمالی از چرخه تکرار عمل بازیکن دیگر را منظور کند. برای مثال، این واقعیت که هر فرد میزان عمر مشخصی دارد، بدین معنی نیست که تمام بازیهایی که میتواند اجرا کند هم میبایست افق زمانی معین داشته باشد. علاوه براین، بازیکنان، بسته به طولانیتر یا کوتاهتر بودن افق زمانی (در بازیهای با افق زمانی معین) ممکن است رفتارهای متفاوتی از خود نشان دهند. در نظریه بازی، این تفاوتها را با تعریف یک تابع زمان که با مقادیر پیامدهای بازی در ارتباط است، لحاظ میکنند. البته راهبردهای مختلفی که برای هرکدام از این دو گونه بازی تکرارشونده ارائه شده است، بسیار گسترده و متنوع، و همیشه برای نظریهپردازان این شاخه محل بحث بوده است.
بازیهای تکرارشونده با افق زمانی نامعین
بیشتر بازیهای مورد مطالعه در شاخه بازیهای تکرارشونده، آنهایی هستند که میتوانند به صورت بالقوه به دفعات نامحدود تکرار شوند. در بسیاری موارد، مشاهده شده است که روش بهینه برای انجام اینگونه بازیها، یک راهبرد مکرر از تعادل نش نیست، بلکه بهتر است با همکاری با دیگر بازیکنان، از یک راهبرد بهینه اجتماعی بهره ببریم. از این مفهوم با عنوان «هنجار اجتماعی» یاد میشود و یکی از بخشهای مهم و اساسی در بازیهای تکرارشونده نامحدود، در واقع جریمه کردن بازیکنانی است که از این راهبرد همکارانه فاصله میگیرند و به تعادل نش روی میآورند. این جریمه میتواند چیزی مانند انجام بازی با راهبردی باشد که به کاهش منافع حاصل برای دو بازیکن در ادامه بازی بینجامد که به آن راهبرد دست به ماشه هم گفته میشود. اکثر نتایج در قضایای مختلفی که برای این دسته از بازیها مطرح شدهاند، به نحوه دستیابی به یک تعادل بهینه اجتماعی و حفظ آن میپردازند. این نتایج به صورت کلی «قضایای فولک» نامیده میشوند. همانطور که گفته شد یکی از اهداف اصلی نظریه بازی، مدلسازی رفتار انسانها در مواجهه با
شرایط مختلف است. این هدف در مورد بازیهای تکرارشونده نیز صدق میکند بدینصورت که یکی از ویژگیهای مهم اینگونه بازیها، روشهایی است که سعی در مدلسازی ترجیحات بازیکنان در طول انجام بازی دارد. البته طرح این روشها، به دلیل پیچیدگیهای محاسباتی از حوصله این نوشتار خارج است. اما بهطور کلی این روشها با استفاده از ارزش زمان در نظر بازیکنان، و میزان پیامد دریافتی از سوی هر بازیکن در هر مرحله از بازی، سعی در آشکارسازی این ترجیحات دارند.
بازیهای تکرارشونده با افق زمانی معین
بازیهای تکرارشونده را میتوان در دو گروه دستهبندی کرد. دسته اول، بازیهایی هستند که دوره زمانی در آنها ثابت و از پیش تعیین شده است و دو بازیکن هم از آن مطلع هستند. در این نوع بازیها، راهبرد بهینه، بازی کردن راهبرد نش در آخرین دوره زمانی است. اما زمانی که پیامد حاصل از تعادل نش برابر است با پیامدی که از روش کمینه بیشینهها به دست میآید (در این روش در بین راهبردهایی که بیشترین پیامد را به دنبال دارند، کمترینشان را انتخاب میکنیم) بازیکن، دیگر دلیلی برای انجام راهبرد بهینه اجتماعی ندارد، و میتواند یک راهبرد خودخواهانه را در پیش گیرد، چرا که جریمهای که پیشتر از آن صحبت کردیم، در این حالت او را تحت تاثیر قرار نخواهد داد و این همان حالتی است که تحت عنوان دسته دوم بازیهای تکرارشونده با افق زمانی معین مطرح میشوند. این انحراف از راهبرد بهینه اجتماعی به سمت راهبرد خودخواهانه، به وسیله تناقض فروشگاه زنجیرهای توضیح داده میشود.
دو مثال معروف
در اینجا برای درک بهتر مفهوم بازیهای تکرارشونده از دو مثال معروف کمک میگیریم. تناقض فروشگاه زنجیرهای، نوعی بازی است که در آن یک انحصارگر، فروشگاه زنجیرهای با شعب مختلف در 20 شهر دارد بنابراین با 20 حریف بالقوه روبهرو خواهد بود. براین اساس او در هر شهر باید تصمیم بگیرد که به کار خود ادامه دهد یا مغازهاش را تعطیل کند. تصمیم او به راهبرد انتخابشده از سوی دیگران نیز بستگی خواهد داشت. نکتهای که این بازی را به نوعی تناقض تبدیل میکند، وقتی است که با در نظر گرفتن منافع عایدشده در هر حالت، اگر انحصارگر تصمیم بهینه اجتماعی را اتخاذ کند، پیامد کمتری نسبت به حالت راهبرد فردی خواهد داشت. بنابراین تصمیم فردی را انتخاب خواهد کرد.
یکی از مثالهای معروفی که راهبرد بهینه در آن، تعادل نش نیست، بازی تکرارشونده معمای زندانی است. اگرچه میدانیم بازی معمای زندانی، تنها یک تعادل نش دارد (اعتراف کردن دو بازیکن به جرم) اما در صورتی که بازیکنان به منافع آتی حاصل از بازی علاقهمند باشند، این بازی میتواند حالتی همکارانه و تکرارشونده به خود بگیرد. البته راهبرد دست به ماشه در قالب تعادلهای نش مربوط به بازی معمای زندانی تکرارشونده مطرح میشود اما در حالتی که پیامد حاصل از راهبرد کمینه بیشینهها برابر با پیامد حاصل از تعادل نش باشد، بازی معمای زندانی، یکمرحلهای خواهد بود. این بدین معنی است که بازیکنی که از افق زمانی و تعداد دفعات بازی مطلع است، میتواند بدون ترس از جریمه و زندانی شدن، به جرم خود اعتراف کند.
علاوه بر آنچه تا بدین جا مطرح شد، میتوان بازیهای تکرارشونده را در دسته بازیهای با اطلاعات ناقص نیز جای داد. یعنی حالتی را متصور شد که بازیکنان در یک بازی تکرارشونده از اطلاعات مشابهی برخوردار نیستند و اطلاعات یکی بیشتر یا کمتر از دیگری است یا حالتی که اطلاعاتی که دو بازیکن دریافت میکنند، مستقل از یکدیگر است و ارتباطی با هم ندارد. در نهایت شاید بتوان گفت، بازیهای تکرارشونده، نزدیکترین حالت به تعاملات روزمره ما در دنیای واقعی است یعنی جایی که یک برخورد و تصمیمگیری تنها یک بار اتفاق نمیافتد بلکه ما بارها و بارها در طی زمان، میبایست راهبرد مناسب خود را انتخاب کنیم و بیشک در این انتخاب سابقهای که از طرف مقابل در ذهن داریم یعنی همان شهرت او، تاثیرگذار خواهد بود.
دیدگاه تان را بنویسید