شناسه خبر : 11153 لینک کوتاه
تاریخ انتشار:

مروی بر مفاهیم بازی‌های تکرارشونده

تکرار مکررات

طیف مطالعاتی نظریه بازی بسیار گسترده است و موضوعات مختلفی از علوم سیاسی، اجتماعی، اقتصادی تا تصمیمات ساده روزمره ما را شامل می‌شود. اما به‌رغم گستردگی این زمینه‌ها، یک اصل کلی در همه آنها مشترک است و آن ‌هم تلاش نظریه بازی برای مدل‌سازی برهمکنش عوامل درگیر در یک موقعیت است.

سیدمحمدامین طباطبایی

طیف مطالعاتی نظریه بازی بسیار گسترده است و موضوعات مختلفی از علوم سیاسی، اجتماعی، اقتصادی تا تصمیمات ساده روزمره ما را شامل می‌شود. اما به‌رغم گستردگی این زمینه‌ها، یک اصل کلی در همه آنها مشترک است و آن ‌هم تلاش نظریه بازی برای مدل‌سازی برهمکنش عوامل درگیر در یک موقعیت است. به این عوامل درگیر در اصطلاح بازیکن و به موقعیتی که می‌بایست تصمیم‌گیری درباره آن صورت گیرد، بازی گفته می‌شود. مبنای اصلی این تصمیم‌گیری‌ها، پیامد حاصل از انتخاب هر تصمیم (راهبرد) است که بر مبنای رفتار عقلایی اتخاذ می‌شود. بر اساس نوع انتخاب راهبردها و نیز میزان اطلاعاتی که بازیکنان در یک بازی از آن بهره می‌برند، نظریه بازی، گونه‌های مختلفی از بازی مانند همکارانه، غیرهمکارانه، اطلاعات کامل و ناقص و... را به ما معرفی می‌کند. اما گونه دیگری از بازی که در این نوشتار قصد معرفی آن را داریم، بازی‌های تکرارشونده هستند. این بازی‌ها در اصل گونه‌ای تعمیم‌یافته از بازی‌های تک‌مرحله‌ای هستند که در واقع از تکرار یک بازی اولیه تشکیل‌ شده‌اند. در ضمن، بازی اولیه هم معمولاً یک رقابت دونفره است. نکته اصلی در این بازی آن است که یک بازیکن در حین بازی می‌بایست تاثیر عملکرد فعلی خود را بر عملکرد آتی دیگر بازیکنان در نظر بگیرد. علاوه بر این شناخت یا میزان اطلاعات یک بازیکن، از عملکرد قبلی بازیکن مقابل، می‌تواند بر تصمیم‌گیری او اثر بگذارد. به این سابقه و تصویر ذهنی از یک بازیکن، اصطلاحاً شهرت او گفته می‌شود.
در حالت کلی این نوع بازی‌ها را می‌توان بر اساس تعداد تکرارها، به دو صورت بازی‌های متناهی (محدود یا با افق زمانی معین) و نامتناهی (نامحدود یا با افق زمانی نامعین) در نظر گرفت که نتیجه نهایی در هر حالت متفاوت خواهد بود. حتی در برخی موارد، ممکن است یک بازی تکراری محدود، لزوماً تعداد تکرار مشخصی نداشته باشد و بازیکن فقط احتمالی از چرخه تکرار عمل بازیکن دیگر را منظور کند. برای مثال، این واقعیت که هر فرد میزان عمر مشخصی دارد، بدین معنی نیست که تمام بازی‌هایی که می‌تواند اجرا کند هم می‌بایست افق زمانی معین داشته باشد. علاوه براین، بازیکنان، بسته به طولانی‌تر یا کوتاه‌تر بودن افق زمانی (در بازی‌های با افق زمانی معین) ممکن است رفتارهای متفاوتی از خود نشان دهند. در نظریه بازی، این تفاوت‌ها را با تعریف یک تابع زمان که با مقادیر پیامدهای بازی در ارتباط است، لحاظ می‌کنند. البته راهبردهای مختلفی که برای هرکدام از این دو گونه بازی تکرارشونده ارائه شده است، بسیار گسترده و متنوع، و همیشه برای نظریه‌پردازان این شاخه محل بحث بوده است.

بازی‌های تکرارشونده با افق زمانی نامعین
بیشتر بازی‌های مورد مطالعه در شاخه بازی‌های تکرارشونده، آنهایی هستند که می‌توانند به صورت بالقوه به دفعات نامحدود تکرار شوند. در بسیاری موارد، مشاهده شده است که روش بهینه برای انجام این‌گونه بازی‌ها، یک راهبرد مکرر از تعادل نش نیست، بلکه بهتر است با همکاری با دیگر بازیکنان، از یک راهبرد بهینه اجتماعی بهره ببریم. از این مفهوم با عنوان «هنجار اجتماعی» یاد می‌شود و یکی از بخش‌های مهم و اساسی در بازی‌های تکرارشونده نامحدود، در واقع جریمه کردن بازیکنانی است که از این راهبرد همکارانه فاصله می‌گیرند و به تعادل نش روی می‌آورند. این جریمه می‌تواند چیزی مانند انجام بازی با راهبردی باشد که به کاهش منافع حاصل برای دو بازیکن در ادامه بازی بینجامد که به آن راهبرد دست به ماشه هم گفته می‌شود. اکثر نتایج در قضایای مختلفی که برای این دسته از بازی‌ها مطرح شده‌اند، به نحوه دستیابی به یک تعادل بهینه اجتماعی و حفظ آن می‌پردازند. این نتایج به صورت کلی «قضایای فولک» نامیده می‌شوند. همان‌طور که گفته شد یکی از اهداف اصلی نظریه بازی، مدل‌سازی رفتار انسان‌ها در مواجهه با شرایط مختلف است. این هدف در مورد بازی‌های تکرارشونده نیز صدق می‌کند بدین‌صورت که یکی از ویژگی‌های مهم این‌گونه بازی‌ها، روش‌هایی است که سعی در مدل‌سازی ترجیحات بازیکنان در طول انجام بازی دارد. البته طرح این روش‌ها، به دلیل پیچیدگی‌های محاسباتی از حوصله این نوشتار خارج است. اما به‌طور کلی این روش‌ها با استفاده از ارزش زمان در نظر بازیکنان، و میزان پیامد دریافتی از سوی هر بازیکن در هر مرحله از بازی، سعی در آشکارسازی این ترجیحات دارند.

بازی‌های تکرارشونده با افق زمانی معین
بازی‌های تکرارشونده را می‌توان در دو گروه دسته‌بندی کرد. دسته اول، بازی‌هایی هستند که دوره زمانی در آنها ثابت و از پیش تعیین شده است و دو بازیکن هم از آن مطلع هستند. در این نوع بازی‌ها، راهبرد بهینه، بازی کردن راهبرد نش در آخرین دوره زمانی است. اما زمانی که پیامد حاصل از تعادل نش برابر است با پیامدی که از روش کمینه بیشینه‌ها به دست می‌آید (در این روش در بین راهبردهایی که بیشترین پیامد را به دنبال دارند، کمترین‌شان را انتخاب می‌کنیم) بازیکن، دیگر دلیلی برای انجام راهبرد بهینه اجتماعی ندارد، و می‌تواند یک راهبرد خودخواهانه را در پیش گیرد، چرا که جریمه‌ای که پیشتر از آن صحبت کردیم، در این حالت او را تحت تاثیر قرار نخواهد داد و این همان حالتی است که تحت عنوان دسته دوم بازی‌های تکرارشونده با افق زمانی معین مطرح می‌شوند. این انحراف از راهبرد بهینه اجتماعی به سمت راهبرد خودخواهانه، به وسیله تناقض فروشگاه زنجیره‌ای توضیح داده می‌شود.

دو مثال معروف
در اینجا برای درک بهتر مفهوم بازی‌های تکرارشونده از دو مثال معروف کمک می‌گیریم. تناقض فروشگاه زنجیره‌ای، نوعی بازی است که در آن یک انحصارگر، فروشگاه زنجیره‌ای با شعب مختلف در 20 شهر دارد بنابراین با 20 حریف بالقوه روبه‌رو خواهد بود. براین اساس او در هر شهر باید تصمیم بگیرد که به کار خود ادامه دهد یا مغازه‌اش را تعطیل کند. تصمیم او به راهبرد انتخاب‌شده از سوی دیگران نیز بستگی خواهد داشت. نکته‌ای که این بازی را به‌ نوعی تناقض تبدیل می‌کند، وقتی است که با در نظر گرفتن منافع عاید‌شده در هر حالت، اگر انحصارگر تصمیم بهینه اجتماعی را اتخاذ کند، پیامد کمتری نسبت به حالت راهبرد فردی خواهد داشت. بنابراین تصمیم فردی را انتخاب خواهد کرد.
یکی از مثال‌های معروفی که راهبرد بهینه در آن، تعادل نش نیست، بازی تکرارشونده معمای زندانی است. اگرچه می‌دانیم بازی معمای زندانی، تنها یک تعادل نش دارد (اعتراف کردن دو بازیکن به جرم) اما در صورتی که بازیکنان به منافع آتی حاصل از بازی علاقه‌مند باشند، این بازی می‌تواند حالتی همکارانه و تکرارشونده به خود بگیرد. البته راهبرد دست به ماشه در قالب تعادل‌های نش مربوط به بازی معمای زندانی تکرارشونده مطرح می‌شود اما در حالتی که پیامد حاصل از راهبرد کمینه بیشینه‌ها برابر با پیامد حاصل از تعادل نش باشد، بازی معمای زندانی، یک‌مرحله‌ای خواهد بود. این بدین معنی است که بازیکنی که از افق زمانی و تعداد دفعات بازی مطلع است، می‌تواند بدون ترس از جریمه و زندانی شدن، به جرم خود اعتراف کند.



علاوه بر آنچه تا بدین جا مطرح شد، می‌توان بازی‌های تکرارشونده را در دسته بازی‌های با اطلاعات ناقص نیز جای داد. یعنی حالتی را متصور شد که بازیکنان در یک بازی تکرارشونده از اطلاعات مشابهی برخوردار نیستند و اطلاعات یکی بیشتر یا کمتر از دیگری است یا حالتی که اطلاعاتی که دو بازیکن دریافت می‌کنند، مستقل از یکدیگر است و ارتباطی با هم ندارد. در نهایت شاید بتوان گفت، بازی‌های تکرارشونده، نزدیک‌ترین حالت به تعاملات روزمره ما در دنیای واقعی است یعنی جایی که یک برخورد و تصمیم‌گیری تنها یک ‌بار اتفاق نمی‌افتد بلکه ما بارها و بارها در طی زمان، می‌بایست راهبرد مناسب خود را انتخاب کنیم و بی‌شک در این انتخاب سابقه‌ای که از طرف مقابل در ذهن داریم یعنی همان شهرت او، تاثیرگذار خواهد بود.

دراین پرونده بخوانید ...

دیدگاه تان را بنویسید