مدلهای بنیادی
هوش مصنوعی برتر و خلاقیت
کامپیوتری را تصور کنید که میتواند جمله شما را با یک عبارت بهتر به پایان برساند؛ یا یک تکه آهنگ را برای ساخت موسیقی به گونهای به کار برد که انگار شما آن را ساختهاید در حالیکه شما هرگز چنین کاری انجام نداده بودید؛ یا یک مساله را با خلق صدها سطر کد کامپیوتری حل کند و به شما امکان دهد تا بر روی موضوعی دشوارتر متمرکز شوید. این کامپیوتر صرفاً نواده همان دستگاههای بافندگی و موتورهای بخار است که فرآیند انقلاب صنعتی را سرعت بخشیدند. اما این کامپیوتر به نسل جدیدی از دستگاهها تعلق دارد چون میتواند نشانههای زبانی، موسیقایی و برنامهنویسی را درک کند و آنها را به روشهای خلاقانه به کار گیرد. این کار اندکی شبیه رفتار انسانهاست. مدلهای بنیادی که این کارها را انجام میدهند بیانگر دستاوردی بزرگ در هوش مصنوعی (AI) هستند. آنها نیز وعده یک انقلاب را به ما میدهند. اما این انقلاب بر جایگاه رفیع وظایف مغزی تاثیر میگذارد. جایی که دست انقلاب صنعتی به آن نرسید. نمیتوان با قطعیت گفت که آینده چه چیز در آستین دارد. هوش مصنوعی در گذشته به سختی پیش میرفت اما اکنون زمان آن است که به وعدهها و مخاطرات رویداد بزرگ بعدی در هوش مصنوعی نگاهی بیندازیم. مدلهای بنیادی تازهترین تحول در یادگیری عمیق (DL) هستند. تکنیکی که ده سال قبل به اوج رسید و اکنون حوزه هوش مصنوعی را زیر سلطه خود گرفته است. سامانههای یادگیری عمیق که تا حدی بر مبنای ساختار شبکهای رشتههای عصبی در مغز انسانها ساخته میشوند، با استفاده از میلیونها یا میلیاردها نمونه متن، تصویر یا کلیپ صوتی آموزش میبینند. در سالهای اخیر، هزینههای سرسامآور (از نظر زمان و پول) آموزش سامانههای بزرگ یادگیری عمیق این نگرانی را ایجاد کرد که چنین تکنیکی به انتهای خود رسیده باشد. برخی با نگرانی از «زمستان هوش مصنوعی» صحبت میکردند. اما مدلهای بنیادی نشان میدهند که ساخت سامانههای بزرگتر و پیچیدهتر یادگیری عمیق همچنان پرده از قابلیتهای تاثیرگذارتر بر میدارد. هیچکس نمیداند انتهای آن کجاست. مدلهای حاصل شکل جدیدی از هوش خلاقانه غیرانسانی هستند. سامانهها آنقدر پیچیدگی دارند که میتوانند زبان را درک کنند و قواعد را بشکنند. یک سگ نمیتواند به لطیفه نشریه نیویورکر بخندد اما هوش مصنوعی میتواند توضیح دهد چرا آن لطیفه خندهدار است. امری که گاهی حتی خوانندگان نیویورکر متوجه آن نمیشوند. وقتی ما از یکی از این سامانهها خواستیم تنها با استفاده از عنوان این مقاله یک تصویر برای آن بسازد تصویری را به ما داد که از آن بر روی جلد نسخههای آمریکا و آسیای نشریه اکونومیست هم استفاده کردیم. مدلهای بنیادی ویژگیهای غافلگیرکننده و سودمندی دارند. عجیبترین ویژگی آنها رفتار پیدایشی (emergent) است یعنی مهارتهایی مانند درک یک لطیفه یا تطابق یک موقعیت با یک ضربالمثل که محصول اندازه و عمق این مدلهاست و ربطی به طراحی عامدانه آنها ندارد. درست همانگونه که جابهجایی سریع مجموعهای از تصاویر حس حرکت را به فرد القا میکند، تریلیونها تصمیم محاسباتی دو دویی (binary) چیزی شبیه درک و خلاقیت انسانی به وجود میآورند که بسیار به واقعیت نزدیک است. حتی سازندگان این سامانهها هم از قدرت آنها شگفتزده میشوند. این هوشمندی گسترده و تعدیلپذیر است. درست است که مدلهای بنیادی گاهی کارهای احمقانه میکنند اما این ویژگی در انسانها نیز دیده میشود. به عنوان مثال اگر از سامانه بپرسید چه کسی اولین جایزه نوبل فیزیک را در سال 1625 برد احتمالاً گالیله، بیکن یا کپلر را ذکر میکند بدون آنکه بفهمد اولین جایزه در سال 1901 اعطا شد. اما آنها همچنین قابلیت سازگاری زیادی در مقایسه با نمونههای اولیه هوش مصنوعی دارند شاید به این دلیل که بین قواعد کاربرد نشانهها در رشتههای مختلفی مانند نقاشی، نگارش خلاقانه و برنامهریزی کامپیوتر هم شباهتهایی وجود دارد. این گستردگی بدان معناست که از مدلهای بنیادی میتوان در کاربردهای فراوان از کمک به ساخت داروها با استفاده از پیشبینی چگونگی رفتار پروتئینها در سه بعد گرفته تا انتخاب نمودارهای جالب از میان مجموعه دادهها و تهیه پاسخهایی که خود حوزههای جدید پرسشگری را باز میکنند استفاده کرد. این موضوع هیجانآور است و وعده منافع بزرگی را به ما میدهد که برخی از آنها فعلاً فقط در تصورات میآیند. اما همزمان نگرانیهایی نیز پدید میآیند. بدون تردید مردم از آن میترسند که وقتی سامانههای هوش مصنوعی آنقدر خلاق شوند که سازندگان خود را غافلگیر کنند به موجوداتی شرور تبدیل شوند. اما در حقیقت، مدلهای بنیادی با روباتهای قاتل مورد علاقه هالیوود فاصله زیادی دارند. ترمیناتورهای هالیوود متمرکز بر ماموریت و مصمم هستند و به عواقب گستردهتر اقداماتشان توجه نمیکنند. در مقابل، هوش مصنوعی بنیادی پیشبینیناپذیر است. عامل دیگر نگرانی آن است که این سامانهها برای آموزش برق و انرژی زیادی مصرف میکنند و به تصاعد گازهای گلخانهای دامن میزنند. اما باید همزمان توجه داشت که کارایی این سامانهها روزبهروز بیشتر میشود و ممکن است خود به عاملی حیاتی در توسعه فناوریهایی تبدیل شوند که حرکت به سمت انرژیهای تجدیدپذیر را تسریع میکنند. نگرانی فزاینده دیگر آن است که چه کسی مدلهای بنیادی را کنترل میکند. آموزش یک سامانه واقعاً بزرگ مانند PalM گوگل در هر نوبت بیش از 10 میلیون دلار هزینه دارد و مستلزم دسترسی به انبوهی از دادههاست. هر چه توان رایانش و حجم دادهها بیشتر باشد بهتر است. در این صورت چشمانداز پیشرو آن است که فناوری در دستان تعداد اندکی از دولتها و شرکتهای فناوری متمرکز شود. در این حالت دادهها میتوانند تعصبات و یکسویهنگریها را به شکلی ناخوشایند در جهان تقویت کنند. آیا میتوان به پسر دهسالهای اعتماد کرد که کل احساسش از واقعیت از گردش در فضای اینترنت به دست آمده است؟ آیا ممکن است از سامانههای هوش مصنوعی چینی و آمریکایی برای انحراف اذهان و تحقق یک ایدئولوژی بهره برد؟ چه بلایی بر سر فرهنگهایی میآید که در فضای آنلاین حضور قدرتمندی ندارند؟ همچنین موضوع دسترسی مطرح میشود. در حال حاضر بزرگترین مدلها محدود هستند تا نتوان از آنها برای اهداف شرورانهای مانند خلق اخبار غلط استفاده کرد. بنگاه نوپای Open AI مدلی به نام DALL-E2 را به گونهای طراحی کرد که نتواند تصاویر خشونتبار یا مستهجن تولید کند. بنگاهها حق دارند نگران سوءاستفاده از مدلهایشان باشند اما هر چه این مدلها توانمندتر شوند محدودیت بیشتر دسترسی به آنها باعث میشود یک طبقه جدید از فرادستان شکل گیرد. نمیتوان این مشکل را با خودنظارتی حل کرد. تا سالها اعتقاد بر آن بود که خودکارسازی مبتنی بر هوش مصنوعی تهدیدی برای مشاغل معمولی است و هنرمندان، نویسندگان و برنامهنویسان از این خطر در امان میمانند. مدلهای بنیادی این باور را به چالش کشیدهاند. این هوش ماشینی همانند هوش انسانی نیست اما چیزی کاملاً متفاوت ارائه میدهد. اگر از آن به خوبی استفاده شود میتواند مکملی برای انسان باشد.
منبع: اکونومیست