ماشینها چه میفهمند؟
تلاش برای فهم مرز میان یادگیری انسان و یادگیری ماشین در عصر پیشرفت شتابناک هوش مصنوعی
حدود چهار سال پیش، در پژوهشگاه دانشهای بنیادین (IPM)، بحث جالبی با یکی از دوستان در باب سرشت یادگیری ماشین1 داشتم. تا جایی که به خاطر دارم، من مدعی بودم که به کار بردن عبارتهایی مانند یادگیری ماشین یا یادگیری ژرف2 به منظور توصیف چگونگی حل یک مسئله توسط رایانهها از راه صواب به دور است؛ چراکه یادگیری ماشین با یادگیری ما از جنسی اساسا متفاوت است.
عطا کالیراد*: حدود چهار سال پیش، در پژوهشگاه دانشهای بنیادین (IPM)، بحث جالبی با یکی از دوستان در باب سرشت یادگیری ماشین1 داشتم. تا جایی که به خاطر دارم، من مدعی بودم که به کار بردن عبارتهایی مانند یادگیری ماشین یا یادگیری ژرف2 به منظور توصیف چگونگی حل یک مسئله توسط رایانهها از راه صواب به دور است؛ چراکه یادگیری ماشین با یادگیری ما از جنسی اساسا متفاوت است. براساس آنچه از این بحث به یاد میآورم، ظاهرا استدلالهایم قانعکننده بود، البته حافظه در یادآوری آنچه انجام دادیم چندان وفادارانه عمل نمیکند و شاید استدلالهایم چندان هم مجابکننده نبودند. باوجوداین به نظرم اندکی غور در باب این موضوع بحث من و دوستم مفید باشد؛ چراکه یادگیری ماشین به بخش جداییناپذیر از زندگی ما بدل شده و از مسائل روزمره مانند ترجمه متنی انگلیسی با مترجم گوگل گرفته تا موضوعات علمی مانند پیشپینی ساختار پروتئینها را به صورتی نوین حل میکند. برای فهم ویژگی یادگیری ماشین، باید نخست به روشهای سنتی آموزش به رایانه پرداخت. یکی از مسائلی که مدتهاست توجه متخصصان علوم رایانه را به خود مشغول کرده، آموزش بازیهای انسانی به رایانه بوده است. بررسی چگونگی آموزش یکی از این بازیها به رایانه در طی دهههای اخیر، سرشت یادگیری ماشین را تا حد زیادی برای ما روشن خواهد کرد.
چگونه به رایانه شطرنج بیاموزیم؟
آموزش شطرنج به ماشین قدمتی بیش از درازنای تاریخچه رایانه دارد. یکی از نمونههای مشهور ماشین شطرنجباز در سال ۱۷۷۰ میلادی از سوی «ولفگانگ فون کِمپِلِن»3 رونمایی شد. این ماشین میزی بود که رویش مهره شطرنج بر روی صفحه بازی آرمیده بودند و آدمکی، که لباس عثمانی بر تن داشت، این قطعات را جابهجا میکرد. افراد بسیار مشهوری، ازجمله «ناپلئون بناپارت» و «بنجامین فرانکلین» با این تُرکِ مکانیکی4 بازی کردند و او را حریفی قدرتمند یافتند. همانند بسیاری از عجایب آن دوران، ترک مکانیکی حقهای بیش نبود: فردی نحیف، که شطرنجبازی ماهر نیز بود، در درون این دستگاه پنهان میشد. البته بسیاری در همان عصر نیز حدس میزدند که دستگاهی مکانیکی با قابلیت بازی شطرنج وجود ندارد؛ «ادگار آلن پو»، در «شطرنجباز مالزِل»5 (۱۹۳۶) حدس زد که فردی در دل ماشین پنهان است. بازی شطرنج نیازمند درک حرکت رقیب و برگزیدن حرکتی مناسب در پاسخ برای بردن بازی است. شطرنج به ظاهر نیازمند خلاقیتی است که تنها در انسان یافت میشود. با ابداع رایانه در میانه قرن بیستم میلادی و علاقه به حل مسائل پیچیده توسط رایانه، برای ساخت ماشین توانا به شطرنجبازی آرامآرام دیگر نیازی به حقههایی مانند ترک مکانیکی نبود. لااقل سدی نظری در برابر آموزش شطرنج به رایانه وجود نداشت و تنها باید قواعد شطرنج را به رایانه آموزش میداد. آموزش قواعد بازی به رایانه، یعنی انتقال تمام اطلاعات موجود در دایرهالمعارفهای شطرنج، یعنی فهرست عریض و طویل از حرکات، استراتژیهای آغاز، میانه و پایان بازی، به حافظه رایانه. رایانه باید براساس این اطلاعات، در پاسخ به حرکت رقیب، حرکات ممکن را بیابد و سودمندی هریک از حرکات را محاسبه کند. گرچه از جنبه نظری، رایانه شطرنجباز را میتوان به آسانی ساخت، در عمل چنین کاری دشوارتر از اینها از آب درآمد و تنها در دهه ۱۹۸۰ میلادی بود که رایانههای شطرنجباز میتوانستند شطرنجبازان متوسط و خوب را شکست دهند. با چنین پیشرفتهایی، هدف شکست بهترین شطرنجباز در میان گونه انسان بود. درنهایت، مسابقه سرنوشتساز در ۱۹۹۷ میلادی میان «گری کاسپاروف»، قهرمان بلامنازع آن سالها و رایانه شطرنجباز شرکت IBM، با نام «آبی پررنگ»6 در شهر نیویورک برگزار شد. گرچه «کاسپاروف» بازی نخست را برد؛ اما اتفاقی غریب از نظر «کاسپاروف» در حین بازی رخ داد: در اواخر بازی «آبی پررنگ» رخ خود را بدون هیچ دلیل واضحی از d5، میانه صفحه، به d1 جابهجا کرد. «کاسپاروف» پس از این حرکت بیمعنا نوعی خلاقیت هولناک میدید؛ اما درواقع این حرکت صرفا حاصل انتخاب حرکت تصادفی توسط «آبی پررنگ» بود؛ چراکه حرکت بهتری نمییافت. در ادامه سلسلهبازیهای این مسابقه، «کاسپاروف» بازی دوم را واگذار کرد، بازی سوم، چهارم و پنجم نیز به تساوی انجامید. نتیجه بازی سرنوشتساز ششم، پس از تنها 12 حرکت هویدا بود. «کاسپاروف» پس از این حرکت، با مادرش که در میانه حضار بود به روسی صبحت کرد و درنهایت شکست را پذیرفت و سراسیمه از محل برگزاری خارج شد. گرچه «آبی پررنگ»، «کاسپاروف» را شکست داد؛ اما آیا «آبی پررنگ» حقیقتا شطرنج را در معنای انسانی آن فراگرفته بود؟ به نظرم پاسخ منفی است. «آبی پررنگ» تنها آنچه را میدانست که در حافظهاش وارد شده بود و در هر لحظه، حرکتی را که بهترین بود، برمیگزید؛ اما اشتباهش در بازی اول، حرکت بیدلیل رخ، تنها به سبب وجود نقص در برنامه او بود و نه نشانهای از خلاقیت. وقتی ما چیزی را یاد میگیریم، تنها اطلاعات مربوط به موضوع مدنظر را در حافظه خود الصاق نمیکنیم؛ بلکه یادگیری برای ما حاصل کنش و واکنش است. سلسلهای از آزمون و خطا که درنهایت به فراگیری روش صحیح حل مسئله میانجامد. «آبی پررنگ» از بازی نخست با «کاسپاروف» تا بازی ششم همان شطرنجبازی بود که بود؛ اما روش «کاسپاروف» در بازی ششم از بازی نخست متفاوت بود. روش یادگیری «آبی پررنگ» همانقدر از یادگیری انسانی متفاوت است که نقاشی رنگ و روغن از عکسی که دوربین عکاسی میگیرد.
شطرنجبازی که هرگز نمیبازد
چه میشد اگر «آبی پررنگ» از اشتباهاتش درس میگرفت و هر بار که بازی میکرد، بهتر میشد؟ در فیلم «بازیهای جنگی»7، محصول ۱۹۸۳ میلادی، «نوراد»8 از ابررایانهای برای کنترل موشکهای هستهای خود بهره میبرد و این رایانه برای یافتن بهترین استراتژی در صورت بروز جنگ هستهای میان ایالات متحده و شوروی، به شبیهسازی سناریوهای مختلف جنگ جهانی سوم میپردازد و از اشتباهات خود در هر سناریو درس میگیرد و هر بار موفقتر از مرتبه پیشین میشود (البته در پایان فیلم، پس از کشوقوس فراوان، ابررایانه به سازنده خود اعلام میکند: «بهترین استراتژی بازینکردن است»). چه میشد اگر رایانه شطرنجباز ما نیز همانند ابررایانه خیالی فیلم بازیهای جنگی، با خود بازی میکرد و به سبب این بازیهای پیاپی، شطرنج را فرامیگرفت. در سال ۲۰۱۷ میلادی، شرکت ذهن ژرف9، از شرکتهای زیرمجموعه گوگل، تلاش کرد تا به شیوه فوق به رایانه شطرنج بیاموزد. نرمافزار ذهن ژرف، با نام «آلفازیرو»10، صرفا قواعد پایه حرکت مهرههای شطرنج را میدانست و به الگوریتم عمومی برای یادگیری بر مبنای آزمون و خطا مسلح بود. پس از چهل و چهار میلیون بار بازی شطرنج در مقابل خودش، «آلفازیرو» بدون دخالت انسان همه استراتژیهای آغاز بازی شطرنج را کشف کرد. پس از یادگیری شطرنج به این شیوه، مهندسان گوگل «آلفازیرو» را در برابر بهترین نرمافزار سنتی بازی شطرنج آزمودند. در طی صد بازی، «آلفازیرو» بیستوهشت بازی را برد، هفتادودو بازی مساوی شد؛ «آلفازیرو» هرگز نباخت. «آلفازیرو» عملا به قویترین شطرنجباز جهان شناختهشده بدل شد. «آلفازیرو» برای یادگیری شطرنج، با دانستن قواعد حرکت مهرههای نخست با خود بازی میکند. در ابتدا حرکات «آلفازیرو» تصادفی هستند؛ چراکه او هنوز نمیداند چگونه باید بازی را برد؛ اما پس از آزمون و خطا در طی این بازیها، راههای پیروزی را میآموزد (در زبان فنی، به این نوع الگوریتم، یادگیری تقویتی11 میگویند). تفاوت این نوع یادگیری با روشهای سنتی بازی شطرنج در تعداد حرکاتی است که «آلفازیرو» برای هر بار حرکت یک مهره در طی بازی بررسی میکند. یک استاد بزرگ شطرنج به طور متوسط در هر حرکت، صد حرکت ممکن را در نظر میگیرد؛ رایانههای سنتی شطرنجباز، برای هر حرکت حدود ده میلیون حرکت را بررسی میکنند؛ اما «آلفازیرو» تنها ده هزار حرکت را به ازای هر حرکت بررسی میکند. گرچه ده هزار حرکت همچنان از صد حرکتی که یک استاد بزرگ بررسی میکند، بیشتر است؛ اما با روشهای سنتی یافتن حرکت بعدی در شطرنج قابل مقایسه نیست. مسئلهای که «آلفازیرو» را جذاب میکند، سرشت استراتژیها و روش بازی اوست؛ برخلاف رایانههای شطرنجباز پیشین، «آلفازیرو» روش خودش را کشف کرده، روشی که «گری کاسپاروف» آن را بسیار پویا و مشابه رویکرد خودش به شطرنج یافت. البته «آلفازیرو» چنان شطرنجباز قهاری است که هیچ استاد بزرگی، چه از جنس کربن و چه سیلیکون، توانایی شکست او را ندارد. ازاینرو «آلفازیرو» خود به معلم شطرنج بدل شده است! قهرمان بلامنازع فعلی شطرنج جهان، «ماگنوس کارلسِن»12، بهبود مهارت خود در بازی شطرنج در سالهای اخیر را به مطالعه بازیهای «آلفازیرو» نسبت داده است. گویی «آلفازیرو» بازی ساخته دست انسان را به تملک خود درآورده است!
اتاق چینی
تصور کنید در شرکتی مشغول به کار هستید و وظیفه شما این است که هر روز در اتاق کار خود قرار بگیرید و در انتظار نامههایی به زبان چینی باشید که از زیر در اتاق به دست شما میرسند. پس از دریافت این نامهها، به سراغ کتاب عریض و طویلی میروید که به شما توضیح میدهد چه ترکیبی از الفبای چینی را باید در پاسخ به سلسله الفبای موجود در این نامهها بر کاغذ بنگارید. نکته مهم این است که دستورالعمل پاسخ صرفا بر مبنای شکل و ترتیب الفبای چینی در این نامههاست و شما بههیچوجه از معنای این نامهها و پاسخ خود باخبر نیستید. آیا پس از چند سال فعالیت در این شرکت، از زبان چینی سر درمیآورید؟ این مثال نسخهای است از آزمایش ذهنی اتاق چینی13 فیلسوف شهیر، «جان سرل»14. هدف «جان سرل» از صورتبندی این آزمایش ذهنی، نشاندادن ناممکنبودن فهم در هوش مصنوعی است: یک برنامه رایانهای، هر چقدر هم که پیشرفته باشد، صرفا الگوها را شناسایی میکند و به هم ربط میدهد؛ اما همانقدر از ماهیت این الگوها باخبر است که کارمند ما در اتاق چینی از زبان چینی سر درمیآورد. آیا میتوان استدلال اتاق چینی را در باب یادگیری ماشین نیز به کار برد؟ در بحثی که در ابتدای این یادداشت به آن اشاره شد، استدلال من در برابر دوستم این بود که به کار بردن صفاتی مانند «یادگیری» برای آنچه ماشین انجام میدهد، مانند الگوریتم یادگیری تقویتی «آلفازیرو»، نامناسب است؛ چراکه این یادگیری هیچ سنخیتی با یادگیری انسان ندارد؛ اما اکنون پس از چند سال سروکله زدن با الگوریتمهای یادگیری ماشینی و موفقیت این الگوریتمها نهتنها در بازیهایی مانند شطرنج، بلکه در پیشبینی ساختار پروتئینها، به نظرم میرسد که شاید توصیف این روشها بهعنوان نوعی «یادگیری» چندان هم بیراه نباشد. البته این نوع یادگیری ضرورتا همانند یادگیری انسان نیست؛ اما شاید در بسیاری از جنبهها یادگیری ما نیز دستکمی از یادگیری ماشین نداشته باشد. بهعنوان مثال، یادگیری زبان در کودکان را در نظر بگیرید: کودکان در برخورد با دیگر کودکان و بزرگسالان کلمات را تقلید میکنند و واکنش دیگران به این تقلیدها به مرور زمان به اصلاح تلفظ کلمهها و شبیهترشدن آنها به تلفظ مورد قبول منجر میشود. چنین یادگیریای، لااقل در سطح، شباهتهای زیادی به یادگیری تقویتی «آلفازیرو» دارد. آنچه ترک مکانیکی را برای کسی مانند «ادگار آلن پو» ضرورتا به تردستی و حقه بدل میکرد، خلاقیتی بود که از نظر «پو» برای بازی شطرنج لازم است؛ بازی شطرنج همانند حل معادلهای خطی نیست که صرفا بتوان با دانستن مقدار فعلی، مقدار آتی را محاسبه کرد. شطرنج نیازمند تفکر در باب حرکتهای ممکن و واکنش به روش بازی رقیب است. با توجه به این ویژگیها، باید فردی نحیف در بطن ترک مکانیکی پنهان شده باشد تا توانایی این دستگاه در بازی شطرنج را توضیح دهد. شاید هراسناک باشد که انسانی پنهان در پس «آلفازیرو» نمییابیم؛ آنچه این برنامه را به قویترین شطرنجباز عالم بدل کرده، تنها رشتهای است درازناک از صفرها و یکها. اما شاید هراسناکتر این باشد که «آلفازیرو» بازیای را که ما آفریدهایم و آن را به صحنهای برای نمایش نبوغ و خلاقیت خود بدل کردهایم، پیش خود آموخته و اکنون آن را بهتر از بهترین ما میفهمد. انکار اینکه این قسم یادگیری حقیقتا یادگیری است دیگر سودی ندارد؛ اما چنین پیشرفتی دورنمایی روشن از آینده ماشین در حل مشکلات دشوار و درهمتنیده پیشرو را در افق ترسیم میکند؛ مشکلاتی که تنها به مدد نبوغ انسان و ماشین رفع خواهند شد.
پینوشتها:
1- Machine Learning
2- Deep Learning
3- Wolfgang von Kempelen
4- Mechanical Turk
5- Maelzels Chess Player
6- Deep Blue
7- WarGames
8- North American Aerospace Defense Command (NORAD)
9- DeepMind
10- AlphaZero
11- Reinforcement learning
12- Magnus Carlsen
13- Chinese room
14- John Searle
* پژوهشگر زیستشناسی تکاملی، مؤسسه ماکس پلانک در توبینگن، آلمان