|

ماشین‌ها چه می‌فهمند؟

تلاش برای فهم مرز میان یادگیری انسان و یادگیری ماشین در عصر پیشرفت شتابناک هوش مصنوعی

حدود چهار سال پیش، در پژوهشگاه دانش‌های بنیادین (IPM)، بحث جالبی با یکی از دوستان در باب سرشت یادگیری ماشین1 داشتم. تا جایی که به خاطر دارم، من مدعی بودم که به کار بردن عبارت‌هایی مانند یادگیری ماشین یا یادگیری ژرف2 به منظور توصیف چگونگی حل یک مسئله توسط رایانه‌ها از راه صواب به دور است؛ چراکه یادگیری ماشین با یادگیری ما از جنسی اساسا متفاوت است.

ماشین‌ها چه می‌فهمند؟

عطا کالیراد*: حدود چهار سال پیش، در پژوهشگاه دانش‌های بنیادین (IPM)، بحث جالبی با یکی از دوستان در باب سرشت یادگیری ماشین1 داشتم. تا جایی که به خاطر دارم، من مدعی بودم که به کار بردن عبارت‌هایی مانند یادگیری ماشین یا یادگیری ژرف2 به منظور توصیف چگونگی حل یک مسئله توسط رایانه‌ها از راه صواب به دور است؛ چراکه یادگیری ماشین با یادگیری ما از جنسی اساسا متفاوت است. بر‌اساس آنچه از این بحث به یاد می‌آورم، ظاهرا استدلال‌هایم قانع‌کننده بود، البته حافظه در یادآوری آنچه انجام‌ دادیم چندان وفادارانه عمل نمی‌کند و شاید استدلال‌هایم چندان هم مجاب‌کننده نبودند. باوجود‌این به نظرم اندکی غور در باب این موضوع بحث من و دوستم مفید باشد؛ چراکه یادگیری ماشین به بخش جدایی‌ناپذیر از زندگی ما بدل ‌شده و از مسائل روزمره مانند ترجمه متنی انگلیسی با مترجم گوگل گرفته تا موضوعات علمی مانند پیش‌پینی ساختار پروتئین‌ها را به صورتی نوین حل می‌کند. برای فهم ویژگی یادگیری ماشین، باید نخست به روش‌های سنتی آموزش به رایانه پرداخت. یکی از مسائلی که مدت‌هاست توجه متخصصان علوم رایانه را به خود مشغول کرده، آموزش بازی‌های انسانی به رایانه بوده ‌است. بررسی چگونگی آموزش یکی از این بازی‌ها به رایانه در طی دهه‌های اخیر، سرشت یادگیری ماشین را تا حد زیادی برای ما روشن خواهد کرد.

 

چگونه به رایانه شطرنج بیاموزیم؟

آموزش شطرنج به ماشین قدمتی بیش از درازنای تاریخچه رایانه دارد. یکی از نمونه‌های مشهور ماشین شطرنج‌باز در سال ۱۷۷۰ میلادی از سوی «ولفگانگ فون کِمپِلِن»3 رونمایی شد. این ماشین میزی بود که رویش مهره شطرنج بر روی صفحه بازی آرمیده بودند و آدمکی، که لباس عثمانی بر تن داشت، این قطعات را جابه‌جا می‌کرد. افراد بسیار مشهوری، از‌جمله «ناپلئون بناپارت» و «بنجامین فرانکلین» با این تُرکِ مکانیکی4 بازی کردند و او را حریفی قدرتمند یافتند. همانند بسیاری از عجایب آن دوران، ترک مکانیکی حقه‌ای بیش نبود: فردی نحیف، که شطرنج‌بازی ماهر نیز بود، در درون این دستگاه پنهان می‌شد. البته بسیاری در همان عصر نیز حدس می‌زدند که دستگاهی مکانیکی با قابلیت بازی شطرنج وجود ندارد؛ «ادگار آلن پو»، در «شطرنج‌باز مالزِل»5 (۱۹۳۶) حدس زد که فردی در دل ماشین پنهان است. بازی شطرنج نیازمند درک حرکت رقیب و برگزیدن حرکتی مناسب در پاسخ برای بردن بازی است. شطرنج به ظاهر نیازمند خلاقیتی است که تنها در انسان یافت می‌شود. با ابداع رایانه در میانه قرن بیستم میلادی و علاقه به حل مسائل پیچیده توسط رایانه، برای ساخت ماشین توانا به شطرنج‌بازی آرام‌آرام دیگر نیازی به حقه‌هایی مانند ترک مکانیکی نبود. لااقل سدی نظری در برابر آموزش شطرنج به رایانه وجود نداشت و تنها باید قواعد شطرنج را به رایانه آموزش می‌داد. آموزش قواعد بازی به رایانه، یعنی انتقال تمام اطلاعات موجود در دایره‌المعارف‌های شطرنج، یعنی فهرست عریض و طویل از حرکات، استراتژی‌های آغاز، میانه و پایان بازی، به حافظه رایانه. رایانه باید بر‌اساس این اطلاعات، در پاسخ به حرکت رقیب، حرکات ممکن را بیابد و سودمندی هر‌یک از حرکات را محاسبه کند. گرچه از جنبه نظری، رایانه شطرنج‌باز را می‌توان به آسانی ساخت، در عمل چنین کاری دشوارتر از اینها از آب درآمد و تنها در دهه ۱۹۸۰ میلادی بود که رایانه‌های شطرنج‌باز می‌توانستند شطرنج‌بازان متوسط و خوب را شکست دهند. با چنین پیشرفت‌هایی، هدف شکست بهترین شطرنج‌باز در میان گونه انسان بود. درنهایت، مسابقه‌ سرنوشت‌ساز در ۱۹۹۷ میلادی میان «گری کاسپاروف»، قهرمان بلامنازع آن سال‌ها و رایانه شطرنج‌باز شرکت IBM، با نام «آبی پررنگ»6 در شهر نیویورک برگزار شد. گرچه «کاسپاروف» بازی نخست را برد؛ اما اتفاقی غریب از نظر «کاسپاروف» در حین بازی رخ داد: در اواخر بازی «آبی پررنگ» رخ خود را بدون هیچ دلیل واضحی از d5، میانه صفحه، به d1 جابه‌جا کرد. «کاسپاروف» پس از این حرکت بی‌معنا نوعی خلاقیت هولناک می‌دید؛ اما درواقع این حرکت صرفا حاصل انتخاب حرکت تصادفی توسط «آبی پررنگ» بود؛ چراکه حرکت بهتری نمی‌یافت. در ادامه سلسله‌بازی‌های این مسابقه، «کاسپاروف» بازی دوم را واگذار کرد، بازی سوم، چهارم و پنجم نیز به تساوی انجامید. نتیجه بازی سرنوشت‌ساز ششم، پس از تنها 12 حرکت هویدا بود. «کاسپاروف» پس از این حرکت، با مادرش که در میانه حضار بود به روسی صبحت کرد و درنهایت شکست را پذیرفت و سراسیمه از محل برگزاری خارج شد. گرچه «آبی پررنگ»، «کاسپاروف» را شکست داد؛ اما آیا «آبی پررنگ» حقیقتا شطرنج را در معنای انسانی آن فراگرفته بود؟ به نظرم پاسخ منفی است. «آبی پررنگ» تنها آنچه را می‌دانست که در حافظه‌اش وارد شده بود و در هر لحظه، حرکتی را که بهترین بود، برمی‌گزید؛ اما اشتباهش در بازی اول، حرکت بی‌دلیل رخ، تنها به سبب وجود نقص در برنامه او بود و نه نشانه‌ای از خلاقیت. وقتی ما چیزی را یاد می‌گیریم، تنها اطلاعات مربوط به موضوع مد‌نظر را در حافظه خود الصاق نمی‌کنیم؛ بلکه یادگیری برای ما حاصل کنش و واکنش است. سلسله‌ای از آزمون و خطا که درنهایت به فراگیری روش صحیح حل مسئله می‌انجامد. «آبی پررنگ» از بازی نخست با «کاسپاروف» تا بازی ششم همان شطرنج‌بازی بود که بود؛ اما روش «کاسپاروف» در بازی ششم از بازی نخست متفاوت بود. روش یادگیری «آبی‌ پررنگ» همان‌قدر از یادگیری انسانی متفاوت است که نقاشی رنگ و روغن از عکسی که دوربین عکاسی می‌گیرد.

شطرنج‌بازی که هرگز نمی‌بازد

چه می‌شد اگر «آبی پررنگ» از اشتباهاتش درس می‌گرفت و هر بار که بازی می‌کرد، بهتر می‌شد؟ در فیلم «بازی‌های جنگی»7، محصول ۱۹۸۳ میلادی، «نوراد»8 از ابررایانه‌ای برای کنترل موشک‌های هسته‌ای خود بهره می‌برد و این رایانه برای یافتن بهترین استراتژی در صورت بروز جنگ هسته‌ای میان ایالات متحده و شوروی، به شبیه‌سازی سناریوهای مختلف جنگ جهانی سوم می‌پردازد و از اشتباهات خود در هر سناریو درس می‌گیرد و هر بار موفق‌تر از مرتبه پیشین می‌شود (البته در پایان فیلم، پس از کش‌و‌قوس فراوان، ابررایانه به سازنده خود اعلام می‌کند: «بهترین استراتژی بازی‌نکردن است»). چه می‌شد اگر رایانه شطرنج‌باز ما نیز همانند ابررایانه خیالی فیلم بازی‌های جنگی، با خود بازی می‌کرد و به سبب این بازی‌های پیاپی، شطرنج را فرامی‌گرفت. در سال ۲۰۱۷ میلادی، شرکت ذهن ژرف9، از شرکت‌های زیرمجموعه گوگل، تلاش کرد تا به شیوه فوق به رایانه شطرنج بیاموزد. نرم‌‌افزار ذهن ژرف، با نام «آلفا‌زیرو»10، صرفا قواعد پایه حرکت مهره‌های شطرنج را می‌دانست و به الگوریتم عمومی برای یادگیری بر مبنای آزمون و خطا مسلح بود. پس از چهل و چهار میلیون بار بازی شطرنج در مقابل خودش، «آلفازیرو» بدون دخالت انسان همه استراتژی‌های آغاز بازی شطرنج را کشف کرد. پس از یادگیری شطرنج به این شیوه، مهندسان گوگل «آلفازیرو» را در برابر بهترین نرم‌افزار سنتی بازی شطرنج آزمودند. در طی صد بازی، «آلفازیرو» بیست‌و‌هشت بازی را برد، هفتاد‌و‌دو بازی مساوی شد؛ «آلفازیرو» هرگز نباخت. «آلفازیرو» عملا به قوی‌ترین شطرنج‌باز جهان شناخته‌شده بدل شد. «آلفازیرو» برای یادگیری شطرنج، با دانستن قواعد حرکت مهره‌های نخست با خود بازی می‌کند. در ابتدا حرکات «آلفازیرو» تصادفی هستند؛ چرا‌که او هنوز نمی‌داند چگونه باید بازی را برد؛ اما پس از آزمون و خطا در طی این بازی‌ها، راه‌های پیروزی را می‌آموزد (در زبان فنی، به این نوع الگوریتم، یادگیری تقویتی11 می‌گویند). تفاوت این نوع یادگیری با روش‌های سنتی بازی شطرنج در تعداد حرکاتی است که «آلفازیرو» برای هر بار حرکت یک مهره‌ در طی بازی بررسی می‌کند. یک استاد بزرگ شطرنج به‌ طور متوسط در هر حرکت، صد حرکت ممکن را در نظر می‌گیرد؛ رایانه‌های سنتی شطرنج‌باز، برای هر حرکت حدود ده میلیون حرکت را بررسی می‌کنند؛ اما «آلفازیرو» تنها ده‌ هزار حرکت را به ازای هر حرکت بررسی می‌کند. گرچه ده‌ هزار حرکت همچنان از صد حرکتی که یک استاد بزرگ بررسی می‌کند، بیشتر است؛ اما با روش‌های سنتی یافتن حرکت بعدی در شطرنج قابل مقایسه نیست. مسئله‌ای که «آلفازیرو» را جذاب می‌کند، سرشت استراتژی‌ها و روش بازی اوست؛ برخلاف رایانه‌های شطرنج‌باز پیشین، «آلفازیرو» روش خودش را کشف‌ کرده، روشی که «گری کاسپاروف» آن را بسیار پویا و مشابه رویکرد خودش به شطرنج یافت. البته «آلفازیرو» چنان شطرنج‌باز قهاری است که هیچ استاد بزرگی، چه از جنس کربن و چه سیلیکون، توانایی شکست او را ندارد. از‌این‌رو «آلفازیرو» خود به معلم شطرنج بدل شده ‌است! قهرمان بلامنازع فعلی شطرنج جهان، «ماگنوس کارلسِن»12، بهبود مهارت خود در بازی شطرنج در سال‌های اخیر را به مطالعه بازی‌های «آلفازیرو» نسبت داده است. گویی «آلفازیرو» بازی ساخته دست انسان را به تملک خود درآورده است!

اتاق چینی

تصور کنید در شرکتی مشغول به کار هستید و وظیفه شما این است که هر روز در اتاق کار خود قرار بگیرید و در انتظار نامه‌هایی به زبان چینی باشید که از زیر در اتاق به دست شما می‌رسند. پس از دریافت این نامه‌ها، به سراغ کتاب عریض و طویلی می‌روید که به شما توضیح می‌دهد چه ترکیبی از الفبای چینی را باید در پاسخ به سلسله الفبای موجود در این نامه‌ها بر کاغذ بنگارید. نکته مهم این است که دستورالعمل پاسخ صرفا بر مبنای شکل و ترتیب الفبای چینی در این نامه‌هاست و شما به‌هیچ‌وجه از معنای این نامه‌ها و پاسخ خود باخبر نیستید. آیا پس از چند سال فعالیت در این شرکت، از زبان چینی سر در‌می‌آورید؟ این مثال نسخه‌ای است از آزمایش ذهنی اتاق چینی13 فیلسوف شهیر، «جان سرل»14. هدف «جان سرل» از صورت‌بندی این آزمایش ذهنی، نشان‌دادن ناممکن‌بودن فهم در هوش مصنوعی است: یک برنامه رایانه‌ای، هر چقدر هم که پیشرفته باشد، صرفا الگوها را شناسایی می‌کند و به هم ربط می‌دهد؛ اما همان‌قدر از ماهیت این الگوها باخبر است که کارمند ما در اتاق چینی از زبان چینی سر در‌می‌آورد. آیا می‌توان استدلال اتاق چینی را در باب یادگیری ماشین نیز به کار برد؟ در بحثی که در ابتدای این یادداشت به آن اشاره شد، استدلال من در برابر دوستم این بود که به کار بردن صفاتی مانند «یادگیری» برای آنچه ماشین انجام می‌دهد، مانند الگوریتم یادگیری تقویتی «آلفازیرو»، نامناسب است؛ چراکه این یادگیری هیچ سنخیتی با یادگیری انسان ندارد؛ اما اکنون پس از چند سال سر‌و‌کله‌ زدن با الگوریتم‌های یادگیری ماشینی و موفقیت این الگوریتم‌ها نه‌تنها در بازی‌هایی مانند شطرنج، بلکه در پیش‌بینی ساختار پروتئین‌ها، به نظرم می‌رسد که شاید توصیف این روش‌ها به‌عنوان نوعی «یادگیری» چندان هم بیراه نباشد. البته این نوع یادگیری ضرورتا همانند یادگیری انسان نیست؛ اما شاید در بسیاری از جنبه‌ها یادگیری ما نیز دست‌‌کمی از یادگیری ماشین نداشته باشد. به‌عنوان مثال، یادگیری زبان در کودکان را در نظر بگیرید: کودکان در برخورد با دیگر کودکان و بزرگسالان کلمات را تقلید می‌کنند و واکنش دیگران به این تقلیدها به مرور زمان به اصلاح تلفظ کلمه‌ها و شبیه‌تر‌شدن آنها به تلفظ مورد قبول منجر می‌شود. چنین یادگیری‌ای، لااقل در سطح، شباهت‌های زیادی به یادگیری تقویتی «آلفازیرو» دارد. آنچه ترک مکانیکی را برای کسی مانند «ادگار آلن پو» ضرورتا به تردستی و حقه بدل می‌کرد، خلاقیتی بود که از نظر «پو» برای بازی شطرنج لازم است؛ بازی شطرنج همانند حل معادله‌ای خطی نیست که صرفا بتوان با دانستن مقدار فعلی، مقدار آتی را محاسبه کرد. شطرنج نیازمند تفکر در باب حرکت‌های ممکن و واکنش به روش بازی رقیب است. با توجه به این ویژگی‌ها، باید فردی نحیف در بطن ترک مکانیکی پنهان شده باشد تا توانایی این دستگاه در بازی شطرنج را توضیح دهد. شاید هراسناک باشد که انسانی پنهان در پس «آلفازیرو» نمی‌یابیم؛ آنچه این برنامه را به قوی‌ترین شطرنج‌باز عالم بدل کرده، تنها رشته‌ای‌ است درازناک از صفرها و یک‌ها. اما شاید هراسناک‌تر این باشد که «آلفازیرو» بازی‌ای را که ما آفریده‌ایم و آن را به صحنه‌ای برای نمایش نبوغ و خلاقیت خود بدل کرده‌ایم، پیش خود آموخته و اکنون آن را بهتر از بهترین ما می‌فهمد. انکار اینکه این قسم یادگیری حقیقتا یادگیری است دیگر سودی ندارد؛ اما چنین پیشرفتی دورنمایی روشن از آینده ماشین در حل مشکلات دشوار و درهم‌تنیده پیش‌رو را در افق ترسیم می‌کند؛ مشکلاتی که تنها به مدد نبوغ انسان و ماشین رفع خواهند شد.

پی‌نوشت‌ها:

1- Machine Learning

2- Deep Learning

3- Wolfgang von Kempelen

4- Mechanical Turk

5- Maelzels Chess Player

6- Deep Blue

7- WarGames

8- North American Aerospace Defense Command (NORAD)

9- DeepMind

10- AlphaZero

11- Reinforcement learning

12- Magnus Carlsen

13- Chinese room

14- John Searle

* پژوهشگر زیست‌شناسی تکاملی، مؤسسه ماکس پلانک در توبینگن، آلمان