چرا چتجیپیتی برای حل سؤالهای دشوار ریاضی مناسب و توانمند نیست؟*
وقتی چتجیپیتی نمیتواند ریاضیدان باشد
از نوشتن مقاله تا برنامههای کدنویسی، ظاهرا چیزی وجود ندارد که چتباتهای هوش مصنوعی مدرن مانند چتجیپیتی (ChatGPT) نتوانند انجام دهند. حتی اگر این توانمندی نامحدود به نظر برسد، ولی با اطمینان میتوان گفت چنین نیست؛ برای مثال این چتباتها هنگام صحبت درباره یک موضوع مبهم یا کمتر شناختهشده، اشتباه میکنند.
عنایتاله راستیزاده
از نوشتن مقاله تا برنامههای کدنویسی، ظاهرا چیزی وجود ندارد که چتباتهای هوش مصنوعی مدرن مانند چتجیپیتی (ChatGPT) نتوانند انجام دهند. حتی اگر این توانمندی نامحدود به نظر برسد، ولی با اطمینان میتوان گفت چنین نیست؛ برای مثال این چتباتها هنگام صحبت درباره یک موضوع مبهم یا کمتر شناختهشده، اشتباه میکنند. به همین ترتیب، ممکن است شنیده باشید که چتجیپیتی در حل مسائل ریاضی مهارت چندانی ندارد؛ بنابراین در این یادداشت میخواهیم تواناییهای ریاضی چتجیپیتی را تشریح کنیم و ببینیم که چگونه میتوان توانایی چتبات را در این زمینه بهبود بخشید.
آیا چتجیپیتی میتواند مسائل ریاضی را حل کند؟
بله، چتجیپیتی میتواند مسائل پایه ریاضی را حل کند اما برای این کار طراحی نشده است. اگر سؤالهای سادهای مانند «حاصل جمع13+33 چیست» یا برخی مسائل کلامی را بپرسید، به احتمال زیاد پاسخ صحیح را خواهید گرفت. با این حال، برای حل دقیق مسائل ریاضی پیشرفته مانند معادلات دیفرانسیل یا مسائل حسابان و نظریه اعداد نمیشود به چتبات اعتماد کرد. دلیل آن این است که چتجیپیتی تمایل دارد به شیوهای بسیار مطمئن پاسخ دهد که در نگاه اول کاملا صحیح به نظر برسد. با این حال، این پاسخها گاهی اوقات میتوانند حاوی خطاهایی با درجات مختلف، بزرگ و کوچک باشند که به سختی قابل تشخیصاند و بهراحتی نمیتوان متوجه آنها شد. چتجیپیتی فقط میتواند مسائل ریاضی پایه را حل کند، اما گاهی به اندازه یک ماشینحساب هم قابل اعتماد نیست. نخست به بررسی نحوه عملکرد چتجیپیتی اشاره کنیم. ربات چت، یک مدل یادگیری ماشینی است که فقط بهطور صریح برای تولید متن مانند یک انسان آموزش داده شده است. چتجیپیتی، روی مجموعه داده متنی عظیمی آموزش داده شده که اتفاقا شامل وبسایتهایی مانند ویکیپدیا، مقالات تحقیقاتی و شاید حتی کتابهای درسی مرتبط با ریاضیات میشود. این فرایند آموزشی، چتجیپیتی را قادر ساخته تا کلمات جداگانه را چنان با هم ردیف کند تا جملات و درنهایت پاراگرافها را تشکیل دهد. با این حال، بهطور صریح برای انجام عملیات یا محاسبات پیچیده ریاضی آموزش ندیده است. بنابراین به جای اینکه بگوید نمیتواند یک مسئله ریاضی را حل کند، چتجیپیتی، با یک راهحل کاملا تصنعی (اما به نظر منطقی) پاسخ میدهد. قانعکننده است که بپذیریم رباتچت تنها بر هنر تقلید گفتوگوی انسانی تسلط دارد و این امکان را دارد تا ما را فریب دهد! مدلهای زبانی بزرگ به دلیل حجم زیادی از دادههایی که در طول فرایند آموزش به کار میگیرند، توانایی منطقی پیدا کردهاند. این به عنوان «رفتار ناگزیر» در هوش مصنوعی مولد شناخته میشود. با این حال، این توانایی منطقی نه قابل اعتماد است و نه سازگار، بنابراین در حال حاضر نمیتوان به چتجیپیتی در کارهای غیرزبانی اعتماد کرد. خوشبختانه شما میتوانید با پرداخت حق عضویت در چتجیپیتیپلاس، توانایی چتجیپیتی را برای حل مسائل ریاضی بهبود ببخشید؛ یک مدل زبان جدیدتر با قابلیتهای ریاضی و منطقی بهتر. چتجیپیتیپلاس همراه با افزونه ولفرام باعث میشود رباتچت در حل مسائل ریاضی بهتر عمل کند. طبق گفته اوپن ایآی (Open AI) شرکت پژوهشی پدیدآورنده هوش مصنوعی چتجیپیتی، ویرایش جدید چتجیپیتی در آزمونهای آکادمیک مانند متست امتیاز بالایی میگیرد. با این حال، جای تعجب نیست که 43 تا 59 درصد شرکتکنندگان در دوره، در سطح مقدماتی قرار گرفتند. این بدان معناست که رباتچت، حداقل در حل مسائل حساب دیفرانسیل و انتگرال، بدتر از یک دانشجوی معمولی عمل میکند. هرچند این همهچیز نیست. ما میتوانیم با کمک افزونهها، مهارتهای ریاضی چتبات را بیشتر بهبود ببخشیم. در حال حاضر مجموعهای از بهترین افزونههای جایگزین چتجیپیتی را داریم، اما ولفرام بهترین توصیه ما برای استدلال ریاضی و منطقی است. ترکیب موتور محاسباتی ولفرام آلفا و توانایی چتربات، گره بسیاری از مفاهیم دشوار را باز میکند. با فعالبودن این افزونه، از چتجیپیتی انتظار میرود اکثر مسائل ریاضی را با دقت معقول حل کند.
چند جایگزین چتجیپیتی بـرای حل معادلات ریاضی
اگر در حال تلاش برای حل مسائل ریاضی هستید، ممکن است نخواهید برای چتجیپیتیپلاس و توانایی استفاده از افزونهها مبلغی را هزینه کنید. در این صورت، باید چتبات را بهطور کامل کنار بگذارید و از سرویس دیگری استفاده کنید که برای رسیدگی به مسائل ریاضی طراحی شده است. به عنوان مثال، نسخه رایگان ولفرام آلفا میتواند انواع مسائل ریاضی را حل کند، از جبر خطی ساده تا معادلات دیفرانسیل. تنها نقطه ضعف آن این است که به توضیحی مختصر بسنده میکند، بنابراین پاسخ یا توضیحات طولانی دریافت نخواهید کرد. با این حال، ممکن است این رویکرد را ترجیح دهید زیرا چتجیپیتی گاهی اوقات میتواند پاسخی مفصلتر ارائه دهد، درحالیکه تنها چیزی که به آن اهمیت میدهید نتیجه نهایی است. همچنین پیشنهاد میکنیم برنامه فوتومت را بررسی کنید. این برنامه به شما امکان میدهد مسائل دستنوشته را اسکن کنید و سپس راهحلها را به صورت گام به گام ببینید.
* براساس نوشتهای از کالوین وانکهد، کارشناس فناوری، 30 جولای 2023