روش مخفی آمازون برای آموزش هوش مصنوعی
بنا بر گزارشها آمازون یک روش مخفی برای استفاده از دادههای گیتهاب مایکروسافت و آموزش هوش مصنوعی خود یافته است
آمازون برای ایجاد مدلهای قدرتمند هوش مصنوعی به مقادیر زیادی داده با کیفیت بالا نیاز دارد. آمازون با به رسمیت شناختن گیتهاب بهعنوان گنجینهای از ابردادههای ارزشمند، راهبردی برای تسریع جمعآوری دادهها با وجود محدودیتهای این پلتفرم، ابداع کرده است.
به گزارش بیزینس اینسایدر، گروه هوش مصنوعی آمازون (AGI) نیاز خود را به «فراداده کمی و کیفی از گیتهاب» برای پیشبرد تلاشهای خود در راستای آموزش هوش مصنوعی خود بیان کرده است. بااینحال، محدودیتهای جمعآوری دادههای گیتهاب که تنها به هر حساب ۵۰۰۰ درخواست در ساعت اجازه میدهد، یک مانع بزرگ ایجاد کردهاند. در نتیجه با وجود بیش از ۱۵۰ میلیون مخزن عمومی در گیتهاب، روشهای سنتی جمعآوری داده سالها طول میکشد.
راهحل آمازون چیست؟
در پاسخ آمازون یک راهحل پیشنهاد کرده است؛ کارمندان خود را تشویق میکند تا چندین حساب گیتهاب ایجاد کنند و دسترسی خود را به اشتراک بگذارند. آمازون با استفاده از شبکهای از حسابها قصد دارد آنچه را که سالها به طول میانجامد عرض چندین هفته انجام دهد. با اینکه اقدامات آمازون را نمیتوان دزدی دانست، اما نگرانیهای از بابت اخلاقی بودن این کار و همچنین حریم خصوصی دادهها، مجوزها و استفاده مناسب از منابع ایجاد میکند.
آمازون دستورالعملهای دقیقی را در مورد نحوه ایجاد و مدیریت این حسابها برای اطمینان از انطباق با دستورالعملهای قانونی و امنیتی ارائه میدهد. این دستورالعملها شامل استفاده از ایمیلهای کاری آمازون، انواع خاصی از توکنهای گیتهاب و تنظیم مجوزهای مناسب برای دسترسی به دادهها میشوند.
آمازون ادعا میکند که رویکرد این کار توسط تیمهای حقوقی و امنیتی آن تأیید شده است. به نظر میرسد که آمازون در تلاش است تا با اطمینان از رعایت دستورالعملهای داخلی، در محدودههای قانونی فعالیت کند. بااینحال، قانونی بودن چنین اقداماتی میتواند مورد تردید قرار گیرد، بهخصوص اگر گیتهاب یا کاربران این اقدام را بهعنوان نقض تلقی کنند.
البته پیامدهای اخلاقی این کار قابلتوجه هستند. آمازون با درخواست از کارمندان برای به اشتراک گذاشتن حسابهای شخصی گیتهاب، بدون رضایت گیتهاب یا صاحبان مخازن به دادهها دسترسی پیدا میکند.
چرا آمازون این کار را انجام میدهد؟
نیاز آمازون به دادههای گیتهاب مایکروسافت برای پیشبرد قابلیتهای هوش مصنوعی حیاتی است. مدلهای هوش مصنوعی، مانند مدلهایی که برای درک زبان انسان یا پیشبینی استفاده میشوند، برای یادگیری مؤثر به مقادیر زیادی دادههای متنوع نیاز دارند. گیتهاب که مرکزی برای میلیونها پروژه نرمافزاری منبعباز است، مجموعه گستردهای از کد و اطلاعات را ارائه میدهد که میتواند این الگوریتمهای هوش مصنوعی را آموزش دهد.
دسترسی به دادههای گیتهاب فقط محدود به کدها نمیشود و به جز کدها، آمازون به جزئیات ارزشمندی مانند چگونگی تکامل پروژهها در طول زمان، مشارکتکنندهها و نحوه همکاری توسعهدهندگان نیز دسترسی پیدا میکند. این ابرداده برای مدلهای هوش مصنوعی جهت یادگیری الگوها، بهبود دقت آنها و توسعه راهحلهای بهتر برای حل مشکلات ضروری است.
در دنیای رقابتی غولهای فناوری، داشتن مجموعه دادههای جامع میتواند به شرکتهایی مانند آمازون برتری قابلتوجهی بدهد. آمازون با بهرهگیری از دادههای گیتهاب قصد دارد سریعتر نوآوری کند، به رقبا برسد و فناوریهای هوشمندتری ایجاد کند تا بتواند همه چیز را از توصیههای خرید آنلاین گرفته تا خدمات ابری بهبود بخشد.
برای آمازون، هوش مصنوعی تنها یک کلمه کلیدی نیست، بلکه به معنای بهبود تجربه مشتری، بهینهسازی عملیات و ایجاد نوآوری در سراسر تجارت آن است. آمازون با آموزش مدلهای هوش مصنوعی با دادههای گیتهاب میتواند سیستمهای هوشمندتری را توسعه دهد که قادر به انجام وظایف پیچیده هستند.
بااینحال، استفاده از دادههای پلتفرمهایی مانند گیتهاب مسائل اخلاقی را مطرح میکند. شرکتها باید مسائل مربوط به حریم خصوصی کاربر، مالکیت دادهها و قوانین پلتفرم را مورد توجه قرار دهند. رویکرد آمازون، با اینکه که در داخل سازمانش تأیید شده است؛ اما بحثهایی را در پی دارد.