گوگل دستیار دیجیتال جهانی میسازد
گوگل قصد دارد دو مدل هوش مصنوعی قدرتمند خودش، یعنی Gemini و Veo را با هم ترکیب کند.

به گزارش گروه رسانهای شرق ؛ «دمیس هاسابیس»، مدیرعامل دیپمایند، اعلام کرد گوگل قصد دارد در آینده مدلهای هوش مصنوعی Gemini را با مدلهای تولید ویدیو Veo ترکیب کند تا توانایی درک دنیای فیزیکی در این سیستمها بهبود یابد.
هاسابیس در گفتوگویی در پادکست «Possible» به میزبانی «رید هافمن»، همبنیانگذار لینکدین، گفت:«ما از ابتدا Gemini را بهعنوان یک مدل چندوجهی طراحی کردیم، چون هدفمان ساخت یک دستیار دیجیتال جهانی بود؛ دستیار هوشمندی که بتواند واقعاً در دنیای واقعی به شما کمک کند.»
در حالی که صنعت هوش مصنوعی به سمت توسعه مدلهای همهکاره پیش میرود، مدلهایی که توانایی درک و تولید انواع مختلفی از محتوا مانند متن، تصویر، صوت و ویدیو را دارند، گوگل نیز در تلاش است تا مدلهای پیشرفته خود را در این مسیر گسترش دهد.
نسخههای جدید مدل Gemini اکنون قادر به تولید صوت، تصویر و متن هستند، در حالی که مدل پیشفرض OpenAI در چتجیپیتی نیز قابلیت تولید تصویر (از جمله آثار هنری با سبک استودیو جیبلی) را دارد. آمازون هم اعلام کرده که تا پایان سال جاری از یک مدل «هر ورودی به هر خروجی» (any-to-any) رونمایی خواهد کرد.
این مدلهای جامع به حجم عظیمی از دادههای متنوع برای آموزش نیاز دارند؛ از جمله تصویر، ویدیو، صوت و متن؛ به گفته هاسابیس، مدل ویدیویی Veo برای یادگیری قوانین دنیای واقعی، عمدتاً از ویدیوهای یوتیوب استفاده میکند. او گفت:« Veo با تماشای تعداد زیادی ویدیو در یوتیوب میتواند فیزیک دنیای واقعی را تشخیص دهد.»
گوگل پیشتر گفته بود که مدلهایش «ممکن است» براساس «برخی» از محتوای یوتیوب و طبق توافقنامه با سازندگان آن آموزش داده شده باشند. گزارشها همچنین نشان میدهد که این شرکت سال گذشته شرایط خدمات خود را تغییر داده تا از دادههای بیشتری برای آموزش مدلهای هوش مصنوعی خود بهره بگیرد.