|

فن‌بیز؛ معرفی استارتاپ soundhound

​دستیار‌ صوتی شخصی‌سازی شده با کمک هوش مصنوعی

Soundhound توسط «کیوان مهاجر» یک ایرانی مهاجرت کرده به کانادا راه‌اندازی شده است. مهاجر معتقد است، هرکسی باید با دستگاه‌های اطراف خود به راحتی به وسیله «صحبت‌ کردن» ارتباط برقرار کند.

​دستیار‌ صوتی شخصی‌سازی شده با کمک هوش مصنوعی
خبرنگار: بهناز توحیدی

دنیا به جایی تبدیل شده  که هیچ‌ چیز غیرممکن نیست. زمانی را به خاطر دارم که آهنگی را دوست داشتم و مجبور بودم با واکمن آن را ضبط کنم تا بعدا به آنها گوش کنم، چون در آن‌ زمان اینترنت مانند حالا توسعه پیدا نکرده بود تا به راحتی هر زمان که خواستید آهنگی را پیدا و به آن گوش کنید. امروزه اپلیکیشن‌های بسیاری برای تشخیص موسیقی وجود دارد که در چند دقیقه به راحتی موسیقی مورد نظر را برای شما پیدا می‌کنند. اپلیکیشن‌هایی مانند soundhound شاید یکی از همین برنامه‌ها باشد. در «فن‌بیز» این هفته این استارتاپ را به شما معرفی می‌کنیم.

Soundhound توسط یک ایرانی مهاجرت کرده به کانادا راه‌اندازی شده است. این برنامه توسط «کیوان مهاجر» در سال ۲۰۰۵ راه‌اندازی شد. مهاجر معتقد است، هرکسی باید با دستگاه‌های اطراف خود به راحتی به وسیله «صحبت‌ کردن» ارتباط برقرار کند. پلتفرم Houndify نیز سرویس مستقل هوش مصنوعی شرکت Soundhound است که باعث می‌شود کاربران برای کسب‌وکارهای خود دستیارهای صوتی شخصی‌سازی شده ایجاد کنند. راه‌اندازی چنین محصولاتی سبب شده تا این استارتاپ در سال‌های متمادی جزو برترین استارتاپ‌های دنیا باشد.

کیوان مهاجر کیست؟

کیوان مهاجر، مدیرعامل و بنیانگذار ایرانی-کانادایی استارتاپ  soundhound است. او در رشته مهندسی برق از دانشگاه استنفورد فارغ‌التحصیل شده است و دوره کارشناسی ارشد خود را در رشته مهندسی برق و علوم کاربردی از دانشگاه تورنتو گذراند. مقطع دکتری خود را نیز در همین رشته به پایان رساند. البته soundhound اولین تجربه او در دنیای استارتاپ‌ها نبود. او در مصاحبه‌ای با پژمان نوزاد، سرمایه‌‌دار ایرانی-آمریکایی اعلام کرده که وقتی کمتر از ۱۰ سال داشته یک کسب‌وکار راه‌اندازی کرده است. مهاجر در این مورد می‌گوید: «در ایران یک زمین بازی بود که بعدازظهرها شلوغ می‌شد. اگر واحد پول را دلار در نظر بگیریم، من مثلا اندازه یک دلار خمیر نان می‌خریدم. آن خمیر را به ۱۰۰ قسمت کوچک تقسیم می‌کردم و جلوی بچه‌ها آن خمیرها را می‌پختم و می‌فروختم.» 

مهاجر ادامه داد: «ارزشی که من ایجاد کردم این بود که بچه‌ها از نان داغ و تازه لذت می‌بردند. بچه‌ها همچنین معامله‌ کردن را تجربه می‌کردند. چون بچه‌ها دوست دارند مثل بزرگسالان رفتار کنند. به همین خاطر برای آنها آسان است که از والدین خود پولی بگیرند و آن پول را با نان من عوض کنند.»

به گفته مهاجر هرروز او یک دلار خود را به هزار دلار تبدیل می‌کرد و سپس تصمیم گرفت فروش خود را بالا ببرد، مهاجر در این مورد می‌گوید: «من نان طعم لیمو ۲ دلاری و طعم شکلاتی ۳ دلاری را به لیست نان‌ها اضافه کردم. من در سن پایین توانسته بودم یک کسب‌وکار راه‌اندازی کنم و یک ارزش ایجاد کرده‌ بودم.»

البته عمر این کسب‌وکار کوتاه بود و خانواده مهاجر در سال ۱۹۹۵ به کانادا مهاجرت کردند. مهاجر دوران دبیرستان خود را در کانادا به پایان رساند و در دانشگاه تورنتو در رشته مهندسی مشغول به تحصیل شد: «بعد از پایان تحصیلم، ۳ شرکت راه‌اندازی کردم. در آن‌زمان من فارغ‌التحصیل شده بودم، تجربیاتی داشتم و حالا تصمیم گرفته بودم یک استارتاپ های‌-تک ایجاد کنم. استارتاپی که روی جهان تاثیر بسیاری بگذارد. من این تصمیم را گرفتم، اما باید تحصیلات تکمیلی خود را می‌گذراندم.»

 پس مهاجر در سال ۲۰۰۰ تحصیلات خود را در استنفورد آغاز کرد و همچنین دنبال ایده برای استارتاپ خود بود. او همیشه این سوال را از خود می‌پرسید که در طول زندگی من چه اتفاقی می‌افتد که تأثیر زیادی در جهان خواهد داشت؟

برای پاسخ به این سوال، او فیلم «استارترک» را تماشا کرد. چون مهاجر یکی از طرفداران فیلم‌های علمی- تخیلی است: «من فیلم استارترک را تماشا کردم. چند مفهوم در استارترک مطرح شد که در آن‌زمان وجود نداشتند. اول جابه‌جایی با سرعت بیشتر از سرعت نور، دورنوردی (Teleportation )، هولوگرام، همانندسازی (Replicators) و هوش مصنوعی صوتی. این موضوع برای ۲۰ سال پیش است و من در آن‌زمان فکر کردم چیزی که مطمئنا در طول زندگی من می‌بینم، هوش مصنوعی صوتی بود.»

مهاجر معتقد است در فیلم‌های علمی-تخیلی مردم با روبات‌ها و کامیپوترها صحبت می‌کردند و آنها هم پاسخ می‌دادند و این موضوع خیلی طبیعی بود، پس در واقعیت هم می‌توان چنین چیزی را عملی کرد. پس او با راه‌اندازی soundhound به حوزه صدا و هوش مصنوعی وارد شد.

Sounhound چه کار می‌کند؟

مهاجر پیش از soundhound، چند شرکت راه‌اندازی کرده بود. یکی از این کسب‌وکارها میدومی (MIDOMI) موتور جست‌وجو ویژه آهنگ بود. این موتور جست‌وجو براساس زمزمه و صدای خواننده، نام آهنگ، نام خواننده و کلمات کلیدی مرتبط آهنگ مورد نظر کاربر را پیدا می‌کند.

 اما در سال ۲۰۰۹، کیوان مهاجر تصمیم گرفت میدومی را به soundhound تغییر برند دهد. هرچند که بعد از این تغییر، میدومی در نسخه وب midomi.com در دسترس است.

هم‌اکنون soundhoud متشکل از تیم متنوعی از مهندسان، طراحان UX/UI، نویسندگان، دانشمندان داده و زبان‌شناسان است.

وقتی به سایت این شرکت وارد می‌شوید، اولین چیزی که به چشم می‌خورد این جمله است: «ما معتقدیم هر برندی باید صدایی داشته باشد و هرکسی بتواند با دستگاه‌های اطراف خود به وسیله صحبت‌کردن ارتباط برقرار کند.»

به همین دلیل شرکت soundhound، پلتفرم مستقل هوش مصنوعی  Houndify، را ایجاد کرد تا برندها دستیارهای صوتی سفارشی ایجاد کنند.

اگر شما همچنین به بخش محصولات این شرکت مراجعه کنید با لیستی از پلتفرم‌ها و اپلکیشن‌ها روبرو می‌شوید؛ مانند اپلیکیشن تشخیص آهنگ sounhound، پلتفرم تبدیل متن به گفتار، دستیار صوتی دریافت سفارش‌های رستوران، بستر ابری، تفسیر زبان‌‌های طبیعی (NLU)، دستیار صوتی برای گوشی‌ها و … .

دستیار صوتی Hound همچنین با برندهایی مانند بنز، هیوندای، دویچه تلکام و پاندو همکاری‌های مشترکی را آغاز کرد. 

در سال ۱۴۰۱ هم ال‌جی الکترونیکس  تفاهم‌نامه‌ای را با این شرکت امضا کرد تا به طور مشترک فناوری پیشرفته هوش مصنوعی صوتی را برای آینده تولید سیستم‌های اطلاعات سرگرمی داخل خودرو (IVI) توسعه دهند.

نحوه مواجه با رقبای بزرگ

در حوزه‌ای که کیوان مهاجر فعالیت می‌کند، بازیگران بسیاری حضور دارند و soundhound باید در این زمینه ارزش‌افزوده‌ای داشته باشد تا کاربران را جذب کند. کیوان مهاجر در مورد اینکه به چه‌صورت از رقبا پیشی گرفته است، می‌گوید: «در قدم اول نباید بترسید. اگر به چیزی علاقه دارید و به آن متعهد هستید، نترسید. حتی آن غول‌های بزرگ هم روزی کوچک بودند. بعد مطمئن باش که افرادی را استخدام می‌کنی که نمی‌ترسند و همراه تو هستند.»

مهاجر و همکارانش نمی‌خواستند در این بازار بازیگران وابسته‌ای باشند، بلکه قصد داشتند تکنولوژی پیشرفته‌تری نسبت به رقبای قوی خود ارائه دهند: «به همین خاطر ۱۰ سال طول کشید تا به ثبات برسیم. چون در ۶ سال اول فعالیتمان ما مدام شکست می‌خوردیم. اما ما به تلاش خود ادامه دادیم و بالاخره در سال ۲۰۱۵ به تکنولوژی بسیار خاصی دست پیدا کردیم و از آن رونمایی کردیم. حتی بعد چندسال هم هنوز غول‌های این حوزه نتوانستند به چنین چیزی دست پیدا کنند.»

او درمورد اینکه آن تکنولوژی خاص چیست، ادامه داد: «وقتی ما آدم‌ها با هم صحبت می‌کنیم، مکالماتمان پیچیده است؛ اما وقتی با کامپیوتر صحبت می‌کنیم، یاد گرفتیم توقعات خود را از این دستگاه پایین بیاوریم. چرا؟ چون کامپیوتر در درک زبان طبیعی محدودیت دارد. ما قصد داشتیم این محدودیت را برطرف کنیم.»

چشم‌انداز کیوان مهاجر این بود تا این محدودیت زبانی را برطرف کند و مکالمه انسان‌ها با کامپیوتر هم پیچیده شود: «اگر از سیری، گوگل یا دستیاران دیگر بپرسید: «رستوران‌ها به استثنای رستوران چینی را به من نشان بده»، معمولاً همه آنها به این صورت پاسخ می‌دهند؛ «در اینجا چند رستوران چینی وجود دارد.». به خاطر اینکه آنها با کلمات کلیدی چینی و رستوران خود را مطابقت دادند؛ اما با تکنولوژی ما، شما می توانید بسیار پیچیده‌تر با کامپیوتر صحبت کنید.»

آینده soundhound در سال ۲۰۲۴

براساس گزارش USA TODAY این استارتاپ ادعا کرده است که «معدل درآمد قبل از بهره، مالیات و استهلاک» (EBITDA)  آن مثبت شده است، اما این شرکت در اولین حضور عمومی‌ خود ۱۰ درصد از کارکنانش را اخراج کرد. بعد در اوایل سال ۲۰۲۳ نیمی دیگر از کارکنان خود را تعلیق کرد.» حالا این سوال پیش می‌آید soundhound در سال ۲۰۲۴ چه سرنوشتی خواهد داشت؟

USA TODAY در گزارش خود به این سوال پاسخ داده است: «تحلیلگران انتظار دارند در کل سال ۲۰۲۴ درآمد SoundHound  پنجاه درصد افزایش پیدا کند و به ۴۷ میلیون دلار برسد. به این صورت ضرر EBITDA تعدیل شده از ۷۳ میلیون دلار به ۳۳ میلیون دلار کاهش پیدا می‌کند.»

براساس این گزارش کیوان مهاجر، مدیرعامل هم پیش‌بینی کرده است که مدل‌های زبان جدید SoundHound در حال گسترش هستند. به این صورت این پلتفرم قادر خواهد بود همزمان با توسعه بازار هوش مصنوعی به موفقیت‌های خوبی دست پیدا کند.