فنبیز؛ معرفی استارتاپ soundhound
دستیار صوتی شخصیسازی شده با کمک هوش مصنوعی
Soundhound توسط «کیوان مهاجر» یک ایرانی مهاجرت کرده به کانادا راهاندازی شده است. مهاجر معتقد است، هرکسی باید با دستگاههای اطراف خود به راحتی به وسیله «صحبت کردن» ارتباط برقرار کند.
دنیا به جایی تبدیل شده که هیچ چیز غیرممکن نیست. زمانی را به خاطر دارم که آهنگی را دوست داشتم و مجبور بودم با واکمن آن را ضبط کنم تا بعدا به آنها گوش کنم، چون در آن زمان اینترنت مانند حالا توسعه پیدا نکرده بود تا به راحتی هر زمان که خواستید آهنگی را پیدا و به آن گوش کنید. امروزه اپلیکیشنهای بسیاری برای تشخیص موسیقی وجود دارد که در چند دقیقه به راحتی موسیقی مورد نظر را برای شما پیدا میکنند. اپلیکیشنهایی مانند soundhound شاید یکی از همین برنامهها باشد. در «فنبیز» این هفته این استارتاپ را به شما معرفی میکنیم.
Soundhound توسط یک ایرانی مهاجرت کرده به کانادا راهاندازی شده است. این برنامه توسط «کیوان مهاجر» در سال ۲۰۰۵ راهاندازی شد. مهاجر معتقد است، هرکسی باید با دستگاههای اطراف خود به راحتی به وسیله «صحبت کردن» ارتباط برقرار کند. پلتفرم Houndify نیز سرویس مستقل هوش مصنوعی شرکت Soundhound است که باعث میشود کاربران برای کسبوکارهای خود دستیارهای صوتی شخصیسازی شده ایجاد کنند. راهاندازی چنین محصولاتی سبب شده تا این استارتاپ در سالهای متمادی جزو برترین استارتاپهای دنیا باشد.
کیوان مهاجر کیست؟
کیوان مهاجر، مدیرعامل و بنیانگذار ایرانی-کانادایی استارتاپ soundhound است. او در رشته مهندسی برق از دانشگاه استنفورد فارغالتحصیل شده است و دوره کارشناسی ارشد خود را در رشته مهندسی برق و علوم کاربردی از دانشگاه تورنتو گذراند. مقطع دکتری خود را نیز در همین رشته به پایان رساند. البته soundhound اولین تجربه او در دنیای استارتاپها نبود. او در مصاحبهای با پژمان نوزاد، سرمایهدار ایرانی-آمریکایی اعلام کرده که وقتی کمتر از ۱۰ سال داشته یک کسبوکار راهاندازی کرده است. مهاجر در این مورد میگوید: «در ایران یک زمین بازی بود که بعدازظهرها شلوغ میشد. اگر واحد پول را دلار در نظر بگیریم، من مثلا اندازه یک دلار خمیر نان میخریدم. آن خمیر را به ۱۰۰ قسمت کوچک تقسیم میکردم و جلوی بچهها آن خمیرها را میپختم و میفروختم.»
مهاجر ادامه داد: «ارزشی که من ایجاد کردم این بود که بچهها از نان داغ و تازه لذت میبردند. بچهها همچنین معامله کردن را تجربه میکردند. چون بچهها دوست دارند مثل بزرگسالان رفتار کنند. به همین خاطر برای آنها آسان است که از والدین خود پولی بگیرند و آن پول را با نان من عوض کنند.»
به گفته مهاجر هرروز او یک دلار خود را به هزار دلار تبدیل میکرد و سپس تصمیم گرفت فروش خود را بالا ببرد، مهاجر در این مورد میگوید: «من نان طعم لیمو ۲ دلاری و طعم شکلاتی ۳ دلاری را به لیست نانها اضافه کردم. من در سن پایین توانسته بودم یک کسبوکار راهاندازی کنم و یک ارزش ایجاد کرده بودم.»
البته عمر این کسبوکار کوتاه بود و خانواده مهاجر در سال ۱۹۹۵ به کانادا مهاجرت کردند. مهاجر دوران دبیرستان خود را در کانادا به پایان رساند و در دانشگاه تورنتو در رشته مهندسی مشغول به تحصیل شد: «بعد از پایان تحصیلم، ۳ شرکت راهاندازی کردم. در آنزمان من فارغالتحصیل شده بودم، تجربیاتی داشتم و حالا تصمیم گرفته بودم یک استارتاپ های-تک ایجاد کنم. استارتاپی که روی جهان تاثیر بسیاری بگذارد. من این تصمیم را گرفتم، اما باید تحصیلات تکمیلی خود را میگذراندم.»
پس مهاجر در سال ۲۰۰۰ تحصیلات خود را در استنفورد آغاز کرد و همچنین دنبال ایده برای استارتاپ خود بود. او همیشه این سوال را از خود میپرسید که در طول زندگی من چه اتفاقی میافتد که تأثیر زیادی در جهان خواهد داشت؟
برای پاسخ به این سوال، او فیلم «استارترک» را تماشا کرد. چون مهاجر یکی از طرفداران فیلمهای علمی- تخیلی است: «من فیلم استارترک را تماشا کردم. چند مفهوم در استارترک مطرح شد که در آنزمان وجود نداشتند. اول جابهجایی با سرعت بیشتر از سرعت نور، دورنوردی (Teleportation )، هولوگرام، همانندسازی (Replicators) و هوش مصنوعی صوتی. این موضوع برای ۲۰ سال پیش است و من در آنزمان فکر کردم چیزی که مطمئنا در طول زندگی من میبینم، هوش مصنوعی صوتی بود.»
مهاجر معتقد است در فیلمهای علمی-تخیلی مردم با روباتها و کامیپوترها صحبت میکردند و آنها هم پاسخ میدادند و این موضوع خیلی طبیعی بود، پس در واقعیت هم میتوان چنین چیزی را عملی کرد. پس او با راهاندازی soundhound به حوزه صدا و هوش مصنوعی وارد شد.
Sounhound چه کار میکند؟
مهاجر پیش از soundhound، چند شرکت راهاندازی کرده بود. یکی از این کسبوکارها میدومی (MIDOMI) موتور جستوجو ویژه آهنگ بود. این موتور جستوجو براساس زمزمه و صدای خواننده، نام آهنگ، نام خواننده و کلمات کلیدی مرتبط آهنگ مورد نظر کاربر را پیدا میکند.
اما در سال ۲۰۰۹، کیوان مهاجر تصمیم گرفت میدومی را به soundhound تغییر برند دهد. هرچند که بعد از این تغییر، میدومی در نسخه وب midomi.com در دسترس است.
هماکنون soundhoud متشکل از تیم متنوعی از مهندسان، طراحان UX/UI، نویسندگان، دانشمندان داده و زبانشناسان است.
وقتی به سایت این شرکت وارد میشوید، اولین چیزی که به چشم میخورد این جمله است: «ما معتقدیم هر برندی باید صدایی داشته باشد و هرکسی بتواند با دستگاههای اطراف خود به وسیله صحبتکردن ارتباط برقرار کند.»
به همین دلیل شرکت soundhound، پلتفرم مستقل هوش مصنوعی Houndify، را ایجاد کرد تا برندها دستیارهای صوتی سفارشی ایجاد کنند.
اگر شما همچنین به بخش محصولات این شرکت مراجعه کنید با لیستی از پلتفرمها و اپلکیشنها روبرو میشوید؛ مانند اپلیکیشن تشخیص آهنگ sounhound، پلتفرم تبدیل متن به گفتار، دستیار صوتی دریافت سفارشهای رستوران، بستر ابری، تفسیر زبانهای طبیعی (NLU)، دستیار صوتی برای گوشیها و … .
دستیار صوتی Hound همچنین با برندهایی مانند بنز، هیوندای، دویچه تلکام و پاندو همکاریهای مشترکی را آغاز کرد.
در سال ۱۴۰۱ هم الجی الکترونیکس تفاهمنامهای را با این شرکت امضا کرد تا به طور مشترک فناوری پیشرفته هوش مصنوعی صوتی را برای آینده تولید سیستمهای اطلاعات سرگرمی داخل خودرو (IVI) توسعه دهند.
نحوه مواجه با رقبای بزرگ
در حوزهای که کیوان مهاجر فعالیت میکند، بازیگران بسیاری حضور دارند و soundhound باید در این زمینه ارزشافزودهای داشته باشد تا کاربران را جذب کند. کیوان مهاجر در مورد اینکه به چهصورت از رقبا پیشی گرفته است، میگوید: «در قدم اول نباید بترسید. اگر به چیزی علاقه دارید و به آن متعهد هستید، نترسید. حتی آن غولهای بزرگ هم روزی کوچک بودند. بعد مطمئن باش که افرادی را استخدام میکنی که نمیترسند و همراه تو هستند.»
مهاجر و همکارانش نمیخواستند در این بازار بازیگران وابستهای باشند، بلکه قصد داشتند تکنولوژی پیشرفتهتری نسبت به رقبای قوی خود ارائه دهند: «به همین خاطر ۱۰ سال طول کشید تا به ثبات برسیم. چون در ۶ سال اول فعالیتمان ما مدام شکست میخوردیم. اما ما به تلاش خود ادامه دادیم و بالاخره در سال ۲۰۱۵ به تکنولوژی بسیار خاصی دست پیدا کردیم و از آن رونمایی کردیم. حتی بعد چندسال هم هنوز غولهای این حوزه نتوانستند به چنین چیزی دست پیدا کنند.»
او درمورد اینکه آن تکنولوژی خاص چیست، ادامه داد: «وقتی ما آدمها با هم صحبت میکنیم، مکالماتمان پیچیده است؛ اما وقتی با کامپیوتر صحبت میکنیم، یاد گرفتیم توقعات خود را از این دستگاه پایین بیاوریم. چرا؟ چون کامپیوتر در درک زبان طبیعی محدودیت دارد. ما قصد داشتیم این محدودیت را برطرف کنیم.»
چشمانداز کیوان مهاجر این بود تا این محدودیت زبانی را برطرف کند و مکالمه انسانها با کامپیوتر هم پیچیده شود: «اگر از سیری، گوگل یا دستیاران دیگر بپرسید: «رستورانها به استثنای رستوران چینی را به من نشان بده»، معمولاً همه آنها به این صورت پاسخ میدهند؛ «در اینجا چند رستوران چینی وجود دارد.». به خاطر اینکه آنها با کلمات کلیدی چینی و رستوران خود را مطابقت دادند؛ اما با تکنولوژی ما، شما می توانید بسیار پیچیدهتر با کامپیوتر صحبت کنید.»
آینده soundhound در سال ۲۰۲۴
براساس گزارش USA TODAY این استارتاپ ادعا کرده است که «معدل درآمد قبل از بهره، مالیات و استهلاک» (EBITDA) آن مثبت شده است، اما این شرکت در اولین حضور عمومی خود ۱۰ درصد از کارکنانش را اخراج کرد. بعد در اوایل سال ۲۰۲۳ نیمی دیگر از کارکنان خود را تعلیق کرد.» حالا این سوال پیش میآید soundhound در سال ۲۰۲۴ چه سرنوشتی خواهد داشت؟
USA TODAY در گزارش خود به این سوال پاسخ داده است: «تحلیلگران انتظار دارند در کل سال ۲۰۲۴ درآمد SoundHound پنجاه درصد افزایش پیدا کند و به ۴۷ میلیون دلار برسد. به این صورت ضرر EBITDA تعدیل شده از ۷۳ میلیون دلار به ۳۳ میلیون دلار کاهش پیدا میکند.»
براساس این گزارش کیوان مهاجر، مدیرعامل هم پیشبینی کرده است که مدلهای زبان جدید SoundHound در حال گسترش هستند. به این صورت این پلتفرم قادر خواهد بود همزمان با توسعه بازار هوش مصنوعی به موفقیتهای خوبی دست پیدا کند.