گنجی به نام بیگدیتا
بیگدیتا یا کلانداده چیست و چه اهمیتی دارد؟ این سؤال ساده و کوتاه ناظر بر بحثی است که در خود دنیایی از اطلاعات، جزئیات و اهمیت را دارد. مسئلهای که به تعبیری از آن بهعنوان منبع اصلی قدرت و ثروت در آینده یاد میشود. در مطلب پیشرو با صادق عباسیشاهكوه، رئيس دانشكده پست و مخابرات درباره همین مسئله به گفتوگو نشستهایم.
بیگدیتا یا کلانداده به زبان ساده به چه معناست و چه اهمیتی دارد؟
همه ما بهعنوان کاربران اینترنت هر روز، حجمی از دیتا را در فضای وب تولید میکنیم. چه آنهایی که در اینستاگرام عکس و فیلم میگذارند و چه آن کسی که در پیامرسانها چت میکند و پیام صوتی میگذارد و حتی کسی که یک سرچ ساده در گوگل و... انجام میدهد. همه رد پای ما در اینترنت به معنی مستقیم ایجاد و تولید دیتاست. اینگونه هم نیست که فقط قشر خاصی مشغول ایجاد دیتا باشند، الان میتوان گفت همه دیتا تولید میکنند و حجمش هم مدام زياد میشود. برآوردهایی وجود دارد که هر دو سال یک بار، حجم دیتای تولیدشده دو برابر میشود. پیشبینیها برای سال 2020 اینگونه بود که دیتای تولیدی بشر در این سال به بیش از 40 هزار اگزابایت میرسد. اگزابایت چیست؟ هر هزار گیگابایت، یک ترابایت میشود. هر هزار ترابایت یک پتابایت میشود و هر هزار برابر آن اگزابایت میشود، یعنی 10 به توان 18؛ یعنی اگر جمعیت جهان را حدود هفت، هشت میلیارد در نظر بگیریم، در سال 2020 به طور متوسط، هر آدمی به طور سرانه، حدود پنج ترابایت دیتا تولید کرده است. از آن طرف سرعت انتقال دیتا هم مدام بالا میرود و تنوع آن نیز بیشتر میشود. دیتای عظیمی هم به این شکل ایجاد شده که هر
فردي در دنیا که گوشی هوشمند دستش است، الان کجاست. این دیتاها، دیتاهای باارزشی هستند. بنابراین به مجموعه دادههایی که همینطور تولید و بیشتر میشود، بیگدیتا یا کلانداده میگویند. حجم، سرعت و تنوعش خیلی بیشتر از چیزی است که در طول تاریخ و در گذشته بوده و گفتیم دو سال یک بار هم دو برابر میشود. حالا پرسش این است که این دیتا چه ارزشی میتواند داشته باشد. نمونه خیلی ساده آن که همه با آن درگیر هستند، یک پردازش ساده از دیتای تردد آدمهاست که مثلا میشود با آن فهمید الان فلان خیابان، ترافیک است. این از پردازش دادههای مکانی درمیآید. پردازش هوشمندانه یک تکه از این دادهها به ما میگوید کجا ترافیک است و این مسیر را نرو، این مسیر را برو. خیلیها معتقد هستند در آینده، دیتاست که ثروت بزرگ به حساب میآید و بیش از نفت میارزد. در سطح جهانی، چند میلیارد انسان در شبکههای اجتماعی هستند و دائم اطلاعات ردوبدل میکنند. از روی این اطلاعات، اگر آنها را پردازش کنیم با روشهایی که روزبهروز توسعه پیدا میکند، میتوانیم اطلاعاتی را استخراج کنیم. دیتاها اگر رویهمریخته باشند، شاید بهتنهایی، فایده نداشته باشند. اگر این اطلاعات
را استخراج کنیم، آن موقع خیلی باارزش میشوند. آن موقع میتوانیم بفهمیم که مثلا گرایش بازار به فلان محصول بیشتر است. این به درد کسی میخورد که تجارت میکند. پس اگر این محصول را برای این جامعه ببرم، مشتری دارد، چون گرایش وجود دارد. این رنگ لباس، الان در شبکههای اجتماعی محبوب است. این لباس و مد، خیلی توسعه پیدا میکند. کسی که تولیدکننده است به آن سمت میرود. یا مثلا حتی در مباحث سیاسی میتواند منشأ تأثیرات و تصمیمات بزرگی شود.
به لحاظ سیاسی بیگدیتا چه اهمیت و ارزشی میتواند داشته باشد؟
براساس آن میتوان فهمید گرایش به فلان گروه یا شخص، چه زماني زیاد یا کم میشود. میتوان حتی روی آنها کار کرد یا در جاهایی میتوان اثرگذاری هم کرد. میتوان با ایجاد دیتا و اخبار، حتی به افکار عمومی جهت و مسیر داد. بنابراین، اینها میتواند اطلاعات خیلی باارزشی باشد. برخی با اینها تجارت و خرید و فروش میکنند، آنها که اهل آنالیز هستند و کسانی که کار اقتصادی دارند، از میان این اطلاعات به کسبوکار خود شکل میدهند. بنابراین ارزش اقتصادی خیلی بالایی نیز دارد. البته مسائل منفی هم در کنار اینها هست. بحثهای حریم خصوصی و امنیت هم در اینجا مطرح است که آن هم زاویه دیگر کار است. خود آن باز حجم زیادی از کار و اشتغال را میطلبد که امنیت اینها را خوب فراهم کنند و پردازش اینها که دنیای دیگری است. موتور محرکهاش این است که هوش مصنوعی را بهوجود آوریم که بتوانیم از دیتاهای موجود اطلاعات استخراج کنیم.
گفته میشود بخش عمده دیتا و کلیت اینترنت در دست کشوری مثل آمریکاست و ما هم مصرفکننده اینترنت هستیم، آیا کشوری مثل ما هم میتواند بیگدیتا را در داخل برای خودش داشته باشد؟
همه کشورها الان به این سمت رفتهاند. برخی شرکتها در دنیا هستند- به قول شما بیشتر شرکتهای بزرگ هم در آمریکا هستند- كه دیتای کل دنیا را به نوعی در خود جمع کردهاند. گوگل، حاکم بر حجم زیادی از دیتا و اطلاعات همه مردم دنیا شده است. گوگل الان با تقریب بالایی میداند هر کاربر اینترنت چه چیزی میخورد، چه چیزی میپوشد. با سرچی که میکنید، میفهمد گرایش شما به کدام سمت است. میلیونها انسان در طول روز، همینطور سرچ كرده و این اطلاعات را به نحوی به گوگل وارد میکنند. این ثروت هم دست آنهاست. الان کشورها غالبا به این سمت رفتهاند که کاری کنند این حجم اطلاعات مربوط به مردم خودشان، دست خودشان باشد. اگر هم قرار است از درونش استخراج و منفعتی کسب کنیم، اقتصادی را شکل دهیم، همه را مفت و مجانی در اختیار خارجیها قرار ندهیم. این مباحثی است که در کشور ما هم مطرح است و واقعا هم ارزش کارکردن دارد. در چند سال اخیر، اپلیکیشنهایی که داخل ایران بهوجود آمد، خیلیهاشان کسبوکارهای بزرگی راه انداختند. همین کسبوکارهای تاکسی که واقعا رشد خوبی در آن داشتیم، در دنیا هم نمونهاش وجود دارد. همین اطلاعاتی که از مردم دارند، چقدر اطلاعات
باارزشی است. اگر اینها داخل ایران تولید نمیشد، به خارج از ایران میرفت. این همان بحثهایی است که مطرح است تا اطلاعات را بهراحتی در اختیار دیگران قرار ندهیم. من جنبههای دیگرش را نمیگویم. تنها جنبه اقتصادی آن را در نظر بگیرید، انگار ثروت هنگفتی در داخل کشور است که باید تلاش کنیم مردم خودمان روی اینها کسبوکار، استخراج و بهرهبرداری کنند.
مسئله بیگدیتا از چه زمانی برای مردم یا مسئولان کشورها و مشخصا کشور ما مهم شده است؟
از زمانی که دیتا زیاد شد. به چند سال اخیر که نگاه کنید، قبل از آنکه نسل سه و چهار اینترنت را داشته باشیم، خود شما هم با این مسئله روبهرو نمیشدید. حتي قبل از اینکه شبکههای اجتماعی اینقدر توسعه پیدا کنند، خیلی بحث حجم دیتا مطرح نبود. همین الان که دوری در اینستاگرام میزنید، میتوانید بفهمید امروز بین مردم چه موضوعی مهم بوده است، بدون اینکه کسی را دیده باشید. حتي راجع به عکسهایی که میگذارند، میتوان فهمید چطور لباسهایی مد میشوند. با گشت و گذار ساده در اینستاگرام انگار کل کشور را دور زدهاید. از زمانی که نسل سه و چهار آمد و ارتباط دیتايي زیاد شد، بهخصوص بهخاطر اینکه شبکههای اجتماعی بهوجود آمد و دیتا فراوان شد، خود به خود با بحث اینکه چطور از این همه دیتا بهرهبرداری و آنها را سازماندهی کنیم، بحث بیگدیتا هم پیش آمد.
در کشور خودمان ایران، مشخصا برای ذخیرهسازی، مدیریت یا هر هدف دیگری که هست، چه اقداماتی انجام شده است؟ از چه زمانی شروع شده و الان کجای کار هستیم؟
در چند سال اخیر، کارهایی در این زمینه انجام شده است. بحثهایی مطرح بود که تلاش کنیم میزبانی دادههای ما در خارج از ایران نباشد. قبلا اطلاعات ما همه در خارج از ایران میزبانی میشد ولی الان خوشبختانه خیلیهایش داخل ایران میزبانی میشود. این چند حسن دارد. یکی اینکه اطلاعات مردم خودمان در داخل کشور خودمان است. ثانیا تبادلش با سرعت و کیفیت بیشتر است. ممکن است از شما اطلاعاتی میخواستم، اطلاعات شما به خارج از ایران میرفت، از آنجا دور میزد و میآمد تا من دریافت کنم. در حالی که ما به هم نزدیک هستیم و سرعت و کیفیت در داخل کشور میتواند بچرخد. اطلاعات در داخل کشور میماند. اگر اتفاقی در جای دیگری از دنیا بیفتد، دیتای من از بین نمیرود. البته لازم است آنچه در داخل ایران هم نگهداری میشود، این است که کیفیت و امکانات ما هم بالا رود تا از داخل ضربه نخوریم. البته این چند سال روی اینها کار شده است. الان شبکه ابری داریم که در سطح جهانی، سرویسدهی میکند و این چندساله بهوجود آمد. یا دیتاسنترهایی در داخل داریم که بخش زیادی از دیتاهای مردم روی آنها و همینجا نگهداری میشود. البته در زمینه دیتاسنتر، هنوز کار زیادی داریم.
تلاش وزارت ارتباطات و بخشهای مختلف این است که این نقطه ضعف را هم بیشتر برطرف کنیم تا اینها را در داخل داشته باشیم. خیلی از اپلیکیشنها در اين زمينه واقعا پیشرفت کردهاند. الان نمونه ایرانی بسیاری از اپلیکیشنهای جهانی را داریم. این واقعا باعث خوشحالی است که خیلی از دیتاها در داخل میماند. حتی نقشهخوانهای ایرانی در داخل وجود دارند و کار میکنند که برخی امکانات آنها از سرویسهای نقشهخوانی بزرگ جهانی هم بهتر است. وقتی داخلی میشود، خوبیاش این است که اگر نقطه ضعفی باشد، به برنامهنویسانی که در داخل کشور هستند میگویید این را هم اضافه کن. مثلا در سرویسهای نقشه دنیا، سرعتگیر نیست. اما در نقشه داخلی ما، حتی سرعتگیرها را هم میگذارد. خوشبختانه همین الان 300، 400 هزار اپلیکیشن ایرانی موجود است و مردم از آنها استفاده میکنند. از این لحاظ خیلی خوب کار شده اما جا برای کار همچنان بالاست، چراکه وقتی میگوییم رشد دیتا هر دو سال یک بار دو برابر میشود، یعنی ما هم باید تلاشمان را به همین نسبت بیشتر کنیم.
سرعت پیشرفت یا رشد ما نسبت به سرعتی که در حوزه واقعی اتفاق میافتد، برابر است یا نه؟ آیا به آن میرسیم؟ مثلا سرعت رشد اپلیکیشنها و مصرف مردم، سرعت خیرهکنندهای دارد.
سرعت رشد بهرهبرداری مردم کشور ما از متوسط دنیا هم بالاتر است. مردم ایران در این زمینه خیلی پذیرش بالایی دارند. از زمانی که نسل سه و چهار در سال 93 آمد، خودمان که درگیر کار بودیم، در بهترین حالت فکر میکردیم در یک سال 10 میلیون گوشی هوشمند دست مردم باشد. اما یک سال بعد که سنجش کردیم، دیدیم بالای 20 میلیون است. یعنی مردم خیلی بیشتر از آن چیزی که ما فکر میکنیم، پذیرش دارند و واقعا در این زمینهها علاقهمند هستند. استفاده خوبی هم میکنند. تراکنشهای مالی که در ایران بهصورت اینترنتی انجام میشود و روی موبایل، مطمئنا در دنیا جزء بالاترینهاست. با این شدت و با اینکه مردم دیر وارد آن شدند، اما همه کارها و تراکنش مالی خود را در اینترنت انجام میدهند و با حجم خیلی زیاد. رشد این چیزها در کشور ما خیلی بالاست. البته هنوز در جاهایی نقطه ضعف داریم، اما مثلا رشد ما در موبایل بسیار خوب بوده است. اینترنت موبایل نسل چهار را در همه شهرها تحت پوشش داریم. در خیلی از روستاها هم نسل چهار داریم. در خیلی از کشورها اینطور نیست که روستاها هم نسل چهار داشته باشند. ولی ما این را داریم.
اینکه گفتید در برخی حوزهها هنوز عقب هستیم را بیشتر توضیح دهید.
مثلا در ارتباطات اینترنت ثابت واقعا عقب هستیم، خیلی هم عقب هستیم اما وضعيتمان در اینترنت موبایل خیلی خوب است. اما همانطور که گفتم در اینترنت ثابت مقداری عقب هستیم. در سرویسهای ویدئویی عقب هستیم. بالاخره 70 درصد ترافیک و دیتا، ویدئو است. ولی همین دعواها و اختلافاتی که وجود دارد بر سر اینکه مجوز و اختیارش دست چه نهادی باشد، باعث شده در زمینه ویدئو هنوز مقداری عقب باشیم.
به نظر شما چشمانداز وضعیت چطور است. قبل از آن این را بگویید؛ بحث رقابت بر سر دادهها یا تسط بر آنها، موضوعی است که به تعبیر شما گاهی سیاسی هم شده است. چشمانداز این را چطور میبینید؟
این موضوع مهمی است که واقعا ضعفهایی در کشور ما دارد. اصطلاحا در دنیا به آن حاکمیت دیتا یا دیتاگاورمنس میگویند. الان تکلیف ما کاملا روشن نیست که حاکمیت بر دیتاها را چه کسی باید در دست بگیرد.
قانونش را نداریم یا ابزارش را؟
برای من که در این حوزه هستم، مشخص نیست که اینها را باید چه کسی ساماندهی کند. زمانی مطرح شد که شورای عالی فضای مجازی باید وارد این کار شود. اطلاع دارم تا جاهایی هم پیشنویسهایی تهیه شد تا اینها را تعیین تکلیف کنند. در آینده اگر «آیاوتی» یا اینترنت اشیا بیاید، دیتایی که تولید میشود خیلی بیشتر خواهد شد. فکر کنید یخچال یا ماشین لباسشویی ما قرار است به نت وصل شود و هر لحظه اطلاعاتی منتقل میکند. همه مردم میتوانند بفهمند من چه زمانی لباس میشویم، چه زمانی یخچال من پر یا خالی است. همه اینها اطلاعاتی است که جمعآوری آنها از عمق زندگی مردم شکل میگیرد. بحث امنیت اینها، حریم خصوصی، اینکه نحوه بهرهبرداری از آنها به چه شکلی باشد، بسیار مهم و حیاتی میشود. اما اگر حریم خصوصی را بشکند، همه جلوی آن خواهند ایستاد و جلویش را میگیرند. یا اگر امنیت مردم را از بین ببرد، جلوی آن را خواهند گرفت. بنابراین اگر در مورد اینها فکر نشود، بعدا گرفتاری خواهیم داشت. فکر کنید الان ویروسی در موبایل من باشد. ممکن است دو فایل من از بین برود، این مشکلی نیست. اما اگر فردا ویروسی وارد یخچال من شود، ممکن است باعث شود یخچال بسوزد. موضوع
خیلی جدیتر خواهد بود. بحث حاکمیت دیتا و حریم خصوصی و بحث امنیت اطلاعات، بسیار حیاتی است.
آیا الان در ایران برای اینها استراتژی و برنامه وجود دارد یا نه؟
بحثهای جستهگریختهای را میشنویم. شورای فضای مجازی در جایی بهوجود آمد برای حلوفصل همین مسائل. یعنی جایی که به نوعی فراقوهای است و همه در آن هستند و باید اینها را حل کنند. میدانم کارهایی را شروع کردهاند اما نیاز داریم زودتر به جمعبندی برسند. وگرنه اگر طول بكشد مانند قضیه ویدئو، به نقاطی میرسیم که بالاخره زمان را از دست میدهیم.
عقبماندگی را هم نمیتوان جبران کرد.
سرعت عمل لازم است. وگرنه ساختار نهادی آن الان وجود دارد. باید زودتر به نتیجه برسند.
مسئلهای که وجود دارد، این است که میانگین سن مدیریتی در کشور، سن بالایی است. از طرفی دانش اینها نسبت به دنیای تکنولوژی و فناوری از جنس حوزه آیتی و سایبر، خیلی پایین است. به نظرتان این چقدر روی این مسائل تأثیر گذاشته است؟
بیتأثیر نیست. خوشبختانه البته وزیر و میانگین سنی مدیران وزارتخانه ارتباطات جوان است.
فکر میکنم در فهماندن مسائل و اهمیت موضوعات به مدیران دیگر که سن و سالی داشته و دانش کمتری دارند، مؤثر است.
همینطور است. مسلما این حوزه، حوزه جوانی است. هر چه نیروهای جوان در اینجا باشند، بهروزتر و با سرعت بیشتری میتوانند تصمیمگیری کنند و این واقعا مهم است. جوانگرایی در جاهای دیگر هم مهم است اما در این حوزه بیشتر خودش را نشان میدهد و نقش دارد.
به نظرتان بیگدیتا بیشتر از چه لحاظی واجد اهمیت است؟ سیاسی، اقتصادی، امنیتی و...؟
ما بیگدیتا را بیشتر از منظر اقتصادی نگاه میکنیم. از دید ما که آدمهای فنی هستیم، بحث اقتصادی آن از هر چیزی مهمتر است. ولی همه ما میدانیم امنیت، بالاترین نیاز یک جامعه است و اگر امنیت تأمین نشود، خط بطلان روی همه اینها کشیده خواهد شد. بنابراین میتوان گفت مسائل امنیت و حریم خصوصی بالاترین درجه اهمیت را دارد. خودم اگر احساس کنم از دیتای من بهرهبرداری شود و منفعتی هم براساس آن به خود من میرسد اما در قبالش حریم خصوصیام شکسته میشود، میگویم نمیخواهم. بنابراین بحثهای عمده اهمیت آن، اقتصادی است ولی بحثهای امنیت و حریم خصوصی، حق وتو دارند. با این توجیه میتوان گفت آنها در رده بالاتری هستند که بحث حاکمیت و امنیت و حریم خصوصی آن باید ابتدا حل شود. بعد جا برای بهرهبرداری اقتصادی سالم باز خواهد شد.
به دلیل محدودیتها و فیلترینگی که در کشور وجود دارد، استفاده از فیلترشکن در ایران رواج زیادی دارد. برخی منتقدان معتقد هستند همین مسئله فیلترشکن باعث میشود بخشی از حجم مهم ترافیک داده خودمان را با این کار به خارج از کشور بفرستیم. نظر شما دراینباره چیست؟
این معضلی است که ما داریم و هزاران مشکل برای ما ایجاد میکند. یک مشکل آن همین است که شما اشاره کردید. بخشی از ترافیک ما بیدلیل به خارج از کشور منتقل میشود و این ضرر اقتصادی هم دارد.
به واسطه همین فیلترشکنها؟
بله. در درجه اول ضرر اقتصادی دارد که خیلی بد است. بحثهای امنیت هم در جای خود که خیلی مهم است. مهمتر اینکه برخی سرویسها عملا دچار مشکل میشوند. یکسری سرویسها مبتنی بر مکان هستند. میتوانید از روی موقعیت مکانی به تحلیلهایی برسید که خیلی به درد میخورند. اما کسی که فیلترشکن استفاده میکند، عملا مکانش گم میشود و این اطلاعات را ندارید. اگر هم دارید، غلط است. بنابراین خیلی از تحلیلها و کارها را نمیتوان انجام داد. این واقعا آسیبي است که متأسفانه در کشور ما وجود دارد.
در برخی کشورها مثل چین هم مشابه چنین چیزی وجود دارد.
بله، دو، سه کشور هستند که وضعیت مشابهی دارند.
چینیها البته نمونه داخلی هر پلتفرمی را آماده کردهاند.
فکر نمیکنم کاربران چینی مشابه فیلترشکنی را که ما میشناسیم و به این مقدار استفاده کنند. فیلترینگ آنها خیلی سختگیرانهتر است. البته جایگزینهایی برای خود درست کردهاند. اما فکر نمیکنم به این شکل فیلترشکن در جایی استفاده شود. بخشی از دیتا را عملا با این شرایط از دست میدهیم؛ به خاطر وجود فیلترشکن.
اینکه گفتید با فیلترشکن برای سرویسها اطلاعات را از دست میدهیم، بیشتر توضیح دهید.
مثلا در بحث لوکیشن یا اطلاعات مکانی. لوکیشن، اطلاعات خیلی باارزشی است. اینکه آدمها در کجا، کاری انجام میدهند. مثلا آدمهای فلان شهر، چه چیزی سرچ میکنند، از آن میتوانید ترندی را در آن شهر تشخیص دهید. اینها را با رعایت حریم خصوصی میگویم. از نظر نیاز آن شهر، نیاز آن منطقه، اطلاعاتی را میتوان به دولت داد تا برای آن برنامهریزی کند. از اینها میتوان اطلاعات کسب کرد. اما وقتی ویپیان استفاده شود، این اطلاعات گم میشود. اتفاقا اینها در بیگدیتا، مهمترین اطلاعات و بسيار باارزش هستند که با فیلترشکن عملا اینها را از دست ميدهيم.
بیگدیتا یا کلانداده چیست و چه اهمیتی دارد؟ این سؤال ساده و کوتاه ناظر بر بحثی است که در خود دنیایی از اطلاعات، جزئیات و اهمیت را دارد. مسئلهای که به تعبیری از آن بهعنوان منبع اصلی قدرت و ثروت در آینده یاد میشود. در مطلب پیشرو با صادق عباسیشاهكوه، رئيس دانشكده پست و مخابرات درباره همین مسئله به گفتوگو نشستهایم.
بیگدیتا یا کلانداده به زبان ساده به چه معناست و چه اهمیتی دارد؟
همه ما بهعنوان کاربران اینترنت هر روز، حجمی از دیتا را در فضای وب تولید میکنیم. چه آنهایی که در اینستاگرام عکس و فیلم میگذارند و چه آن کسی که در پیامرسانها چت میکند و پیام صوتی میگذارد و حتی کسی که یک سرچ ساده در گوگل و... انجام میدهد. همه رد پای ما در اینترنت به معنی مستقیم ایجاد و تولید دیتاست. اینگونه هم نیست که فقط قشر خاصی مشغول ایجاد دیتا باشند، الان میتوان گفت همه دیتا تولید میکنند و حجمش هم مدام زياد میشود. برآوردهایی وجود دارد که هر دو سال یک بار، حجم دیتای تولیدشده دو برابر میشود. پیشبینیها برای سال 2020 اینگونه بود که دیتای تولیدی بشر در این سال به بیش از 40 هزار اگزابایت میرسد. اگزابایت چیست؟ هر هزار گیگابایت، یک ترابایت میشود. هر هزار ترابایت یک پتابایت میشود و هر هزار برابر آن اگزابایت میشود، یعنی 10 به توان 18؛ یعنی اگر جمعیت جهان را حدود هفت، هشت میلیارد در نظر بگیریم، در سال 2020 به طور متوسط، هر آدمی به طور سرانه، حدود پنج ترابایت دیتا تولید کرده است. از آن طرف سرعت انتقال دیتا هم مدام بالا میرود و تنوع آن نیز بیشتر میشود. دیتای عظیمی هم به این شکل ایجاد شده که هر
فردي در دنیا که گوشی هوشمند دستش است، الان کجاست. این دیتاها، دیتاهای باارزشی هستند. بنابراین به مجموعه دادههایی که همینطور تولید و بیشتر میشود، بیگدیتا یا کلانداده میگویند. حجم، سرعت و تنوعش خیلی بیشتر از چیزی است که در طول تاریخ و در گذشته بوده و گفتیم دو سال یک بار هم دو برابر میشود. حالا پرسش این است که این دیتا چه ارزشی میتواند داشته باشد. نمونه خیلی ساده آن که همه با آن درگیر هستند، یک پردازش ساده از دیتای تردد آدمهاست که مثلا میشود با آن فهمید الان فلان خیابان، ترافیک است. این از پردازش دادههای مکانی درمیآید. پردازش هوشمندانه یک تکه از این دادهها به ما میگوید کجا ترافیک است و این مسیر را نرو، این مسیر را برو. خیلیها معتقد هستند در آینده، دیتاست که ثروت بزرگ به حساب میآید و بیش از نفت میارزد. در سطح جهانی، چند میلیارد انسان در شبکههای اجتماعی هستند و دائم اطلاعات ردوبدل میکنند. از روی این اطلاعات، اگر آنها را پردازش کنیم با روشهایی که روزبهروز توسعه پیدا میکند، میتوانیم اطلاعاتی را استخراج کنیم. دیتاها اگر رویهمریخته باشند، شاید بهتنهایی، فایده نداشته باشند. اگر این اطلاعات
را استخراج کنیم، آن موقع خیلی باارزش میشوند. آن موقع میتوانیم بفهمیم که مثلا گرایش بازار به فلان محصول بیشتر است. این به درد کسی میخورد که تجارت میکند. پس اگر این محصول را برای این جامعه ببرم، مشتری دارد، چون گرایش وجود دارد. این رنگ لباس، الان در شبکههای اجتماعی محبوب است. این لباس و مد، خیلی توسعه پیدا میکند. کسی که تولیدکننده است به آن سمت میرود. یا مثلا حتی در مباحث سیاسی میتواند منشأ تأثیرات و تصمیمات بزرگی شود.
به لحاظ سیاسی بیگدیتا چه اهمیت و ارزشی میتواند داشته باشد؟
براساس آن میتوان فهمید گرایش به فلان گروه یا شخص، چه زماني زیاد یا کم میشود. میتوان حتی روی آنها کار کرد یا در جاهایی میتوان اثرگذاری هم کرد. میتوان با ایجاد دیتا و اخبار، حتی به افکار عمومی جهت و مسیر داد. بنابراین، اینها میتواند اطلاعات خیلی باارزشی باشد. برخی با اینها تجارت و خرید و فروش میکنند، آنها که اهل آنالیز هستند و کسانی که کار اقتصادی دارند، از میان این اطلاعات به کسبوکار خود شکل میدهند. بنابراین ارزش اقتصادی خیلی بالایی نیز دارد. البته مسائل منفی هم در کنار اینها هست. بحثهای حریم خصوصی و امنیت هم در اینجا مطرح است که آن هم زاویه دیگر کار است. خود آن باز حجم زیادی از کار و اشتغال را میطلبد که امنیت اینها را خوب فراهم کنند و پردازش اینها که دنیای دیگری است. موتور محرکهاش این است که هوش مصنوعی را بهوجود آوریم که بتوانیم از دیتاهای موجود اطلاعات استخراج کنیم.
گفته میشود بخش عمده دیتا و کلیت اینترنت در دست کشوری مثل آمریکاست و ما هم مصرفکننده اینترنت هستیم، آیا کشوری مثل ما هم میتواند بیگدیتا را در داخل برای خودش داشته باشد؟
همه کشورها الان به این سمت رفتهاند. برخی شرکتها در دنیا هستند- به قول شما بیشتر شرکتهای بزرگ هم در آمریکا هستند- كه دیتای کل دنیا را به نوعی در خود جمع کردهاند. گوگل، حاکم بر حجم زیادی از دیتا و اطلاعات همه مردم دنیا شده است. گوگل الان با تقریب بالایی میداند هر کاربر اینترنت چه چیزی میخورد، چه چیزی میپوشد. با سرچی که میکنید، میفهمد گرایش شما به کدام سمت است. میلیونها انسان در طول روز، همینطور سرچ كرده و این اطلاعات را به نحوی به گوگل وارد میکنند. این ثروت هم دست آنهاست. الان کشورها غالبا به این سمت رفتهاند که کاری کنند این حجم اطلاعات مربوط به مردم خودشان، دست خودشان باشد. اگر هم قرار است از درونش استخراج و منفعتی کسب کنیم، اقتصادی را شکل دهیم، همه را مفت و مجانی در اختیار خارجیها قرار ندهیم. این مباحثی است که در کشور ما هم مطرح است و واقعا هم ارزش کارکردن دارد. در چند سال اخیر، اپلیکیشنهایی که داخل ایران بهوجود آمد، خیلیهاشان کسبوکارهای بزرگی راه انداختند. همین کسبوکارهای تاکسی که واقعا رشد خوبی در آن داشتیم، در دنیا هم نمونهاش وجود دارد. همین اطلاعاتی که از مردم دارند، چقدر اطلاعات
باارزشی است. اگر اینها داخل ایران تولید نمیشد، به خارج از ایران میرفت. این همان بحثهایی است که مطرح است تا اطلاعات را بهراحتی در اختیار دیگران قرار ندهیم. من جنبههای دیگرش را نمیگویم. تنها جنبه اقتصادی آن را در نظر بگیرید، انگار ثروت هنگفتی در داخل کشور است که باید تلاش کنیم مردم خودمان روی اینها کسبوکار، استخراج و بهرهبرداری کنند.
مسئله بیگدیتا از چه زمانی برای مردم یا مسئولان کشورها و مشخصا کشور ما مهم شده است؟
از زمانی که دیتا زیاد شد. به چند سال اخیر که نگاه کنید، قبل از آنکه نسل سه و چهار اینترنت را داشته باشیم، خود شما هم با این مسئله روبهرو نمیشدید. حتي قبل از اینکه شبکههای اجتماعی اینقدر توسعه پیدا کنند، خیلی بحث حجم دیتا مطرح نبود. همین الان که دوری در اینستاگرام میزنید، میتوانید بفهمید امروز بین مردم چه موضوعی مهم بوده است، بدون اینکه کسی را دیده باشید. حتي راجع به عکسهایی که میگذارند، میتوان فهمید چطور لباسهایی مد میشوند. با گشت و گذار ساده در اینستاگرام انگار کل کشور را دور زدهاید. از زمانی که نسل سه و چهار آمد و ارتباط دیتايي زیاد شد، بهخصوص بهخاطر اینکه شبکههای اجتماعی بهوجود آمد و دیتا فراوان شد، خود به خود با بحث اینکه چطور از این همه دیتا بهرهبرداری و آنها را سازماندهی کنیم، بحث بیگدیتا هم پیش آمد.
در کشور خودمان ایران، مشخصا برای ذخیرهسازی، مدیریت یا هر هدف دیگری که هست، چه اقداماتی انجام شده است؟ از چه زمانی شروع شده و الان کجای کار هستیم؟
در چند سال اخیر، کارهایی در این زمینه انجام شده است. بحثهایی مطرح بود که تلاش کنیم میزبانی دادههای ما در خارج از ایران نباشد. قبلا اطلاعات ما همه در خارج از ایران میزبانی میشد ولی الان خوشبختانه خیلیهایش داخل ایران میزبانی میشود. این چند حسن دارد. یکی اینکه اطلاعات مردم خودمان در داخل کشور خودمان است. ثانیا تبادلش با سرعت و کیفیت بیشتر است. ممکن است از شما اطلاعاتی میخواستم، اطلاعات شما به خارج از ایران میرفت، از آنجا دور میزد و میآمد تا من دریافت کنم. در حالی که ما به هم نزدیک هستیم و سرعت و کیفیت در داخل کشور میتواند بچرخد. اطلاعات در داخل کشور میماند. اگر اتفاقی در جای دیگری از دنیا بیفتد، دیتای من از بین نمیرود. البته لازم است آنچه در داخل ایران هم نگهداری میشود، این است که کیفیت و امکانات ما هم بالا رود تا از داخل ضربه نخوریم. البته این چند سال روی اینها کار شده است. الان شبکه ابری داریم که در سطح جهانی، سرویسدهی میکند و این چندساله بهوجود آمد. یا دیتاسنترهایی در داخل داریم که بخش زیادی از دیتاهای مردم روی آنها و همینجا نگهداری میشود. البته در زمینه دیتاسنتر، هنوز کار زیادی داریم.
تلاش وزارت ارتباطات و بخشهای مختلف این است که این نقطه ضعف را هم بیشتر برطرف کنیم تا اینها را در داخل داشته باشیم. خیلی از اپلیکیشنها در اين زمينه واقعا پیشرفت کردهاند. الان نمونه ایرانی بسیاری از اپلیکیشنهای جهانی را داریم. این واقعا باعث خوشحالی است که خیلی از دیتاها در داخل میماند. حتی نقشهخوانهای ایرانی در داخل وجود دارند و کار میکنند که برخی امکانات آنها از سرویسهای نقشهخوانی بزرگ جهانی هم بهتر است. وقتی داخلی میشود، خوبیاش این است که اگر نقطه ضعفی باشد، به برنامهنویسانی که در داخل کشور هستند میگویید این را هم اضافه کن. مثلا در سرویسهای نقشه دنیا، سرعتگیر نیست. اما در نقشه داخلی ما، حتی سرعتگیرها را هم میگذارد. خوشبختانه همین الان 300، 400 هزار اپلیکیشن ایرانی موجود است و مردم از آنها استفاده میکنند. از این لحاظ خیلی خوب کار شده اما جا برای کار همچنان بالاست، چراکه وقتی میگوییم رشد دیتا هر دو سال یک بار دو برابر میشود، یعنی ما هم باید تلاشمان را به همین نسبت بیشتر کنیم.
سرعت پیشرفت یا رشد ما نسبت به سرعتی که در حوزه واقعی اتفاق میافتد، برابر است یا نه؟ آیا به آن میرسیم؟ مثلا سرعت رشد اپلیکیشنها و مصرف مردم، سرعت خیرهکنندهای دارد.
سرعت رشد بهرهبرداری مردم کشور ما از متوسط دنیا هم بالاتر است. مردم ایران در این زمینه خیلی پذیرش بالایی دارند. از زمانی که نسل سه و چهار در سال 93 آمد، خودمان که درگیر کار بودیم، در بهترین حالت فکر میکردیم در یک سال 10 میلیون گوشی هوشمند دست مردم باشد. اما یک سال بعد که سنجش کردیم، دیدیم بالای 20 میلیون است. یعنی مردم خیلی بیشتر از آن چیزی که ما فکر میکنیم، پذیرش دارند و واقعا در این زمینهها علاقهمند هستند. استفاده خوبی هم میکنند. تراکنشهای مالی که در ایران بهصورت اینترنتی انجام میشود و روی موبایل، مطمئنا در دنیا جزء بالاترینهاست. با این شدت و با اینکه مردم دیر وارد آن شدند، اما همه کارها و تراکنش مالی خود را در اینترنت انجام میدهند و با حجم خیلی زیاد. رشد این چیزها در کشور ما خیلی بالاست. البته هنوز در جاهایی نقطه ضعف داریم، اما مثلا رشد ما در موبایل بسیار خوب بوده است. اینترنت موبایل نسل چهار را در همه شهرها تحت پوشش داریم. در خیلی از روستاها هم نسل چهار داریم. در خیلی از کشورها اینطور نیست که روستاها هم نسل چهار داشته باشند. ولی ما این را داریم.
اینکه گفتید در برخی حوزهها هنوز عقب هستیم را بیشتر توضیح دهید.
مثلا در ارتباطات اینترنت ثابت واقعا عقب هستیم، خیلی هم عقب هستیم اما وضعيتمان در اینترنت موبایل خیلی خوب است. اما همانطور که گفتم در اینترنت ثابت مقداری عقب هستیم. در سرویسهای ویدئویی عقب هستیم. بالاخره 70 درصد ترافیک و دیتا، ویدئو است. ولی همین دعواها و اختلافاتی که وجود دارد بر سر اینکه مجوز و اختیارش دست چه نهادی باشد، باعث شده در زمینه ویدئو هنوز مقداری عقب باشیم.
به نظر شما چشمانداز وضعیت چطور است. قبل از آن این را بگویید؛ بحث رقابت بر سر دادهها یا تسط بر آنها، موضوعی است که به تعبیر شما گاهی سیاسی هم شده است. چشمانداز این را چطور میبینید؟
این موضوع مهمی است که واقعا ضعفهایی در کشور ما دارد. اصطلاحا در دنیا به آن حاکمیت دیتا یا دیتاگاورمنس میگویند. الان تکلیف ما کاملا روشن نیست که حاکمیت بر دیتاها را چه کسی باید در دست بگیرد.
قانونش را نداریم یا ابزارش را؟
برای من که در این حوزه هستم، مشخص نیست که اینها را باید چه کسی ساماندهی کند. زمانی مطرح شد که شورای عالی فضای مجازی باید وارد این کار شود. اطلاع دارم تا جاهایی هم پیشنویسهایی تهیه شد تا اینها را تعیین تکلیف کنند. در آینده اگر «آیاوتی» یا اینترنت اشیا بیاید، دیتایی که تولید میشود خیلی بیشتر خواهد شد. فکر کنید یخچال یا ماشین لباسشویی ما قرار است به نت وصل شود و هر لحظه اطلاعاتی منتقل میکند. همه مردم میتوانند بفهمند من چه زمانی لباس میشویم، چه زمانی یخچال من پر یا خالی است. همه اینها اطلاعاتی است که جمعآوری آنها از عمق زندگی مردم شکل میگیرد. بحث امنیت اینها، حریم خصوصی، اینکه نحوه بهرهبرداری از آنها به چه شکلی باشد، بسیار مهم و حیاتی میشود. اما اگر حریم خصوصی را بشکند، همه جلوی آن خواهند ایستاد و جلویش را میگیرند. یا اگر امنیت مردم را از بین ببرد، جلوی آن را خواهند گرفت. بنابراین اگر در مورد اینها فکر نشود، بعدا گرفتاری خواهیم داشت. فکر کنید الان ویروسی در موبایل من باشد. ممکن است دو فایل من از بین برود، این مشکلی نیست. اما اگر فردا ویروسی وارد یخچال من شود، ممکن است باعث شود یخچال بسوزد. موضوع
خیلی جدیتر خواهد بود. بحث حاکمیت دیتا و حریم خصوصی و بحث امنیت اطلاعات، بسیار حیاتی است.
آیا الان در ایران برای اینها استراتژی و برنامه وجود دارد یا نه؟
بحثهای جستهگریختهای را میشنویم. شورای فضای مجازی در جایی بهوجود آمد برای حلوفصل همین مسائل. یعنی جایی که به نوعی فراقوهای است و همه در آن هستند و باید اینها را حل کنند. میدانم کارهایی را شروع کردهاند اما نیاز داریم زودتر به جمعبندی برسند. وگرنه اگر طول بكشد مانند قضیه ویدئو، به نقاطی میرسیم که بالاخره زمان را از دست میدهیم.
عقبماندگی را هم نمیتوان جبران کرد.
سرعت عمل لازم است. وگرنه ساختار نهادی آن الان وجود دارد. باید زودتر به نتیجه برسند.
مسئلهای که وجود دارد، این است که میانگین سن مدیریتی در کشور، سن بالایی است. از طرفی دانش اینها نسبت به دنیای تکنولوژی و فناوری از جنس حوزه آیتی و سایبر، خیلی پایین است. به نظرتان این چقدر روی این مسائل تأثیر گذاشته است؟
بیتأثیر نیست. خوشبختانه البته وزیر و میانگین سنی مدیران وزارتخانه ارتباطات جوان است.
فکر میکنم در فهماندن مسائل و اهمیت موضوعات به مدیران دیگر که سن و سالی داشته و دانش کمتری دارند، مؤثر است.
همینطور است. مسلما این حوزه، حوزه جوانی است. هر چه نیروهای جوان در اینجا باشند، بهروزتر و با سرعت بیشتری میتوانند تصمیمگیری کنند و این واقعا مهم است. جوانگرایی در جاهای دیگر هم مهم است اما در این حوزه بیشتر خودش را نشان میدهد و نقش دارد.
به نظرتان بیگدیتا بیشتر از چه لحاظی واجد اهمیت است؟ سیاسی، اقتصادی، امنیتی و...؟
ما بیگدیتا را بیشتر از منظر اقتصادی نگاه میکنیم. از دید ما که آدمهای فنی هستیم، بحث اقتصادی آن از هر چیزی مهمتر است. ولی همه ما میدانیم امنیت، بالاترین نیاز یک جامعه است و اگر امنیت تأمین نشود، خط بطلان روی همه اینها کشیده خواهد شد. بنابراین میتوان گفت مسائل امنیت و حریم خصوصی بالاترین درجه اهمیت را دارد. خودم اگر احساس کنم از دیتای من بهرهبرداری شود و منفعتی هم براساس آن به خود من میرسد اما در قبالش حریم خصوصیام شکسته میشود، میگویم نمیخواهم. بنابراین بحثهای عمده اهمیت آن، اقتصادی است ولی بحثهای امنیت و حریم خصوصی، حق وتو دارند. با این توجیه میتوان گفت آنها در رده بالاتری هستند که بحث حاکمیت و امنیت و حریم خصوصی آن باید ابتدا حل شود. بعد جا برای بهرهبرداری اقتصادی سالم باز خواهد شد.
به دلیل محدودیتها و فیلترینگی که در کشور وجود دارد، استفاده از فیلترشکن در ایران رواج زیادی دارد. برخی منتقدان معتقد هستند همین مسئله فیلترشکن باعث میشود بخشی از حجم مهم ترافیک داده خودمان را با این کار به خارج از کشور بفرستیم. نظر شما دراینباره چیست؟
این معضلی است که ما داریم و هزاران مشکل برای ما ایجاد میکند. یک مشکل آن همین است که شما اشاره کردید. بخشی از ترافیک ما بیدلیل به خارج از کشور منتقل میشود و این ضرر اقتصادی هم دارد.
به واسطه همین فیلترشکنها؟
بله. در درجه اول ضرر اقتصادی دارد که خیلی بد است. بحثهای امنیت هم در جای خود که خیلی مهم است. مهمتر اینکه برخی سرویسها عملا دچار مشکل میشوند. یکسری سرویسها مبتنی بر مکان هستند. میتوانید از روی موقعیت مکانی به تحلیلهایی برسید که خیلی به درد میخورند. اما کسی که فیلترشکن استفاده میکند، عملا مکانش گم میشود و این اطلاعات را ندارید. اگر هم دارید، غلط است. بنابراین خیلی از تحلیلها و کارها را نمیتوان انجام داد. این واقعا آسیبي است که متأسفانه در کشور ما وجود دارد.
در برخی کشورها مثل چین هم مشابه چنین چیزی وجود دارد.
بله، دو، سه کشور هستند که وضعیت مشابهی دارند.
چینیها البته نمونه داخلی هر پلتفرمی را آماده کردهاند.
فکر نمیکنم کاربران چینی مشابه فیلترشکنی را که ما میشناسیم و به این مقدار استفاده کنند. فیلترینگ آنها خیلی سختگیرانهتر است. البته جایگزینهایی برای خود درست کردهاند. اما فکر نمیکنم به این شکل فیلترشکن در جایی استفاده شود. بخشی از دیتا را عملا با این شرایط از دست میدهیم؛ به خاطر وجود فیلترشکن.
اینکه گفتید با فیلترشکن برای سرویسها اطلاعات را از دست میدهیم، بیشتر توضیح دهید.
مثلا در بحث لوکیشن یا اطلاعات مکانی. لوکیشن، اطلاعات خیلی باارزشی است. اینکه آدمها در کجا، کاری انجام میدهند. مثلا آدمهای فلان شهر، چه چیزی سرچ میکنند، از آن میتوانید ترندی را در آن شهر تشخیص دهید. اینها را با رعایت حریم خصوصی میگویم. از نظر نیاز آن شهر، نیاز آن منطقه، اطلاعاتی را میتوان به دولت داد تا برای آن برنامهریزی کند. از اینها میتوان اطلاعات کسب کرد. اما وقتی ویپیان استفاده شود، این اطلاعات گم میشود. اتفاقا اینها در بیگدیتا، مهمترین اطلاعات و بسيار باارزش هستند که با فیلترشکن عملا اینها را از دست ميدهيم.