|

گنجی به نام بیگ‌دیتا

بیگ‌دیتا یا کلان‌داده چیست و چه اهمیتی دارد؟ این سؤال ساده و کوتاه ناظر بر بحثی است که در خود دنیایی از اطلاعات، جزئیات و اهمیت را دارد. مسئله‌ای که به تعبیری از آن به‌عنوان منبع اصلی قدرت و ثروت در آینده یاد می‌شود. در مطلب پیش‌رو با صادق عباسی‌شاهكوه، رئيس دانشكده پست و مخابرات درباره همین مسئله به گفت‌وگو نشسته‌ایم.

‌ بیگ‌دیتا یا کلان‌داده به زبان ساده به چه معناست و چه اهمیتی دارد؟
همه ما به‌عنوان کاربران اینترنت هر روز، حجمی از دیتا را در فضای وب تولید می‌کنیم. چه آنهایی که در اینستاگرام عکس و فیلم می‌گذارند و چه آن کسی که در پیام‌رسان‌ها چت می‌کند و پیام صوتی می‌گذارد و حتی کسی که یک سرچ ساده در گوگل و... انجام می‌دهد. همه رد پای ما در اینترنت به معنی مستقیم ایجاد و تولید دیتاست. این‌گونه هم نیست که فقط قشر خاصی مشغول ایجاد دیتا باشند، الان می‌توان گفت همه دیتا تولید می‌کنند و حجمش هم مدام زياد می‌شود. برآوردهایی وجود دارد که هر دو سال یک بار، حجم دیتای تولیدشده دو برابر می‌شود. پیش‌بینی‌ها برای سال 2020 این‌گونه بود که دیتای تولیدی بشر در این سال به بیش از 40 هزار اگزابایت می‌رسد. اگزابایت چیست؟ هر هزار گیگابایت، یک ترابایت می‌شود. هر هزار ترابایت یک پتابایت می‌شود و هر هزار برابر آن اگزابایت می‌شود، یعنی 10 به توان 18؛ یعنی اگر جمعیت جهان را حدود هفت، هشت میلیارد در نظر بگیریم، در سال 2020 به طور متوسط، هر آدمی به طور سرانه، حدود پنج ترابایت دیتا تولید کرده است. از آن طرف سرعت انتقال دیتا هم مدام بالا می‌رود و تنوع آن نیز بیشتر می‌شود. دیتای عظیمی هم به این شکل ایجاد شده که هر فردي در دنیا که گوشی‌ هوشمند دستش است، الان کجاست. این دیتاها، دیتاهای باارزشی هستند. بنابراین به مجموعه داده‌هایی که همین‌طور تولید و بیشتر می‌شود، بیگ‌دیتا یا کلان‌داده می‌گویند. حجم، سرعت و تنوعش خیلی بیشتر از چیزی است که در طول تاریخ و در گذشته بوده و گفتیم دو سال یک بار هم دو برابر می‌شود. حالا پرسش این است که این دیتا چه ارزشی می‌تواند داشته باشد. نمونه خیلی ساده آن که همه با آن درگیر هستند، یک پردازش ساده از دیتای تردد آدم‌هاست که مثلا می‌شود با آن فهمید الان فلان خیابان، ترافیک است. این از پردازش داده‌های مکانی درمی‌آید. پردازش هوشمندانه یک تکه از این داده‌ها به ما می‌گوید کجا ترافیک است و این مسیر را نرو، این مسیر را برو. خیلی‌ها معتقد هستند در آینده، دیتاست که ثروت بزرگ به حساب می‌آید و بیش از نفت می‌ارزد. در سطح جهانی، چند میلیارد انسان در شبکه‌های اجتماعی هستند و دائم اطلاعات ردوبدل می‌کنند. از روی این اطلاعات، اگر آنها را پردازش کنیم با روش‌هایی که روزبه‌روز توسعه پیدا می‌کند، می‌توانیم اطلاعاتی را استخراج کنیم. دیتاها اگر روی‌هم‌ریخته باشند، شاید به‌تنهایی، فایده نداشته باشند. اگر این اطلاعات را استخراج کنیم، آن موقع خیلی باارزش می‌شوند. آن موقع می‌توانیم بفهمیم که مثلا گرایش بازار به فلان محصول بیشتر است. این به درد کسی می‌خورد که تجارت می‌کند. پس اگر این محصول را برای این جامعه ببرم، مشتری دارد، چون گرایش وجود دارد. این رنگ لباس، الان در شبکه‌های اجتماعی محبوب است. این لباس و مد، خیلی توسعه پیدا می‌کند. کسی که تولیدکننده است به آن سمت می‌رود. یا مثلا حتی در مباحث سیاسی می‌تواند منشأ تأثیرات و تصمیمات بزرگی شود.
‌ به لحاظ سیاسی بیگ‌دیتا چه اهمیت و ارزشی می‌تواند داشته باشد؟
براساس آن می‌توان فهمید گرایش به فلان گروه یا شخص، چه زماني زیاد یا کم می‌شود. می‌توان حتی روی آنها کار کرد یا در جاهایی می‌توان اثرگذاری هم کرد. می‌توان با ایجاد دیتا و اخبار، حتی به افکار عمومی جهت و مسیر داد. بنابراین، اینها می‌تواند اطلاعات خیلی باارزشی باشد. برخی با اینها تجارت و خرید و فروش می‌کنند، آنها که اهل آنالیز هستند و کسانی که کار اقتصادی دارند، از میان این اطلاعات به کسب‌وکار خود شکل می‌دهند. بنابراین ارزش اقتصادی خیلی بالایی نیز دارد. البته مسائل منفی هم در کنار اینها هست. بحث‌های حریم خصوصی و امنیت هم در اینجا مطرح است که آن هم زاویه دیگر کار است. خود آن باز حجم زیادی از کار و اشتغال را می‌طلبد که امنیت اینها را خوب فراهم کنند و پردازش اینها که دنیای دیگری است. موتور محرکه‌اش این است که هوش مصنوعی را به‌وجود آوریم که بتوانیم از دیتاهای موجود اطلاعات استخراج کنیم.
‌ گفته می‌شود بخش عمده دیتا و کلیت اینترنت در دست کشوری مثل آمریکاست و ما هم مصرف‌کننده اینترنت هستیم، آیا کشوری مثل ما هم می‌تواند بیگ‌دیتا را در داخل برای خودش داشته باشد؟
همه کشورها الان به این سمت رفته‌اند. برخی شرکت‌ها در دنیا هستند- به قول شما بیشتر شرکت‌های بزرگ هم در آمریکا هستند- كه دیتای کل دنیا را به نوعی در خود جمع کرده‌اند. گوگل، حاکم بر حجم زیادی از دیتا و اطلاعات همه مردم دنیا شده است. گوگل الان با تقریب بالایی می‌داند هر کاربر اینترنت چه چیزی می‌خورد، چه چیزی می‌پوشد. با سرچی که می‌کنید، می‌فهمد گرایش شما به کدام سمت است. میلیون‌ها انسان در طول روز، همین‌طور سرچ كرده و این اطلاعات را به نحوی به گوگل وارد می‌کنند. این ثروت هم دست آنهاست. الان کشورها غالبا به این سمت رفته‌اند که کاری کنند این حجم اطلاعات مربوط به مردم خودشان، دست خودشان باشد. اگر هم قرار است از درونش استخراج و منفعتی کسب کنیم، اقتصادی را شکل دهیم، همه را مفت و مجانی در اختیار خارجی‌ها قرار ندهیم. این مباحثی است که در کشور ما هم مطرح است و واقعا هم ارزش کارکردن دارد. در چند سال اخیر، اپلیکیشن‌هایی که داخل ایران به‌وجود آمد، خیلی‌هاشان کسب‌وکارهای بزرگی راه انداختند. همین کسب‌وکارهای تاکسی که واقعا رشد خوبی در آن داشتیم، در دنیا هم نمونه‌اش وجود دارد. همین اطلاعاتی که از مردم دارند، چقدر اطلاعات باارزشی است. اگر اینها داخل ایران تولید نمی‌شد، به خارج از ایران می‌رفت. این همان بحث‌هایی است که مطرح است تا اطلاعات را به‌راحتی در اختیار دیگران قرار ندهیم. من جنبه‌های دیگرش را نمی‌گویم. تنها جنبه اقتصادی آن را در نظر بگیرید، انگار ثروت هنگفتی در داخل کشور است که باید تلاش کنیم مردم خودمان روی اینها کسب‌وکار، استخراج و بهره‌برداری کنند.
‌ مسئله بیگ‌دیتا از چه زمانی برای مردم یا مسئولان کشورها و مشخصا کشور ما مهم شده است؟
از زمانی که دیتا زیاد شد. به چند سال اخیر که نگاه کنید، قبل از آنکه نسل سه و چهار اینترنت را داشته باشیم، خود شما هم با این مسئله روبه‌رو نمی‌شدید. حتي قبل از اینکه شبکه‌های اجتماعی این‌قدر توسعه پیدا کنند، خیلی بحث حجم دیتا مطرح نبود. همین الان که دوری در اینستاگرام می‌زنید، می‌توانید بفهمید امروز بین مردم چه موضوعی مهم بوده است، بدون اینکه کسی را دیده باشید. حتي راجع به عکس‌هایی که می‌گذارند، می‌توان فهمید چطور لباس‌هایی مد می‌شوند. با گشت و گذار ساده در اینستاگرام انگار کل کشور را دور زده‌اید. از زمانی که نسل سه و چهار آمد و ارتباط دیتايي زیاد شد، به‌خصوص به‌خاطر اینکه شبکه‌های اجتماعی به‌وجود آمد و دیتا فراوان شد، خود به خود با بحث اینکه چطور از این همه دیتا بهره‌برداری و آنها را سازماندهی کنیم، بحث بیگ‌دیتا هم پیش آمد.
‌ در کشور خودمان ایران، مشخصا برای ذخیره‌سازی، مدیریت یا هر هدف دیگری که هست، چه اقداماتی انجام شده است؟ از چه زمانی شروع شده و الان کجای کار هستیم؟
در چند سال اخیر، کارهایی در این زمینه انجام شده است. بحث‌هایی مطرح بود که تلاش کنیم میزبانی داده‌های ما در خارج از ایران نباشد. قبلا اطلاعات ما همه در خارج از ایران میزبانی می‌شد ولی الان خوشبختانه خیلی‌هایش داخل ایران میزبانی می‌شود. این چند حسن دارد. یکی اینکه اطلاعات مردم خودمان در داخل کشور خودمان است. ثانیا تبادلش با سرعت و کیفیت بیشتر است. ممکن است از شما اطلاعاتی می‌خواستم، اطلاعات شما به خارج از ایران می‌رفت، از آنجا دور می‌زد و می‌آمد تا من دریافت کنم. در حالی که ما به هم نزدیک هستیم و سرعت و کیفیت در داخل کشور می‌تواند بچرخد. اطلاعات در داخل کشور می‌ماند. اگر اتفاقی در جای دیگری از دنیا بیفتد، دیتای من از بین نمی‌رود. البته لازم است آنچه در داخل ایران هم نگهداری می‌شود، این است که کیفیت و امکانات ما هم بالا رود تا از داخل ضربه نخوریم. البته این چند سال روی اینها کار شده است. الان شبکه ابری داریم که در سطح جهانی، سرویس‌دهی می‌کند و این چندساله به‌وجود آمد. یا دیتاسنترهایی در داخل داریم که بخش زیادی از دیتاهای مردم روی آنها و همین‌جا نگهداری می‌شود. البته در زمینه دیتاسنتر، هنوز کار زیادی داریم. تلاش وزارت ارتباطات و بخش‌های مختلف این است که این نقطه ضعف را هم بیشتر برطرف کنیم تا اینها را در داخل داشته باشیم. خیلی از اپلیکیشن‌ها در اين زمينه واقعا پیشرفت کرده‌اند. الان نمونه ایرانی بسیاری از اپلیکیشن‌های جهانی را داریم. این واقعا باعث خوشحالی است که خیلی از دیتاها در داخل می‌ماند. حتی نقشه‌خوان‌های ایرانی در داخل وجود دارند و کار می‌کنند که برخی امکانات آنها از سرویس‌های نقشه‌خوانی بزرگ جهانی هم بهتر است. وقتی داخلی می‌شود، خوبی‌اش این است که اگر نقطه ضعفی باشد، به برنامه‌نویسانی که در داخل کشور هستند می‌گویید این را هم اضافه کن. مثلا در سرویس‌های نقشه دنیا، سرعت‌گیر نیست. اما در نقشه داخلی ما، حتی سرعت‌گیرها را هم می‌گذارد. خوشبختانه همین الان 300، 400 هزار اپلیکیشن ایرانی موجود است و مردم از آنها استفاده می‌کنند. از این لحاظ خیلی خوب کار شده اما جا برای کار همچنان بالاست، چراکه وقتی می‌گوییم رشد دیتا هر دو سال یک ‌بار دو برابر می‌شود، یعنی ما هم باید تلاش‌مان را به همین نسبت بیشتر کنیم.
‌ سرعت پیشرفت یا رشد ما نسبت به سرعتی که در حوزه واقعی اتفاق می‌افتد، برابر است یا نه؟ آیا به آن می‌رسیم؟ مثلا سرعت رشد اپلیکیشن‌ها و مصرف مردم، سرعت خیره‌کننده‌ای دارد.
سرعت رشد بهره‌برداری مردم کشور ما از متوسط دنیا هم بالاتر است. مردم ایران در این زمینه خیلی پذیرش بالایی دارند. از زمانی که نسل سه و چهار در سال 93 آمد، خودمان که درگیر کار بودیم، در بهترین حالت فکر می‌کردیم در یک سال 10 میلیون گوشی هوشمند دست مردم باشد. اما یک سال بعد که سنجش کردیم، دیدیم بالای 20 میلیون است. یعنی مردم خیلی بیشتر از آن چیزی که ما فکر می‌کنیم، پذیرش دارند و واقعا در این زمینه‌ها علاقه‌مند هستند. استفاده خوبی هم می‌کنند. تراکنش‌های مالی که در ایران به‌صورت اینترنتی انجام می‌شود و روی موبایل، مطمئنا در دنیا جزء بالاترین‌هاست. با این شدت و با اینکه مردم دیر وارد آن شدند، اما همه کارها و تراکنش مالی خود را در اینترنت انجام می‌دهند و با حجم خیلی زیاد. رشد این چیزها در کشور ما خیلی بالاست. البته هنوز در جاهایی نقطه ضعف داریم، اما مثلا رشد ما در موبایل بسیار خوب بوده است. اینترنت موبایل نسل چهار را در همه شهرها تحت پوشش داریم. در خیلی از روستاها هم نسل چهار داریم. در خیلی از کشورها این‌طور نیست که روستاها هم نسل چهار داشته باشند. ولی ما این را داریم.
‌ اینکه گفتید در برخی حوزه‌ها هنوز عقب هستیم را بیشتر توضیح دهید.
مثلا در ارتباطات اینترنت ثابت واقعا عقب هستیم، خیلی هم عقب هستیم اما وضعيتمان در اینترنت موبایل خیلی خوب است. اما همان‌طور که گفتم در اینترنت ثابت مقداری عقب هستیم. در سرویس‌های ویدئویی عقب هستیم. بالاخره 70 درصد ترافیک و دیتا، ویدئو است. ولی همین دعواها و اختلافاتی که وجود دارد بر سر اینکه مجوز و اختیارش دست چه نهادی باشد، باعث شده در زمینه ویدئو هنوز مقداری عقب باشیم.
‌ به نظر شما چشم‌انداز وضعیت چطور است. قبل از آن این را بگویید؛ بحث رقابت بر سر داده‌ها یا تسط بر آنها، موضوعی است که به تعبیر شما گاهی سیاسی هم شده است. چشم‌انداز این را چطور می‌بینید؟
این موضوع مهمی است که واقعا ضعف‌هایی در کشور ما دارد. اصطلاحا در دنیا به آن حاکمیت دیتا یا دیتاگاورمنس می‌گویند. الان تکلیف ما کاملا روشن نیست که حاکمیت بر دیتاها را چه کسی باید در دست بگیرد.
‌ قانونش را نداریم یا ابزارش را؟
برای من که در این حوزه هستم، مشخص نیست که اینها را باید چه کسی ساماندهی کند. زمانی مطرح شد که شورای عالی فضای مجازی باید وارد این کار شود. اطلاع دارم تا جاهایی هم پیش‌نویس‌هایی تهیه شد تا اینها را تعیین تکلیف کنند. در آینده اگر‌ «آی‌اوتی» یا اینترنت اشیا بیاید، دیتایی که تولید می‌شود خیلی بیشتر خواهد شد. فکر کنید یخچال یا ماشین لباسشویی ما قرار است به نت وصل شود و هر لحظه اطلاعاتی منتقل می‌کند. همه مردم می‌توانند بفهمند من چه زمانی لباس می‌شویم، چه زمانی یخچال من پر یا خالی است. همه اینها اطلاعاتی است که جمع‌آوری آنها از عمق زندگی مردم شکل می‌گیرد. بحث امنیت اینها، حریم خصوصی، اینکه نحوه بهره‌برداری از آنها به چه شکلی باشد، بسیار مهم و حیاتی می‌شود. اما اگر حریم خصوصی را بشکند، همه جلوی آن خواهند ایستاد و جلویش را می‌گیرند. یا اگر امنیت مردم را از بین ببرد، جلوی آن را خواهند گرفت. بنابراین اگر در مورد اینها فکر نشود، بعدا گرفتاری خواهیم داشت. فکر کنید الان ویروسی در موبایل من باشد. ممکن است دو فایل من از بین برود، این مشکلی نیست. اما اگر فردا ویروسی وارد یخچال من شود، ممکن است باعث شود یخچال بسوزد. موضوع خیلی جدی‌تر خواهد بود. بحث حاکمیت دیتا و حریم خصوصی و بحث امنیت اطلاعات، بسیار حیاتی است.
‌ آیا الان در ایران برای اینها استراتژی و برنامه وجود دارد یا نه؟
بحث‌های جسته‌گریخته‌ای را می‌شنویم. شورای فضای مجازی در جایی به‌وجود آمد برای حل‌و‌فصل همین مسائل. یعنی جایی که به نوعی فراقوه‌ای است و همه در آن هستند و باید اینها را حل کنند. می‌دانم کارهایی را شروع کرده‌اند اما نیاز داریم زودتر به جمع‌بندی برسند. وگرنه اگر طول بكشد مانند قضیه ویدئو، به نقاطی می‌رسیم که بالاخره زمان را از دست می‌دهیم.
‌ عقب‌ماندگی را هم نمی‌توان جبران کرد.
سرعت عمل لازم است. وگرنه ساختار نهادی آن الان وجود دارد. باید زودتر به نتیجه برسند.
‌ مسئله‌ای که وجود دارد، این است که میانگین سن مدیریتی در کشور، سن بالایی است. از طرفی دانش اینها نسبت به دنیای تکنولوژی و فناوری از جنس حوزه ‌آی‌تی و سایبر، خیلی پایین است. به نظرتان این چقدر روی این مسائل تأثیر گذاشته است؟
بی‌تأثیر نیست. خوشبختانه البته وزیر و میانگین سنی مدیران وزارتخانه ارتباطات جوان است.
‌ فکر می‌کنم در فهماندن مسائل و اهمیت موضوعات به مدیران دیگر که سن و سالی داشته و دانش کمتری دارند، مؤثر است.
همین‌طور است. مسلما این حوزه، حوزه جوانی است. هر چه نیروهای جوان در اینجا باشند، به‌روزتر و با سرعت بیشتری می‌توانند تصمیم‌گیری کنند و این واقعا مهم است. جوان‌گرایی در جاهای دیگر هم مهم است اما در این حوزه بیشتر خودش را نشان می‌دهد و نقش دارد.
‌ به نظرتان بیگ‌دیتا بیشتر از چه لحاظی واجد اهمیت است؟ سیاسی، اقتصادی، امنیتی و...؟
ما بیگ‌دیتا را بیشتر از منظر اقتصادی نگاه می‌کنیم. از دید ما که آدم‌های فنی هستیم، بحث اقتصادی آن از هر چیزی مهم‌تر است. ولی همه ما می‌دانیم امنیت، بالاترین نیاز یک جامعه است و اگر امنیت تأمین نشود، خط بطلان روی همه اینها کشیده خواهد شد. بنابراین می‌توان گفت مسائل امنیت و حریم خصوصی بالاترین درجه اهمیت را دارد. خودم اگر احساس کنم از دیتای من بهره‌برداری شود و منفعتی هم براساس آن به خود من می‌رسد اما در قبالش حریم خصوصی‌ام شکسته می‌شود، می‌گویم نمی‌خواهم. بنابراین بحث‌های عمده اهمیت آن، اقتصادی است ولی بحث‌های امنیت و حریم خصوصی، حق وتو دارند. با این توجیه می‌توان گفت آنها در رده بالاتری هستند که بحث حاکمیت و امنیت و حریم خصوصی آن باید ابتدا حل شود. بعد جا برای بهره‌برداری اقتصادی سالم باز خواهد شد.
‌ به دلیل محدودیت‌ها و فیلترینگی که در کشور وجود دارد، استفاده از فیلترشکن‌ در ایران رواج زیادی دارد. برخی منتقدان معتقد هستند همین مسئله فیلترشکن باعث می‌شود بخشی از حجم مهم ترافیک داده خودمان را با این کار به خارج از کشور بفرستیم. نظر شما دراین‌باره چیست؟
این معضلی است که ما داریم و هزاران مشکل برای ما ایجاد می‌کند. یک مشکل آن همین است که شما اشاره کردید. بخشی از ترافیک ما بی‌دلیل به خارج از کشور منتقل می‌شود و این ضرر اقتصادی هم دارد.
‌ به واسطه همین فیلترشکن‌ها؟
بله. در درجه اول ضرر اقتصادی دارد که خیلی بد است. بحث‌های امنیت هم در جای خود که خیلی مهم است. مهم‌تر اینکه برخی سرویس‌ها عملا دچار مشکل می‌شوند. یک‌سری سرویس‌ها مبتنی بر مکان هستند. می‌توانید از روی موقعیت مکانی به تحلیل‌هایی برسید که خیلی به درد می‌خورند. اما کسی که فیلترشکن استفاده می‌کند، عملا مکانش گم می‌شود و این اطلاعات را ندارید. اگر هم دارید، غلط است. بنابراین خیلی از تحلیل‌ها و کارها را نمی‌توان انجام داد. این واقعا آسیبي است که متأسفانه در کشور ما وجود دارد.
‌ در برخی کشورها مثل چین هم مشابه چنین چیزی وجود دارد.
بله، دو، سه کشور هستند که وضعیت مشابهی دارند.
‌ چینی‌ها البته نمونه داخلی هر پلتفرمی را آماده کرده‌اند.
فکر نمی‌کنم کاربران چینی مشابه فیلترشکنی را که ما می‌شناسیم و به این مقدار استفاده کنند. فیلترینگ آنها خیلی سختگیرانه‌تر است. البته جایگزین‌هایی برای خود درست کرده‌اند. اما فکر نمی‌کنم به این شکل فیلترشکن در جایی استفاده شود. بخشی از دیتا را عملا با این شرایط از دست می‌دهیم؛ به خاطر وجود فیلترشکن.
‌ اینکه گفتید با فیلترشکن برای سرویس‌ها اطلاعات را از دست می‌دهیم، بیشتر توضیح دهید.
مثلا در بحث لوکیشن یا اطلاعات مکانی. لوکیشن، اطلاعات خیلی باارزشی است. اینکه آدم‌ها در کجا، کاری انجام می‌دهند. مثلا آدم‌های فلان شهر، چه چیزی سرچ می‌کنند، از آن می‌توانید ترندی را در آن شهر تشخیص دهید. اینها را با رعایت حریم خصوصی می‌گویم. از نظر نیاز آن شهر، نیاز آن منطقه، اطلاعاتی را می‌توان به دولت داد تا برای آن برنامه‌ریزی کند. از اینها می‌توان اطلاعات کسب کرد. اما وقتی وی‌پی‌ان استفاده شود، این اطلاعات گم می‌شود. اتفاقا اینها در بیگ‌دیتا، مهم‌ترین اطلاعات و بسيار باارزش هستند که با فیلترشکن عملا اینها را از دست مي‌دهيم.

بیگ‌دیتا یا کلان‌داده چیست و چه اهمیتی دارد؟ این سؤال ساده و کوتاه ناظر بر بحثی است که در خود دنیایی از اطلاعات، جزئیات و اهمیت را دارد. مسئله‌ای که به تعبیری از آن به‌عنوان منبع اصلی قدرت و ثروت در آینده یاد می‌شود. در مطلب پیش‌رو با صادق عباسی‌شاهكوه، رئيس دانشكده پست و مخابرات درباره همین مسئله به گفت‌وگو نشسته‌ایم.

‌ بیگ‌دیتا یا کلان‌داده به زبان ساده به چه معناست و چه اهمیتی دارد؟
همه ما به‌عنوان کاربران اینترنت هر روز، حجمی از دیتا را در فضای وب تولید می‌کنیم. چه آنهایی که در اینستاگرام عکس و فیلم می‌گذارند و چه آن کسی که در پیام‌رسان‌ها چت می‌کند و پیام صوتی می‌گذارد و حتی کسی که یک سرچ ساده در گوگل و... انجام می‌دهد. همه رد پای ما در اینترنت به معنی مستقیم ایجاد و تولید دیتاست. این‌گونه هم نیست که فقط قشر خاصی مشغول ایجاد دیتا باشند، الان می‌توان گفت همه دیتا تولید می‌کنند و حجمش هم مدام زياد می‌شود. برآوردهایی وجود دارد که هر دو سال یک بار، حجم دیتای تولیدشده دو برابر می‌شود. پیش‌بینی‌ها برای سال 2020 این‌گونه بود که دیتای تولیدی بشر در این سال به بیش از 40 هزار اگزابایت می‌رسد. اگزابایت چیست؟ هر هزار گیگابایت، یک ترابایت می‌شود. هر هزار ترابایت یک پتابایت می‌شود و هر هزار برابر آن اگزابایت می‌شود، یعنی 10 به توان 18؛ یعنی اگر جمعیت جهان را حدود هفت، هشت میلیارد در نظر بگیریم، در سال 2020 به طور متوسط، هر آدمی به طور سرانه، حدود پنج ترابایت دیتا تولید کرده است. از آن طرف سرعت انتقال دیتا هم مدام بالا می‌رود و تنوع آن نیز بیشتر می‌شود. دیتای عظیمی هم به این شکل ایجاد شده که هر فردي در دنیا که گوشی‌ هوشمند دستش است، الان کجاست. این دیتاها، دیتاهای باارزشی هستند. بنابراین به مجموعه داده‌هایی که همین‌طور تولید و بیشتر می‌شود، بیگ‌دیتا یا کلان‌داده می‌گویند. حجم، سرعت و تنوعش خیلی بیشتر از چیزی است که در طول تاریخ و در گذشته بوده و گفتیم دو سال یک بار هم دو برابر می‌شود. حالا پرسش این است که این دیتا چه ارزشی می‌تواند داشته باشد. نمونه خیلی ساده آن که همه با آن درگیر هستند، یک پردازش ساده از دیتای تردد آدم‌هاست که مثلا می‌شود با آن فهمید الان فلان خیابان، ترافیک است. این از پردازش داده‌های مکانی درمی‌آید. پردازش هوشمندانه یک تکه از این داده‌ها به ما می‌گوید کجا ترافیک است و این مسیر را نرو، این مسیر را برو. خیلی‌ها معتقد هستند در آینده، دیتاست که ثروت بزرگ به حساب می‌آید و بیش از نفت می‌ارزد. در سطح جهانی، چند میلیارد انسان در شبکه‌های اجتماعی هستند و دائم اطلاعات ردوبدل می‌کنند. از روی این اطلاعات، اگر آنها را پردازش کنیم با روش‌هایی که روزبه‌روز توسعه پیدا می‌کند، می‌توانیم اطلاعاتی را استخراج کنیم. دیتاها اگر روی‌هم‌ریخته باشند، شاید به‌تنهایی، فایده نداشته باشند. اگر این اطلاعات را استخراج کنیم، آن موقع خیلی باارزش می‌شوند. آن موقع می‌توانیم بفهمیم که مثلا گرایش بازار به فلان محصول بیشتر است. این به درد کسی می‌خورد که تجارت می‌کند. پس اگر این محصول را برای این جامعه ببرم، مشتری دارد، چون گرایش وجود دارد. این رنگ لباس، الان در شبکه‌های اجتماعی محبوب است. این لباس و مد، خیلی توسعه پیدا می‌کند. کسی که تولیدکننده است به آن سمت می‌رود. یا مثلا حتی در مباحث سیاسی می‌تواند منشأ تأثیرات و تصمیمات بزرگی شود.
‌ به لحاظ سیاسی بیگ‌دیتا چه اهمیت و ارزشی می‌تواند داشته باشد؟
براساس آن می‌توان فهمید گرایش به فلان گروه یا شخص، چه زماني زیاد یا کم می‌شود. می‌توان حتی روی آنها کار کرد یا در جاهایی می‌توان اثرگذاری هم کرد. می‌توان با ایجاد دیتا و اخبار، حتی به افکار عمومی جهت و مسیر داد. بنابراین، اینها می‌تواند اطلاعات خیلی باارزشی باشد. برخی با اینها تجارت و خرید و فروش می‌کنند، آنها که اهل آنالیز هستند و کسانی که کار اقتصادی دارند، از میان این اطلاعات به کسب‌وکار خود شکل می‌دهند. بنابراین ارزش اقتصادی خیلی بالایی نیز دارد. البته مسائل منفی هم در کنار اینها هست. بحث‌های حریم خصوصی و امنیت هم در اینجا مطرح است که آن هم زاویه دیگر کار است. خود آن باز حجم زیادی از کار و اشتغال را می‌طلبد که امنیت اینها را خوب فراهم کنند و پردازش اینها که دنیای دیگری است. موتور محرکه‌اش این است که هوش مصنوعی را به‌وجود آوریم که بتوانیم از دیتاهای موجود اطلاعات استخراج کنیم.
‌ گفته می‌شود بخش عمده دیتا و کلیت اینترنت در دست کشوری مثل آمریکاست و ما هم مصرف‌کننده اینترنت هستیم، آیا کشوری مثل ما هم می‌تواند بیگ‌دیتا را در داخل برای خودش داشته باشد؟
همه کشورها الان به این سمت رفته‌اند. برخی شرکت‌ها در دنیا هستند- به قول شما بیشتر شرکت‌های بزرگ هم در آمریکا هستند- كه دیتای کل دنیا را به نوعی در خود جمع کرده‌اند. گوگل، حاکم بر حجم زیادی از دیتا و اطلاعات همه مردم دنیا شده است. گوگل الان با تقریب بالایی می‌داند هر کاربر اینترنت چه چیزی می‌خورد، چه چیزی می‌پوشد. با سرچی که می‌کنید، می‌فهمد گرایش شما به کدام سمت است. میلیون‌ها انسان در طول روز، همین‌طور سرچ كرده و این اطلاعات را به نحوی به گوگل وارد می‌کنند. این ثروت هم دست آنهاست. الان کشورها غالبا به این سمت رفته‌اند که کاری کنند این حجم اطلاعات مربوط به مردم خودشان، دست خودشان باشد. اگر هم قرار است از درونش استخراج و منفعتی کسب کنیم، اقتصادی را شکل دهیم، همه را مفت و مجانی در اختیار خارجی‌ها قرار ندهیم. این مباحثی است که در کشور ما هم مطرح است و واقعا هم ارزش کارکردن دارد. در چند سال اخیر، اپلیکیشن‌هایی که داخل ایران به‌وجود آمد، خیلی‌هاشان کسب‌وکارهای بزرگی راه انداختند. همین کسب‌وکارهای تاکسی که واقعا رشد خوبی در آن داشتیم، در دنیا هم نمونه‌اش وجود دارد. همین اطلاعاتی که از مردم دارند، چقدر اطلاعات باارزشی است. اگر اینها داخل ایران تولید نمی‌شد، به خارج از ایران می‌رفت. این همان بحث‌هایی است که مطرح است تا اطلاعات را به‌راحتی در اختیار دیگران قرار ندهیم. من جنبه‌های دیگرش را نمی‌گویم. تنها جنبه اقتصادی آن را در نظر بگیرید، انگار ثروت هنگفتی در داخل کشور است که باید تلاش کنیم مردم خودمان روی اینها کسب‌وکار، استخراج و بهره‌برداری کنند.
‌ مسئله بیگ‌دیتا از چه زمانی برای مردم یا مسئولان کشورها و مشخصا کشور ما مهم شده است؟
از زمانی که دیتا زیاد شد. به چند سال اخیر که نگاه کنید، قبل از آنکه نسل سه و چهار اینترنت را داشته باشیم، خود شما هم با این مسئله روبه‌رو نمی‌شدید. حتي قبل از اینکه شبکه‌های اجتماعی این‌قدر توسعه پیدا کنند، خیلی بحث حجم دیتا مطرح نبود. همین الان که دوری در اینستاگرام می‌زنید، می‌توانید بفهمید امروز بین مردم چه موضوعی مهم بوده است، بدون اینکه کسی را دیده باشید. حتي راجع به عکس‌هایی که می‌گذارند، می‌توان فهمید چطور لباس‌هایی مد می‌شوند. با گشت و گذار ساده در اینستاگرام انگار کل کشور را دور زده‌اید. از زمانی که نسل سه و چهار آمد و ارتباط دیتايي زیاد شد، به‌خصوص به‌خاطر اینکه شبکه‌های اجتماعی به‌وجود آمد و دیتا فراوان شد، خود به خود با بحث اینکه چطور از این همه دیتا بهره‌برداری و آنها را سازماندهی کنیم، بحث بیگ‌دیتا هم پیش آمد.
‌ در کشور خودمان ایران، مشخصا برای ذخیره‌سازی، مدیریت یا هر هدف دیگری که هست، چه اقداماتی انجام شده است؟ از چه زمانی شروع شده و الان کجای کار هستیم؟
در چند سال اخیر، کارهایی در این زمینه انجام شده است. بحث‌هایی مطرح بود که تلاش کنیم میزبانی داده‌های ما در خارج از ایران نباشد. قبلا اطلاعات ما همه در خارج از ایران میزبانی می‌شد ولی الان خوشبختانه خیلی‌هایش داخل ایران میزبانی می‌شود. این چند حسن دارد. یکی اینکه اطلاعات مردم خودمان در داخل کشور خودمان است. ثانیا تبادلش با سرعت و کیفیت بیشتر است. ممکن است از شما اطلاعاتی می‌خواستم، اطلاعات شما به خارج از ایران می‌رفت، از آنجا دور می‌زد و می‌آمد تا من دریافت کنم. در حالی که ما به هم نزدیک هستیم و سرعت و کیفیت در داخل کشور می‌تواند بچرخد. اطلاعات در داخل کشور می‌ماند. اگر اتفاقی در جای دیگری از دنیا بیفتد، دیتای من از بین نمی‌رود. البته لازم است آنچه در داخل ایران هم نگهداری می‌شود، این است که کیفیت و امکانات ما هم بالا رود تا از داخل ضربه نخوریم. البته این چند سال روی اینها کار شده است. الان شبکه ابری داریم که در سطح جهانی، سرویس‌دهی می‌کند و این چندساله به‌وجود آمد. یا دیتاسنترهایی در داخل داریم که بخش زیادی از دیتاهای مردم روی آنها و همین‌جا نگهداری می‌شود. البته در زمینه دیتاسنتر، هنوز کار زیادی داریم. تلاش وزارت ارتباطات و بخش‌های مختلف این است که این نقطه ضعف را هم بیشتر برطرف کنیم تا اینها را در داخل داشته باشیم. خیلی از اپلیکیشن‌ها در اين زمينه واقعا پیشرفت کرده‌اند. الان نمونه ایرانی بسیاری از اپلیکیشن‌های جهانی را داریم. این واقعا باعث خوشحالی است که خیلی از دیتاها در داخل می‌ماند. حتی نقشه‌خوان‌های ایرانی در داخل وجود دارند و کار می‌کنند که برخی امکانات آنها از سرویس‌های نقشه‌خوانی بزرگ جهانی هم بهتر است. وقتی داخلی می‌شود، خوبی‌اش این است که اگر نقطه ضعفی باشد، به برنامه‌نویسانی که در داخل کشور هستند می‌گویید این را هم اضافه کن. مثلا در سرویس‌های نقشه دنیا، سرعت‌گیر نیست. اما در نقشه داخلی ما، حتی سرعت‌گیرها را هم می‌گذارد. خوشبختانه همین الان 300، 400 هزار اپلیکیشن ایرانی موجود است و مردم از آنها استفاده می‌کنند. از این لحاظ خیلی خوب کار شده اما جا برای کار همچنان بالاست، چراکه وقتی می‌گوییم رشد دیتا هر دو سال یک ‌بار دو برابر می‌شود، یعنی ما هم باید تلاش‌مان را به همین نسبت بیشتر کنیم.
‌ سرعت پیشرفت یا رشد ما نسبت به سرعتی که در حوزه واقعی اتفاق می‌افتد، برابر است یا نه؟ آیا به آن می‌رسیم؟ مثلا سرعت رشد اپلیکیشن‌ها و مصرف مردم، سرعت خیره‌کننده‌ای دارد.
سرعت رشد بهره‌برداری مردم کشور ما از متوسط دنیا هم بالاتر است. مردم ایران در این زمینه خیلی پذیرش بالایی دارند. از زمانی که نسل سه و چهار در سال 93 آمد، خودمان که درگیر کار بودیم، در بهترین حالت فکر می‌کردیم در یک سال 10 میلیون گوشی هوشمند دست مردم باشد. اما یک سال بعد که سنجش کردیم، دیدیم بالای 20 میلیون است. یعنی مردم خیلی بیشتر از آن چیزی که ما فکر می‌کنیم، پذیرش دارند و واقعا در این زمینه‌ها علاقه‌مند هستند. استفاده خوبی هم می‌کنند. تراکنش‌های مالی که در ایران به‌صورت اینترنتی انجام می‌شود و روی موبایل، مطمئنا در دنیا جزء بالاترین‌هاست. با این شدت و با اینکه مردم دیر وارد آن شدند، اما همه کارها و تراکنش مالی خود را در اینترنت انجام می‌دهند و با حجم خیلی زیاد. رشد این چیزها در کشور ما خیلی بالاست. البته هنوز در جاهایی نقطه ضعف داریم، اما مثلا رشد ما در موبایل بسیار خوب بوده است. اینترنت موبایل نسل چهار را در همه شهرها تحت پوشش داریم. در خیلی از روستاها هم نسل چهار داریم. در خیلی از کشورها این‌طور نیست که روستاها هم نسل چهار داشته باشند. ولی ما این را داریم.
‌ اینکه گفتید در برخی حوزه‌ها هنوز عقب هستیم را بیشتر توضیح دهید.
مثلا در ارتباطات اینترنت ثابت واقعا عقب هستیم، خیلی هم عقب هستیم اما وضعيتمان در اینترنت موبایل خیلی خوب است. اما همان‌طور که گفتم در اینترنت ثابت مقداری عقب هستیم. در سرویس‌های ویدئویی عقب هستیم. بالاخره 70 درصد ترافیک و دیتا، ویدئو است. ولی همین دعواها و اختلافاتی که وجود دارد بر سر اینکه مجوز و اختیارش دست چه نهادی باشد، باعث شده در زمینه ویدئو هنوز مقداری عقب باشیم.
‌ به نظر شما چشم‌انداز وضعیت چطور است. قبل از آن این را بگویید؛ بحث رقابت بر سر داده‌ها یا تسط بر آنها، موضوعی است که به تعبیر شما گاهی سیاسی هم شده است. چشم‌انداز این را چطور می‌بینید؟
این موضوع مهمی است که واقعا ضعف‌هایی در کشور ما دارد. اصطلاحا در دنیا به آن حاکمیت دیتا یا دیتاگاورمنس می‌گویند. الان تکلیف ما کاملا روشن نیست که حاکمیت بر دیتاها را چه کسی باید در دست بگیرد.
‌ قانونش را نداریم یا ابزارش را؟
برای من که در این حوزه هستم، مشخص نیست که اینها را باید چه کسی ساماندهی کند. زمانی مطرح شد که شورای عالی فضای مجازی باید وارد این کار شود. اطلاع دارم تا جاهایی هم پیش‌نویس‌هایی تهیه شد تا اینها را تعیین تکلیف کنند. در آینده اگر‌ «آی‌اوتی» یا اینترنت اشیا بیاید، دیتایی که تولید می‌شود خیلی بیشتر خواهد شد. فکر کنید یخچال یا ماشین لباسشویی ما قرار است به نت وصل شود و هر لحظه اطلاعاتی منتقل می‌کند. همه مردم می‌توانند بفهمند من چه زمانی لباس می‌شویم، چه زمانی یخچال من پر یا خالی است. همه اینها اطلاعاتی است که جمع‌آوری آنها از عمق زندگی مردم شکل می‌گیرد. بحث امنیت اینها، حریم خصوصی، اینکه نحوه بهره‌برداری از آنها به چه شکلی باشد، بسیار مهم و حیاتی می‌شود. اما اگر حریم خصوصی را بشکند، همه جلوی آن خواهند ایستاد و جلویش را می‌گیرند. یا اگر امنیت مردم را از بین ببرد، جلوی آن را خواهند گرفت. بنابراین اگر در مورد اینها فکر نشود، بعدا گرفتاری خواهیم داشت. فکر کنید الان ویروسی در موبایل من باشد. ممکن است دو فایل من از بین برود، این مشکلی نیست. اما اگر فردا ویروسی وارد یخچال من شود، ممکن است باعث شود یخچال بسوزد. موضوع خیلی جدی‌تر خواهد بود. بحث حاکمیت دیتا و حریم خصوصی و بحث امنیت اطلاعات، بسیار حیاتی است.
‌ آیا الان در ایران برای اینها استراتژی و برنامه وجود دارد یا نه؟
بحث‌های جسته‌گریخته‌ای را می‌شنویم. شورای فضای مجازی در جایی به‌وجود آمد برای حل‌و‌فصل همین مسائل. یعنی جایی که به نوعی فراقوه‌ای است و همه در آن هستند و باید اینها را حل کنند. می‌دانم کارهایی را شروع کرده‌اند اما نیاز داریم زودتر به جمع‌بندی برسند. وگرنه اگر طول بكشد مانند قضیه ویدئو، به نقاطی می‌رسیم که بالاخره زمان را از دست می‌دهیم.
‌ عقب‌ماندگی را هم نمی‌توان جبران کرد.
سرعت عمل لازم است. وگرنه ساختار نهادی آن الان وجود دارد. باید زودتر به نتیجه برسند.
‌ مسئله‌ای که وجود دارد، این است که میانگین سن مدیریتی در کشور، سن بالایی است. از طرفی دانش اینها نسبت به دنیای تکنولوژی و فناوری از جنس حوزه ‌آی‌تی و سایبر، خیلی پایین است. به نظرتان این چقدر روی این مسائل تأثیر گذاشته است؟
بی‌تأثیر نیست. خوشبختانه البته وزیر و میانگین سنی مدیران وزارتخانه ارتباطات جوان است.
‌ فکر می‌کنم در فهماندن مسائل و اهمیت موضوعات به مدیران دیگر که سن و سالی داشته و دانش کمتری دارند، مؤثر است.
همین‌طور است. مسلما این حوزه، حوزه جوانی است. هر چه نیروهای جوان در اینجا باشند، به‌روزتر و با سرعت بیشتری می‌توانند تصمیم‌گیری کنند و این واقعا مهم است. جوان‌گرایی در جاهای دیگر هم مهم است اما در این حوزه بیشتر خودش را نشان می‌دهد و نقش دارد.
‌ به نظرتان بیگ‌دیتا بیشتر از چه لحاظی واجد اهمیت است؟ سیاسی، اقتصادی، امنیتی و...؟
ما بیگ‌دیتا را بیشتر از منظر اقتصادی نگاه می‌کنیم. از دید ما که آدم‌های فنی هستیم، بحث اقتصادی آن از هر چیزی مهم‌تر است. ولی همه ما می‌دانیم امنیت، بالاترین نیاز یک جامعه است و اگر امنیت تأمین نشود، خط بطلان روی همه اینها کشیده خواهد شد. بنابراین می‌توان گفت مسائل امنیت و حریم خصوصی بالاترین درجه اهمیت را دارد. خودم اگر احساس کنم از دیتای من بهره‌برداری شود و منفعتی هم براساس آن به خود من می‌رسد اما در قبالش حریم خصوصی‌ام شکسته می‌شود، می‌گویم نمی‌خواهم. بنابراین بحث‌های عمده اهمیت آن، اقتصادی است ولی بحث‌های امنیت و حریم خصوصی، حق وتو دارند. با این توجیه می‌توان گفت آنها در رده بالاتری هستند که بحث حاکمیت و امنیت و حریم خصوصی آن باید ابتدا حل شود. بعد جا برای بهره‌برداری اقتصادی سالم باز خواهد شد.
‌ به دلیل محدودیت‌ها و فیلترینگی که در کشور وجود دارد، استفاده از فیلترشکن‌ در ایران رواج زیادی دارد. برخی منتقدان معتقد هستند همین مسئله فیلترشکن باعث می‌شود بخشی از حجم مهم ترافیک داده خودمان را با این کار به خارج از کشور بفرستیم. نظر شما دراین‌باره چیست؟
این معضلی است که ما داریم و هزاران مشکل برای ما ایجاد می‌کند. یک مشکل آن همین است که شما اشاره کردید. بخشی از ترافیک ما بی‌دلیل به خارج از کشور منتقل می‌شود و این ضرر اقتصادی هم دارد.
‌ به واسطه همین فیلترشکن‌ها؟
بله. در درجه اول ضرر اقتصادی دارد که خیلی بد است. بحث‌های امنیت هم در جای خود که خیلی مهم است. مهم‌تر اینکه برخی سرویس‌ها عملا دچار مشکل می‌شوند. یک‌سری سرویس‌ها مبتنی بر مکان هستند. می‌توانید از روی موقعیت مکانی به تحلیل‌هایی برسید که خیلی به درد می‌خورند. اما کسی که فیلترشکن استفاده می‌کند، عملا مکانش گم می‌شود و این اطلاعات را ندارید. اگر هم دارید، غلط است. بنابراین خیلی از تحلیل‌ها و کارها را نمی‌توان انجام داد. این واقعا آسیبي است که متأسفانه در کشور ما وجود دارد.
‌ در برخی کشورها مثل چین هم مشابه چنین چیزی وجود دارد.
بله، دو، سه کشور هستند که وضعیت مشابهی دارند.
‌ چینی‌ها البته نمونه داخلی هر پلتفرمی را آماده کرده‌اند.
فکر نمی‌کنم کاربران چینی مشابه فیلترشکنی را که ما می‌شناسیم و به این مقدار استفاده کنند. فیلترینگ آنها خیلی سختگیرانه‌تر است. البته جایگزین‌هایی برای خود درست کرده‌اند. اما فکر نمی‌کنم به این شکل فیلترشکن در جایی استفاده شود. بخشی از دیتا را عملا با این شرایط از دست می‌دهیم؛ به خاطر وجود فیلترشکن.
‌ اینکه گفتید با فیلترشکن برای سرویس‌ها اطلاعات را از دست می‌دهیم، بیشتر توضیح دهید.
مثلا در بحث لوکیشن یا اطلاعات مکانی. لوکیشن، اطلاعات خیلی باارزشی است. اینکه آدم‌ها در کجا، کاری انجام می‌دهند. مثلا آدم‌های فلان شهر، چه چیزی سرچ می‌کنند، از آن می‌توانید ترندی را در آن شهر تشخیص دهید. اینها را با رعایت حریم خصوصی می‌گویم. از نظر نیاز آن شهر، نیاز آن منطقه، اطلاعاتی را می‌توان به دولت داد تا برای آن برنامه‌ریزی کند. از اینها می‌توان اطلاعات کسب کرد. اما وقتی وی‌پی‌ان استفاده شود، این اطلاعات گم می‌شود. اتفاقا اینها در بیگ‌دیتا، مهم‌ترین اطلاعات و بسيار باارزش هستند که با فیلترشکن عملا اینها را از دست مي‌دهيم.

 

اخبار مرتبط سایر رسانه ها