به گزارش ایران اکونومیست؛ امیر هامونی با اشاره به سرعت فزاینده تولید اطلاعات در سطح دنیا به آماری در این خصوص اشاره کرد و گفت: در سال ۲۰۱۸ تقریبا ۳۳ زتابایت (Zettabyte) داده در سطح دنیا تولید شده است که پیشبینی میشود این حجم داده به ۱۷۵ زتابایت تا سال ۲۰۲۵ میلادی افزایش یابد.
مدیرعامل فرابورس با بیان اینکه بخشی از این اطلاعات در بازار سرمایه تولید و استفاده شده و دیتا در این بازار از اهمیت ویژهای برخوردار است، افزود: به عنوان مثال نگاهی به صورتهای مالی بورس لندن و گروه آیس -که بورسهای نزدک و نیویورک نیز به عنوان زیر مجموعه این گروه فعالیت میکنند- نشان میدهد بخش عمدهای از درآمد این بورسها از طریق فروش خدمات یا ارائه خدمات مربوط به داده به دست آمده است.
به گفته وی در بورس لندن در ۱۲ ماهه منتهی به ۳۱ دسامبر ۲۰۱۷ رقمی نزدیک به ۷۳۶ میلیون دلار درآمد از محل خدمات داده کسب شده است و در گروه آیس (Intercontinental Exchange) نیز دومین منبع کسب درآمد از محل فروش خدمات یا ارائه خدمات مرتبط به داده بوده است به طوری که از سال ۲۰۱۳ تا ۲۰۱۷ درآمدزایی این گروه از ۲۳۶ میلیون دلار با رشد ۱۰ برابری به رقم ۲ میلیارد و ۸۴ میلیون دلار رسیده است.
هامونی با بیان اینکه صاحبنظران معیارهای مختلفی برای طبقهبندی دادهها به بزرگ ارائه کردهاند، ادامه داد: در دادههای بزرگ ۵ ویژگی حجم، سرعت، تنوع، ارزش و میزان صحت دادهها از اهمیت زیادی برخوردار است تا دادهها در زمره دادههای بزرگ یا حجیم دستهبندی شوند.
وی در توضیح این ویژگیها بیان کرد: «تنوع» دادهها به انواع دادهها و «سرعت» آن به نرخ تولید و پردازش اشاره دارد، «صحت» دادهها نیز بیانگر این موضوع است که به چه میزان میتوان به دادهها اتکا کرد که متاثر از قابلیت اتکای منابع دادههاست؛ «حجم» نیز بیانگر میزان دادهها و در نهایت «ارزش» دادهها، بیانگر ارزش پولی ایجاد شده برای سازمان یا شرکت است که در نتیجه استفاده و بکارگیری دادههای بزرگ است.
مدیرعامل فرابورس در بخش دیگری از سخنان خود به بحث دادههای تولیدشده در بازار سرمایه ایران اشاره کرد و گفت: اینکه در بازار سرمایه ایران دادههایی که تولید میشود در زمره دادههای بزرگ است یا خیر، بحثهای فراوانی انجام شده و با وجود آنکه برخی معتقدند این دادهها بزرگ نیست، اما بر اساس بررسیهای صورتگرفته و ۵ ویژگی مطرحشده باید اذعان داشت این دادهها حجیم هستند که باید تدابیر لازم را برای چگونگی استفاده از این دادهها با حفظ محرمانگی آن بیاندیشیم.
به گفته هامونی در بازارهای مالی و بورسها ۳ دسته مختلف از افراد از دادههای تولیدشده بهرهبرداری میکنند؛ سرمایهگذاران که عموما نگاه بنیادی به سرمایهگذاری خود دارند و دادههای ماهانه برای آنها از اهمیت زیادی برخوردار است، سفتهبازها که دادههای روزانه و حتی دقیقهای برای آنها حائز اهمیت است و بازارگردانها که دادههای لحظهای و Real Time برای موفقیت آنها در کار بسیار مهم است.
وی همچنین موضوع مهم دیگر در ارتباط با دادههای بزرگ و انتشار آنها را بحث محرمانگی این دادهها و سطح انتشار دادهها عنوان کرد.
مدیرعامل فرابورس با اشاره به اینکه میان محرمانگی دادهها و سطح انتشار آنها یک بده-بستان وجود دارد به این معنی که اگر بخواهیم محرمانگی دادهها در حد اعلا حفظ شود، هیچ دادهای قابل ارائه نیست، بیان کرد: بنابراین از آنجا که هیچ راهحل مناسبی برای تمام موارد محرمانگی دادهها وجود ندارد و به اصطلاح نمیتوان یک نسخه یکسان را برای همه موارد تجویز کرد، قانونگذاران و نهادهای ذیربط لازم است به منظور تقارن اطلاعاتی و اجرای قوانین و مقررات اثربخش، فرایندهای مدیریت اطلاعاتی را به طور شفاف و مشخص طراحی و اجرا کنند و به منظور ارزیابی ریسکهای مختلف؛ ضروری است به صورت مستمر این فرایندها را مورد ارزیابی، پایش و اصلاح قرار دهند.
حفظ محرمانگی دادهها
هامونی همچنین از روشهای متفاوتی سخن گفت که برای حفظ محرمانگی دادههای بزرگ وجود دارد و قابل استفاده است و به گفته وی دادههای باز مجهول، مستعارسازی داده، محرمانگی تفاضلی و روش پنج-پنجاه از جمله روشهایی است که در این زمینه به کار میروند.
وی در خصوص بحث «دادههای باز مجهول» عنوان کرد: در این روش اطلاعات شخصی افراد در بازار به صورت عمومی منتشر نمیشود و با یک سازوکاری داده جمعی از سرمایهگذاران یا مردم در اختیار کسب و کارها قرار میگیرد. در روش «مستعارسازی داده» نیز از حروف الفبا به جای ذکر نام اشخاص، شرکت و ... استفاده میشود.
وی همچنین یکی دیگر از بحثهای مجهولسازی دادهها را برای حفظ محرمانگی آنها روش «محرمانگی تفاضلی» ذکر کرد و گفت: در این روش نیز دادهها تا حدی مجهول میشوند که هیچکس قادر به تشخیص هویت شخص یا اشخاصی که دادههای آنها منتشر شده است، نباشد. به عنوان مثال اگر برای یک شخص ۱۰۰ فیلد اطلاعاتی وجود داشته باشد و ۹۹ فیلد آن را منتشر کنیم و آن فیلدی که منتشر نشده است افشاکننده هویت فرد باشد، با هر روش ریاضی و آماری نتوان حتی با دریافت اطلاعات آن ۹۹ فیلد به هویت شخص پی برد.
به گفته مدیرعامل فرابورس در شرکتهای بزرگی همچون آمازون، فیسبوک و اپل در بحث محرمانگی داده از روش محرمانگی تفاضلی استفاده میشود اما تاکتیکهای آن متفاوت است. وی در توضیح روش پنج-پنجاه نیز گفت: دادههای مجموع جامعهای را که تعداد افراد آن کمتر از ۵ نفر است نمیتوان منتشر کرد زیرا با روشهای ریاضی و آماری اثبات شده است که در جامعهای با کمتر از ۵ نفر، هویت افردا قابل شناسایی است. همچنین در حجم افرادی که در یک جامعه وجود دارد اگر شخصی بیش از ۵۰ درصد از تراکنشهای مالی را به خود اختصاص داده باشد نباید داده این جامعه نیز افشا شود زیرا هویت افراد در آن با برخی روشها قابل دسترسی است.
مصادیق افشای اطلاعات
وی در عین حال به برخی مصادیق افشای اطلاعات و انتشار دادهها در بازار سرمایه اشاره کرد که در خصوص آنها باید تعاریف مربوط به انتشار این دادهها را بار دیگر مورد بررسی قرار داد و در خصوص آنها تامل کرد.
به گفته مدیرعامل فرابورس موضوع اصلی و اساسی این است که افراد و سازمانهای ذیربط نظیر سازمان بورس، فعالان بازار سرمایه، نهادهای نظارتی، قانونگذاری و غیره باید درک صحیحی از اسرار تجاری افراد و شرکتها داشته باشند تا الزامات تعیینشده منجر به افشای اطلاعات محرمانه اشخاص نشود.
وی پیشنهاد کرد با همکاری سازمان بورس پروژهای را در زمینه بازتعریف و بازنگری در مرز محرمانگی انتشار دادههای بزرگ بازار سرمایه آغاز کنیم؛ چرا که دستورالعمل افشای اطلاعات مالی که هماکنون ملاک انتشار اطلاعات در این بازار است مربوط به سالها قبل میشود و لازم است بار دیگر مورد بازنگری قرار گیرد.
وی در پایان اظهار کرد: امیدواریم با همکاری جامعه دانشگاهی و متخصصان و صاحبنظران بتوانیم مرز محرمانگی درست و کارا را در بازار سرمایه تعریف کنیم به این معنی که جلوی انتشار اطلاعات افراد را در صورت محرمانه بودن بگیریم، اما دادههای مناسب را برای رقابتپذیری کسب وکارها، استارتآپهای فینتک و ... در اختیار آنها قرار دهیم.