خانه » مقالات » علم داده و تاثیرات اجتماعی آن در عصر فضای مجازی
علم داده و تاثیرات اجتماعی آن در عصر فضای مجازی
شنبه, ۱ آذر ۱۳۹۹
زمان تقریبی مطالعه ۳۷ دقیقه
جامعه نیاز به انسان‌هایی دارد که مشتاق و راست‌گو هستند. جامعه نیاز به همه‌ی مهارت‌هایی دارد که تنها شناختی نیستند، همانند مهارت‌های احساسی و محبت‌آمیز. نمی‌توان یک جامعه را تنها بر اساس داده و رایانه پیش برد. (آلوین تافلر، نویسنده و آینده‌پژوه برجسته‌ی آمریکایی)

علم داده و یادگیری ماشین در بخش‌های مختلف صنعتی و اقتصادی ما کاربرد دارد. امروزه بسیاری از تصمیم‌گیری‌های انسانی با مشورت الگوریتم‌های یادگیری ماشین و یا حتی توسط خود الگوریتم‌ها انجام می‌گیرد. مسائل اخلاقی مرتبط با علم داده در سطوح مختلفی قابل بررسی هستند؛ مسائلی که زندگی فردی و حریم خصوصی را تحت تأثیر قرار می‌دهد و مسائلی که تأثیرات گسترده‌ای بر گروه‌های مختلف جامعه دارد. مسائل اخلاقی علم داده در زمینه‌های اعتبار داده، حریم خصوصی و مشکلات ناشی از عدم استفاده‌ی مناسب از علم داده بروز می‌کند و دانشمندان داده تلاش می‌کنند با شناسایی این مسائل اخلاقی از بروز آن‌ها جلوگیری کنند. در این متن، می‌خواهیم در مورد تأثیرات و پیامدهای اجتماعی علم داده مطالبی را ارائه کنیم.

هنگام انجام فرآیندهای علم داده، اقداماتی جهت اعتبارسنجی فرآیندهای علم داده انجام می‌شود؛ اقداماتی از قبیل بررسی تناسب داده با سوالی که از علم داده برای پاسخ به آن سوال استفاده می‌شود یا نمایش مناسب داده‌ها به هنگام انتقال یافته‌های فرآیند تحلیل داده. مسئله‌ی حفظ حریم خصوصی نیز از جمله مسائلی است که در فرآیندهای علم داده همیشه مورد نظر است و حتی قوانین مهمی نیز در این راستا تدوین شده است که متخصصان علم داده را ملزم به رعایت برخی موارد قانونی می‌کند. این امکانات برای کاهش جنبه‌های نامناسب استفاده از داده لازم هستند، اما مسائل اخلاقی علم داده تنها به این موارد خاتمه نمی‌یابد. درواقع هنوز هم امکان آن وجود دارد که کاربست داده تأثیرات اجتماعی غیرمنتظرانه‌ای به دنبال داشته باشد. پیامدهای اجتماعی استفاده از علم داده لزوماً منفی نیستند و می‌توانند مثبت باشند. حتی می‌توان با استفاده‌ی مناسب از علم داده، در حل مشکلات اجتماعی جامعه سهیم بود. در واقع کسب‌وکارهایی وجود دارند که هدف آن‌ها استفاده از منافع علم داده جهت خدمت‌رسانی به عموم جامعه است. در این یادداشت به نمونه‌هایی از این شرکت‌ها و فعالیت‌های آن‌ها اشاره خواهیم کرد. البته استفاده از علم داده پیامدهای منفی اجتماعی نیز می‌توانند به دنبال داشته باشند که در اینجا بحث خواهیم کرد.

پیامدهای اجتماعی مطلوب استفاده از علم داده

همانطور که اشاره کردیم برخی از شرکت‌ها از علم داده برای تأثیرگذاری مثبت در مسائل اجتماعی استفاده می‌کنند. در این یادداشت یک شرکت را مثال می‌زنیم و سعی می‌کنیم نشان دهیم که این شرکت چگونه از علم داده در کار خود استفاده می‌کند.

شرکت سوشال‌کاپس[۱] با هدف حل مسائل مهم جهانی از طریق استفاده از علم داده تأسیس شده است. این شرکت به مدت 5 سال است که ابزارهایی توسعه داده است که بتوان پروژه‌های علم داده را در مقیاس‌های بزرگ پیاده‌سازی کرد. این شرکت از کلان‌داده برای یافتن سریع‌ترین مسیر به خانه‌ها و ردیابی محموله‌های غذایی استفاده می‌کند. هدف این شرکت استفاده از علم داده در حل مسائلی است که سلامت، امنیت و شادی میلیاردها انسان را تحت تأثیر قرار می‌دهد[۲].

نمونه‌ای از مسائل حل شده توسط این شرکت، بهبود دستیابی به بازار برای کشاورزان خرد در زامبیا است. این مسئله با همکاری برنامه‌ی جهانی غذای[۳] سازمان ملل متحد انجام شده است. برنامه‌ی جهانی غذا یک برنامه، مانو[۴]، تهیه کرده است که کشاورزان روستایی در زامبیا را به داده‌های بازار و خریداران متصل می‌کند. برنامه‌ی جهانی غذا از برنامه‌ی کالکت[۵] که محصول شرکت سوشال کاپس است برای نظارت و ارزیابی اثر برنامه‌ی آزمایشی خود استفاده کرده است [1].

یکی از مشکلات در زامبیا، عدم دسترسی کشاورزان خرد به اطلاعات بازار به خاطر فقر بود. در سرتاسر آفریقا، میلیون‌ها کشاورز روستایی خرد گرفتار فقر هستند. بازار کشاورزی روستایی غیرمتمرکز است و کشاورزان به اطلاعات واقعی و در لحظه‌ی بازار دسترسی ندارند. به این دلیل، آن‌ها مجبور می‌شوند که محصولات خود را به یک دلال محلی با قیمت بسیار پایین بفروشند. این عدم تقارن در دسترسی به اطلاعات، مانع از گسترش کسب‌و‌کار کشاورزان و افزایش درآمدشان می‌شود. برای حل این مشکل، سازمان جهانی غذا برنامه‌ی مانو را تهیه کرد که در واقع یک بستر مجازی برای بازار کشاورزان است. با ارائه‌ی اطلاعات واقعی و در لحظه در مورد قیمت محصولات و اتصال کشاورزان به خریداران، برنامه‌ی مانو یک بازار شفاف و مطمئن ایجاد کرده است که کشاورزان قدرت چانه‌زنی بیش‌تری دارند و در نهایت می‌توانند محصولات خود را به قیمت منصفانه‌تری به فروش برسانند. برنامه‌ی جهانی غذا، اپلیکیشن مانو را در 4 منطقه از زامبیا به صورت آزمایشی اجرا کرده است تا اثرات آن را شناسایی و ردیابی کند. محصولات علم داده‌ی شرکت سوشال‌کاپس در این فاز از پروژه که نیاز به جمع‌آوری دارد، کمک کرده است.

در هنگام استفاده‌ی آزمایشی از اپلیکشین مانو، برنامه‌ی جهانی غذا از نرم‌افزار کالکت که یک برنامه‌ی گوشی تلفن همراه جهت جمع‌آوری داده است به منظور نظارت و ارزیابی اثر اپلیکیشن مانو استفاده کرده است. با تجهیز 50 کشاورز پیشرو به کالکت، برنامه‌ی آزمایشی توانست تراکنش‌های بین کشاروزان پیشرو و خریداران نهایی را به صورت موفقیت‌آمیز اندازه‌گیری کند. در همین حال، کالکت برای جمع‌آوری داده‌های اقتصادی و داده‌های اجتماعی کشاورزان دنباله‌رو نیز استفاده شد. در این بررسی منظور از کشاورزان دنباله‌رو، کشاورزانی است که با استفاده از طریق تراکنش با کشاورزان پیشرو به بازار مجازی متصل شدند. برنامه‌ی جهانی غذا با ترکیب داده‌های جمع‌آوری‌شده توسط کالکت به یک سامانه‌ی واحد، توانست شبکه‌ی بین خریداران، کشاورزان پیشرو و کشاورزان دنباله‌رو به دست آورد و اثر برنامه‌ی آزمایشی خود را به دقت ارزیابی کند. اوین جویس[۶]، عضو برنامه‌ی جهانی غذا و مدیر اپلیکیشن مانو، می‌گوید:

«با استفاده از نرم‌افزار کالکت، ما توانستیم از کشاورزان خرد روستایی که تا به حال داده‌ای فراهم نکرده بودند، داده جمع‌آوری کنیم. نکته‌ی جالب این است که داده‌ای که آن‌ها فراهم کردند، با جزئیات، دقیق، در زمان واقعی و مختص موقعیت جغرافیایی خاصی بود. ما از این بصیرت‌ها استفاده کردیم تا طراحی پروژه را طوری تطبیق دهیم که مطمئن باشیم اپلیکیشن مانو به کشاورزان آسیب‌پذیر این جوامع کمک می‌کند.»

امیلی زاندونا[۷]، تحلیل‌گر داده در مانو و عضو برنامه‌ی جهانی غذا می‌گوید:

«زمانی که کلان‌داده را تحلیل می‌کنیم، یکی از بازدارنده‌های اصلی زمان لازم برای مرتب‌سازی داده است. سرعت مرتب‌سازی داده در نرم‌افزار کالکت با قابلیت بارگیری داده بسیار قابل توجه است. داده از قبل مرتب شده است و آماده‌ی تحلیل است.»

نتیجه‌ی این اقدامات در برنامه‌ی آزمایشی این بود که 50 کشاورز پیشرو و تقریباً 1200 کشاورز دنباله‌رو توانستند نزدیک به 100 تراکنش را از طریق اپلیکیشن انجام دهند. این تراکنش‌ها وزنی نزدیک به 50000 کیلوگرم و ارزشی معادل 47000 دلار در بر داشت. با توجه به این آمار امیدوارکننده و داده‌های جمع‌آوری شده با کالکت، برنامه‌ی جهانی غذا قصد دارد که پروژه را گسترش دهد تا 500 کشاورز پیشرو و 25000 کشاورز دنباله‌رو را شامل شود.

پیامدهای اجتماعی نامطلوب استفاده از علم داده

علم داده پیامدهای اجتماعی نامطلوب و منفی نیز می‌تواند داشته باشد. یکی از سخت‌ترین کارهای در توسعه‌ی محصولات و فرآیندهای داده‌محور، پیش‌بینی اثرات اجتماعی نامطلوب آن‌هاست. این اثرات معمولاً تا قبل از پیاده‌سازی ناشناخته هستند و پیچیدگی تعاملات انسانی در جامعه، پیش‌بینی آن‌ها را دشوار می‌کند.

یکی از پیامدهای نامطلوب اجتماعی علم داده، دامن زدن به کلیشه‌ها[۸] است. کلیشه‌ها عبارت‌هایی کلی در مورد یک جمعیت از جامعه هستند و معمولاً بخشی از حقیقت را در خود دارند. اما قضاوت یک فرد خاص از یک جمعیت بر اساس کلیشه‌های رایج در مورد آن جمعیت منصفانه و عادلانه نیست. باور به کلیشه‌ها می‌تواند در عملکرد افراد نتایج مثبت یا منفی داشته باشد. در اینجا بیشتر جنبه‌ی منفی باور به کلیشه‌ها مورد نظر ماست.

در روان‌شناسی نظریه‌ای به نام تهدید کلیشه[۹] وجود دارد. تهدید کلیشه‌ای موقعیتی است که در آن افراد در معرض خطر یا احساس خطر انطباق با کلیشه‌های مربوط به گروه اجتماعی خود هستند. به عنوان مثال، کلیشه‌ی رایجی وجود دارد که زنان در فعالیت‌های ریاضی و منطقی ضعیف‌تر از مردان هستند. حال اگر دختری در یک مسابقه‌ی ریاضی با گروهی از پسران قرار گیرد، باور به این کلیشه (خودآگاه یا ناخودآگاه) در چنین موقعیتی، عملکرد او را ممکن است تضعیف کند.

اما دقت کنید که کلیشه‌ها از اطلاعات و حوادث گذشته ناشی می‌شوند. به عنوان مثال، از سال 1924/1303 تا کنون، هر 4 سال یک بار مدال فیلدز[۱۰] به بزرگترین ریاضیدانان جهان اعطا می‌شود. در میان برندگان مدال فیلدز، تنها یک بار این جایزه توسط یک زن برده شده است؛ خانم مریم میرزاخانی که دانش‌آموخته‌ی کارشناسی ریاضی دانشگاه صنعتی شریف بود. کلیشه‌ها ریشه در حقیقت دارند اما تمام آن نیستند و نباید مبنای قضاوت در مورد افراد یک گروه اجتماعی (یک جنسیت یا یک نژاد و …) قرار گیرند.

ما انسان‌ها در ساختن کلیشه‌های از داده‌های قبلی استفاده می‌کنیم و ممکن است در تصمیم‌گیری‌ها این کلیشه‌ها بر ذهن ما اثرگذار باشد. الگوریتم‌هایی که از داده‌های قبلی استفاده می‌کنند نیز از این اشتباه مصون نیستند. در واقع الگوریتم‌های داده‌محور از همین روش برای قضاوت در مورد افراد استفاده می‌کنند. آن‌ها با استفاده از خصوصیات و صفات یک فرد، به سوال مربوط به آن شخص پاسخ می‌دهند و پاسخ آن‌ها بسیار کمی‌تر و مبتنی بر عدد و رقم است. بنابراین از ماشین‌ها نیز انتظار چنین پیامدهای اجتماعی می‌رود و در کاربست آن‌ها به این مسئله نیز باید توجه کرد.

در فضای رسانه مفهومی به نام اتاقک پژواک[۱۱] وجود دارد. اتاقک پژواک یعنی محیطی که در آن یک فرد تنها با عقاید، نظرات و باورهایی نزدیک به نظرات خودش روبه‌رو می‌شود و نظرات و عقاید بدیل را در نظر نمی‌گیرد[۱۲] [2]. قرارگرفتن در چنین محیطی می‌تواند تهدیدات اجتماعی و سیاسی ایجاد کند. فردی که در اتاقک پژواک قرارگرفته است و عقاید مخرب یا اشتباهی دارد، اگر به زیان‌بار بودن عقاید خود پی نبرد ممکن است بر اساس عقاید خود دست به اقدامات مخرب یا جنایت‌کارانه بزند.

برای خارج کردن یک شخص از اتاقک پژواک، نخستین گام آگاه ساختن او به وجود نظریات و عقاید بدیل است؛ عقایدی که شاید برای آن شخص دلپذیر نباشد اما وجود دارد و طرفدارن بسیاری نیز دارد. این قسمت همان جایی است که علم داده می‌تواند مشکل‌آفرین باشد. در بسیاری از الگوریتم‌های یادگیری ماشین که در رسانه‌های اجتماعی همانند توئیتر، اینستاگرام، تلگرام و … استفاده می‌شود، هدف الگوریتم آن است که با تشخیص علاقه‌مندی‌های کاربر، محتوایی را به او پیشنهاد دهد که برای او خوش‌آیند باشد. این الگوریتم‌ها که سامانه‌های پیشنهادگر نام دارند و از دو نوع داده برای دادن پیشنهادهای مناسب ممکن است بهره‌مند شوند. نخستین نوع داده، داده‌های حاصل از فعالیت‌های خود شخص در بستر یک وب‌سایت یا رسانه‌ی اجتماعی است. به عنوان مثال، کاربر ممکن است در بستر اینستاگرام کاربری در پست‌هایی که محتوای عاشقانه دارد کامنت گذاشته باشد یا آن‌ها را لایک کرده باشد و کاربر دیگری محتواهای فوتبالی را پسندیده باشد. ماشین با استفاده از این داده‌ها، به کاربر اول محتواهای عاشقانه را پیشنهاد می‌دهد و به کاربر دوم محتواهای فوتبالی را. دومین نوع داده که می‌تواند مورد استفاده قرار گیرد، داده‌های فعالیت‌های مربوط به حلقه‌ی دوستان کاربر و داده‌های اشخاصی است که دوست کاربر نیستند اما محتواهایی مشابه با محتواهای کاربر را می‌پسندند.

در هر حالت، الگوریتم‌های یادگیری ماشین هدف پیشنهاد محتوای بهینه و جذاب به کاربر را دارند و بنابراین این الگوریتم‌ها کاربر را در اتاقک پژواک قرار می‌دهند.

بگذارید نمونه‌ی دیگری از اثرات اجتماعی نامطلوب استفاده از علم داده ارائه کنیم. یک پیشفرض رایج در جامعه و به خصوص در بین دانشگاهیان وجود دارد و آن این است که جوامع با داده‌های باز؛ یعنی جوامعی که در آن داده‌ها در دسترس عموم هستند کاری خوب است و به مردم‌سالاری کمک می‌کند. در مرحله‌ی اول این مطلب معقول به نظر می‌رسد. اگر تمام داده‌ها در دسترس همگان قرار بگیرد، افراد بیشتری می‌توانند از داده‌های اطلاعات مربوط به خود را استخراج کنند و متناسب با شرایط موجود برنامه‌ریزی کنند. همچنین در کاهش فسادهای سیستمی نیز می‌تواند مفید باشد. اما آیا داده‌های باز اثرات اجتماعی نامطلوبی نیز می‌‌تواند داشته باشد؟

اداره‌ی آموزش و پروش ایالت نیویورک در آمریکا داده‌های آموزشی را به صورت رایگان و کاملاً باز در اختیار عموم قرار داده است[۱۳]. آن‌ها امکاناتی برای نمایش و مصورسازی داده‌ها به شکل جدول و نمودار در وب‌سایت خود فراهم کرده‌اند اما با وجود این، اشخاص می‌توانند داده‌ها را خود بارگیری نمایند و اطلاعات متنوع‌تری را از آن‌ها استخراج کنند. هدف اصلی این خدمات، کمک به والدین و خانواده‌ها در انتخاب بهترین مدرسه برای تعلیم و تربیت فرزندانشان است.

نخستین مشکل در خود داده‌هاست. افراد یک جامعه در مورد آموزش مناسب طرز فکر یکسانی ندارند. از نظر عده‌ای آموزشی مناسب است که دانش‌آموزان را برای امتحان‌های ورود به دانشگاه آماده کند، اما از نظر برخی دیگر آموزشی مناسب‌تر است که به دانش‌آموزان مهارت‌های زندگی و ارتباطی کافی جهت زندگی اجتماعی بهتر در جامعه را آموزش دهد. میزان تنوع نظرها بسیار بیشتر از آنی است که گفته شده است، بنابراین جمع‌آوری داده‌ها با هدف کمک به انتخاب مدرسه‌ی بهتر، کاری پیچیده است و نمی‌تواند ملاک‌های تمام افراد یک جامعه را در بر بگیرد.
دومین مشکل در میزان بهره‌برداری افراد مختلف از داده‌های باز است. میزان بهره‌برداری خانواده‌های مختلف از داده‌ها یکسان نیست. خانواده‌های مختلف سواد آماری و حتی سواد پایه‌ی متفاوتی دارند. برخی خانواده‌ها امکان وقت گذاشتن برای فهم داده‌ها و معنای متغیرهای مختلف را دارند. برخی هم امکانات اقتصادی لازم برای استخدام تحلیل‌گران داده و بررسی گزینه‌های پیش‌رو دارند. اما بسیاری از خانواده‌ها یا سواد کافی ندارند یا وقت کافی ندارند و یا ثروت کافی ندارند تا بتوانند از همین داده‌های باز برای انتخاب مناسب‌تر استفاده کنند. بنابراین یکی از پیامدهای اجتماعی همین داده‌های باز آن است که باز بودن داده‌ها کمکی به گسترش عدالت کمکی نمی‌کند. برای بسیاری از افراد جامعه، داده‌های باز نه اطلاعات آن‌ها را فزایش می‌دهد و نه قدرت تصمیم‌گیری آن‌ها را بهتر می‌کند. بنابراین داده‌های باز در این مورد، حتی به گسترش بی‌عدالتی کمک نیز می‌کند.

سومین مورد که در داده‌های باز باید توجه شود، در نحوه‌ی انتخاب است. در بسیاری از موارد، آن انتخابی که به صلاح جامعه است با خواهش‌های فردی انسان‌ها و موقعیت‌های مطلوب آن‌ها در تضاد است. به عنوان مثال، مطالعات دانشگاه هاروارد نشان می‌دهد که وجود تنوع در کارکنان یک محیط به نفع مجموعه است با این وجود کارکنان چنین محیط‌هایی کمتر شاد هستند و کمتر احساس موفقیت می‌کنند [3]. اگر به کارکنان در این زمینه حق انتخاب داده می‌شد، آن‌ها برای شادی خود محیطی با تنوع کمتر انتخاب می‌کردند هرچند این انتخاب به نفع مجموعه یا جامعه نباشد. دقیقاً به همین دلیل، انتخاب مدارس به مردم جامعه اجازه‌ی «خودتفکیکی[۱۴]» می‌دهد. خانواده‌های سیاه‌پوست مدارسی را انتخاب می‌کنند که اکثر دانش‌آموزان سیاه‌پوست هستند و سفیدپوستان مدارسی را ترجیح می‌دهند که بیشتر بچه‌ها سفیدپوست هستند. این نوع گزینش حتی قبل از وجود داده‌های باز هم صورت می‌گرفت اما با ظهور پدیده‌ی داده‌های باز، خودتفکیکی افزایش یافته است. بدین سبب، مدارس ایالت نیویورک در کل آمریکا، بیشترین تفکیک و جداسازی را دارند [4]. داده‌های باز سبب تفکیک و جداسازی گروه‌های مختلف جامعه شده است و بدون شک در درازمدت پیامدهای فردی و اجتماعی جدی را به دنبال خواهد داشت. حتی کودکان خانواده‌های برخوردار در محیط‌هایی با تنوع گروه‌های اجتماعی، بهتر پرورش می‌یابند اما بسیاری از والدین این کودکان برخلاف چنین واقعیتی انتخاب می‌کنند.

هنگامی که داده‌های باز را انتشار می‌دهیم به چه پیامدهای اجتماعی باید فکر کنیم؟ آیا داده‌های باز به همدلی و وحدت بین آحاد جامعه کمک می‌کند؟ یا این‌که سبب جدایی و قطبیت بیشتر در جامعه می‌شود؟ چه کسی ارزش‌های ما را تعیین می‌کند و چه کسی بر حرکت ما به سمت آن ارزش‌ها نظارت می‌کند؟ اگر به جنبه‌های مختلف، مزایا و معایب داده‌های باز فکر نکنیم، باز کردن داده‌ها و در دسترس قرار دادن آن‌ها برای همه، به گسترش بی‌عدالتی و مشکلات ساختاری جامعه قوت می‌بخشد. مخلص کلام این است که داده‌های باز که در ابتدا امری مطلوب و منصفانه به نظر می‌رسد، می‌تواند اثرات اجتماعی نامطلوبی داشته باشد و بنابراین در مورد آن‌ها باید عمیق‌تر اندیشید.

جمع‌بندی

استفاده از علم داده نیازمند توجه به نکات اخلاقی بسیاری است. بخشی از این نکات اخلاقی مانند حریم خصوصی، مورد توجه ویژه‌ای است و جنبه‌های گوناگون آن تا حد خوبی شناسایی شده‌اند. مسائل حریم خصوصی، ناشناس ماندن، مالکیت داده و اعتبارسنجی داده و کاربست علم داده در فصل‌های قبل بررسی شد. در این فصل هدف ما بررسی پیامدهای اجتماعی کاربست علم داده بود. پیش‌بینی پیامدهای اجتماعی علم داده، دشوارترین پیش‌بینی در کاربست علم داده است. دانشمندان علم داده در فرآیند علم داده بیشتر به بخش‌های ریاضی و بهینه کردن الگوریتم‌ها توجه دارند. اگر در مورد مسائل اخلاقی فکر کنند در ابتدا به آن دسته از نکات اخلاقی توجه خواهند کرد که جنبه‌ی قانونی و حقوقی پیدا کرده‌اند. با گذر از این مرحله، مسائل اخلاقی دیگری که اثرات آن‌ها مشخص‌تر است مورد توجه قرار خواهد گرفت. بررسی اثرات اجتماعی معمولاً کار سختی است و پیش‌بینی آن در ابتدا نیاز به جامع‌نگری، گفتگو با متخصصان جامعه‌شناسی است. برای جلوگیری از اثرات اجتماعی منفی کاربست علم داده در جامعه، متخصصان علم داده و کسب‌وکارهای داده‌محور باید در مورد محصولات داده‌محور خود به صورت مرتب بازخورد دریافت کنند و مسیر خود را مطابق با مصالح جمعی اصلاح نمایند.

سایر مقالات