
آیا مسیر زندگی یک کودک، مواردی مانند معدل نهایی او در آینده، را میتوان با استفاده از مدلهای رایانهای پیشبینی کرد؟
از لحاظ نظری، این ایده غیرمعقول نیست. در دنیای دیجیتال امروز، الگوریتمها اغلب برای پیشبینی پیامدهای بیماری بیماران یا احتمال بازپرداخت وامها آموزش داده میشوند. از همین رو، گروهی از پژوهشگران این سؤال را مطرح کردهاند که آیا این نوع تحلیل میتواند به پیشبینی، و نهایتاً کاهش مشکلات آیندۀ کودکان، بهویژه آنهایی که از خانوادههایی با منابع کمتر میآیند، کمک کند.
به همین منظور، دانشمندان دادههای بیش از ۴۰۰۰ خانوادۀ آمریکایی را که طی ۱۵ سال، از بدو تولد کودک جمعآوری شده بود، تحلیل کردند؛ دادههایی شامل اطلاعاتی دربارۀ کودکان، والدین آنها، مدارس و ثبات محیط زندگیشان. پژوهشگران از دادههای مربوط به نه سال نخست استفاده کردند و کوشیدند شش پیامد کلیدی زندگی تحصیلی و شخصی کودکان در سن ۱۵ سالگی را پیشبینی کنند.
اما بهنظر میرسد مواردی مانند موفقیت تحصیلی و گرفتاریهای خانوادگی، بیثباتتر از بسیاری از پیشبینیهای رایانهمحور دیگر هستند. در سال ۲۰۲۰، این تیم یافتههای خود را منتشر کرد. «برخلاف انتظار ما، پیشبینیها چندان دقیق نبودند»، ایان لوندبرگ[۱]، جامعهشناس دانشگاه کالیفرنیا در لسآنجلس و از نویسندگان مقالۀ ۲۰۲۰ میگوید. «و این باعث شد از خود بپرسیم: چرا؟»
در مطالعهای جدید، لوندبرگ و همکارانش تلاش کردند دریابند چرا مطالعة قبلی در پیشبینی عملکرد کودکان، بهویژه معدل آنها، دقیق عمل نکرده بود. آنها با ۴۰ خانوادهای که دادّههای آنها رصد شده بود ارتباط برقرار کردند و مصاحبههای مفصلی با آنها انجام دادند تا از جزییات زندگیشان که در دادههای قبلی ثبت نشده بود مطلع شوند. یافتهها، که اوایل امسال در نشریة Proceedings of the National Academy of Sciences منتشر شد، نشان میدهد که ناکامی الگوریتمها در پیشبینی دستاوردهای تحصیلی تنها به کمبود داده یا محدودیتهای محاسباتی مربوط نمیشود، بلکه به یک حد بنیادین در میزان توانایی ما برای پیشبینی پیچیدگیهای زندگی بازمیگردد.
«اینکه کسی واقعاً برگردد و تلاش کند دلایل عملکرد ضعیف الگوریتم خود، بهویژه در مورد موارد استثنایی را بفهمد … بخش نوآورانۀ این مطالعه است»، رامینا ستوده، جامعهشناس دانشگاه ییل که در این پژوهش مشارکتی نداشته، میگوید.
“یک محدودیت بنیادین در توانایی ما برای پیشبینی پیچیدگیهای زندگی وجود دارد.”
به گفتۀ نویسندگان مطالعه، این شکست در پیشبینی صحیح را میتوان به دو منبع اصلی نسبت داد. نخست، چیزی است که «خطای کاهشناپذیر[۲]» نامیده میشود. نمونهای از آن، رخدادی غیرمنتظره در سالهای نوجوانی یک کودک است که نمیتوان آن را از طریق عواملی مانند درآمد مالی و میزان تحصیلات والدین پیشبینی کرد، مانند مرگ یکی از والدین. لوندبرگ میگوید: «در چنین حالتی، واقعاً هیچ روش یادگیری ماشینی یا محاسباتی نمیتواند باعث بهبود پیشبینی شود.»
عامل دوم، خطای یادگیری است: خطاهایی که در روند یادگیری الگوریتم رخ میدهند. پیامدهایی که دانشمندان تلاش داشتند اندازهگیری کنند، مانند نمرات، پشتکار، اخراج از خانه و گرفتاریهای خانوادگی، تحت تأثیر عوامل متعددی قرار دارند. این عوامل میتوانند الگوهایی ایجاد کنند که الگوریتم قادر به یادگیری آنها باشد و از آنها برای پیشبینی دستاورها استفاده کند. اما به گفتۀ لوندبرگ، هنگامی که تعداد این متغیرها بیش از حد زیاد میشود، الگوریتمها گاهی الگوی نادرستی را یاد میگیرند. این نوع خطای یادگیری را میتوان با افزایش تعداد افراد نمونه کاهش داد. اما در مطالعات طولی بلندمدت مانند این پژوهش، جذب بیش از چند هزار شرکتکننده بسیار دشوار است. ستوده میگوید: «این یک مشکل بنیادین در مطالعۀ پیچیدگیها است.»
یافتههای جدید همچنین بر ارزش پژوهش کیفی تأکید میکنند، انجام مصاحبه و گفتگو با انسانها میتواند بینشهایی به همراه داشته باشد که با رویکردهای کمی قابل دستیابی نیست. ستوده میگوید برخی مشاهدات کیفی جامعهشناسان، مانند نحوۀ تعامل افراد و شکلگیری روابطشان، بهسختی قابلیت تبدیل شدن به اعداد دارند و این موارد نیز ممکن است بر نتایج تأثیرگذار باشند.
برای لوندبرگ، ورود به جنبۀ کیفی این پژوهش با وجود ساعتها مطالعه بر روی مجموعهدادۀ اولیه، تجربهای آگاهیبخش بود. در این مطالعۀ جدید، برای مثال، داستان «بلا» (نام مستعار یکی از شرکتکنندگان در پژوهش) برجسته شده است. او کودکی باثباتی داشت و براساس متغیرهایی که پژوهشگران اندازهگیری کرده بودند، بهنظر میرسید که در نوجوانی معدل بالایی خواهد داشت. اما بین سنین ۹ تا ۱۵ سالگی، پدر بلا بهطور ناگهانی درگذشت و مادرش دچار افسردگی شد؛ در نتیجه، بلا از نظر تحصیلی و اجتماعی دچار مشکل شد، چالشهایی که در مجموعهدادهها ثبت نشده بودند.
لوندبرگ میگوید، ما انسانها میل شدیدی داریم که بتوانیم آینده را پیشبینی کنیم، چه برای خودمان و چه برای عزیزانمان، و ما اغلب این کار را با اتکا بر قضاوت انسانی خود انجام میدهیم. «علاقۀ رو به رشدی نسبت به این ایده وجود دارد که شاید رایانهها بتوانند به ما کمک کنند این کار را با دقت بیشتری انجام دهیم… اما مهمترین نتیجهگیری مطالعۀ ما این است که نباید این فرض را بدیهی بدانیم که همۀ دستاوردها با افزایش توان محاسباتی، قابل پیشبینی خواهند شد.»
“اما مهمترین نتیجهگیری مطالعۀ ما این است که نباید این فرض را بدیهی بدانیم که همۀ دستاوردها با افزایش توان محاسباتی، قابل پیشبینی خواهند شد.”
ستوده نیز میافزاید: «جواب همیشه در دادههای بیشتر نیست. پیشآمدهای اجتماعی، غیرقابل پیشبینی و پیچیدهاند. و ما باید با این پیشبینیناپذیری کنار بیاییم.»