خانه » مقالات » پایان مکالمه انسانی؟ | وقتی چت‌بات‌ها به واقعیت روزمره تبدیل می‌شوند
پایان مکالمه انسانی؟ | وقتی چت‌بات‌ها به واقعیت روزمره تبدیل می‌شوند
دوشنبه, ۲۶ آبان ۱۴۰۴
زمان تقریبی مطالعه ۴۲ دقیقه
ما در عصری زندگی می‌کنیم که «چت» دیگر فقط یک ابزار ارتباطی نیست، بلکه نمایشی است که ما در آن نقش فعال و مؤثری داریم. وقتی چت‌بات‌ها و مدل‌های زبانی وارد همه‌ی حوزه‌ها شدند — از خدمات مشتری تا اپلیکیشن‌های آموزشی — مرز میان «گفت‌وگوی واقعی» و «چت شبیه‌سازی شده» به طرز نگران‌کننده‌ای کمرنگ شد. چت‌بات‌ها تلاش می‌کنند تا وجهه انسانی داشته باشند: عذرخواهی می‌کنند، با لحن انسانی حرف می‌زنند، حتی به هنگام پاسخگویی «در حال تیپ کردن »را نمایش می‌دهند تا نشان بدهند انگار در حال فکر کردن‌اند. اما همچنان چیزی در کار نیست جز بازسازی الگوهای زبانی بر پایه داده‌ها؛ چیزی که بیشتر به «پاسخگویی پیش‌بینی‌شده» شبیه است تا گفت‌وگویی انسانی و غیرمکانیکی. در جهان جدید، ما تبدیل به «پرامپتر» شده‌ایم، کسی که باید نحوه‌ی سوال‌کردن از هوش مصنوعی را بلد باشد تا ربات دقیقا پاسخی را صادر کند که ما می‌خواهیم. نویسنده هشدار می‌دهد: هرچقدر این چت‌ها صمیمی به نظر برسند، زیرپوستشان ماشین‌ها و سرورها قرار دارد؛ امری که نشان می‌دهد فاصله ما با گفت‌وگویی که واقعاً انسانی باشد مدام در حال افزایش است.

اوایل بهار ۲۰۲۳، سوار اتوبوس شدم و به مرکز رویدادها در شهر سان‌فرانسیسکو رفتم؛ جایی که نزدیک به سی هزار نفر برای کنفرانس سالانه توسعه‌دهندگان بازی[۱] گرد هم آمده بودند و من نیز به‌عنوان خبرنگار در آن حضور داشتم. چند ماه گذشته را در مرخصی زایمان سپری کرده بودم و خوشحال بودم که به کار بازمی‌گردم، جلسه برگزار می‌کنم و موقتاً از دنیای خانگی فاصله می‌گیرم. حضور دوباره در جامعه حسی شگفت‌انگیز داشت. از گفت‌وگوهای کوتاه با راننده اتوبوس و شنود صحبت‌ غریبه‌ها لذت می‌بردم.صحبت‌های مردی را شنیدم که با لحنی جدی به دیگری گفت:

«کنفرانس‌ها دوباره شروع شده‌اند.»

هنگامی که اتوبوس حرکت کرد، دیدم که بر بدنه آن تبلیغی از ماهی سنگسر تایوانی حک شده است. روی تبلیغ نوشته شده بود: «طعم ملایم اما متمایز. امشب ماهی سنگسر کم‌چرب و مغذی را امتحان کنید». در سالن نمایشگاه، اسکیت‌بازانی که لباس‌های سیاه مجهز به حسگر پوشیده بودند، حرکات ساده‌ای روی یک رمپ کوچک اجرا می‌کردند. افراد زیادی که کارت شناسایی کنفرانس به گردن داشتند، با عینک‌های واقعیت مجازی سرگردان بودند. تقریباً هر دیوار یا جداکننده‌ای با نمایشگرها و مانیتورهای پرقدرت و با وضوح بالا پوشیده شده بود؛ آن‌قدر که نگاه کردن به صفحه تلفن همراهم برایم حس بازگشت به واقعیت داشت. در طول رویداد، اعضای رسانه و کاربران پرکار توییتر در حوزه فناوری، نمی‌توانستند از صحبت کردن با چت‌بات‌ها ــ و درباره آن‌ها ــ دست بکشند. شرکت OpenAI به‌تازگی نسخه جدیدی از چت جی‌پی‌تی را منتشر کرده بود و این فناوری همه را نگران کرده بود. گمانه‌زنی‌هایی در جریان بود درباره اینکه آیا هوش مصنوعی بافت اجتماعی را از بین خواهد برد و اینکه آیا کل مشاغل، یا حتی صنایع، در آستانه جایگزین شدن هستند.

صنعت بازی مدت‌هاست که به اشکال مختلفی از آنچه می‌توان «هوش مصنوعی» نامید، وابسته است. در نمایشگاه اخیر، حداقل دو سخنرانی به استفاده از مدل‌های زبانی بزرگ و هوش مصنوعی مولد در توسعه بازی‌ها اختصاص داشت. این سخنرانی‌ها به طور ویژه بر ساخت «شخصیت‌های فرعی» تمرکز داشتند: شخصیت‌هایی ساده و کاملاً ابزاری مانند روستاییان، موجودات جنگلی، دشمنان در نبرد و نظایر آن‌ها که تنها خطوط محدودی از دیالوگ‌های کاربردی و از پیش نوشته‌شده را ارائه می‌دهند (مانند: «سلام!»؛ «شنیدی؟»؛ «مواظب باش!»). نقش این شخصیت‌ها این است که به یک بازی حس پویایی و پرجمعیت بودن بدهند، بدون اینکه بیش از حد حواس بازیکن را پرت کنند.کنترل شخصیت های فرعی از این دست، در اختیار شخص بازیکن (پلیر) نیست. در همین حال، واژه [۲]«N.P.C.» در دنیای خارج از بازی به نوعی «میم» اینترنتی تبدیل شده است. در سال ۲۰۱۸، روزنامه تایمز این اصطلاح را «توهین تازه طرفداران ترامپ» توصیف کرد؛ چرا که کاربران راست‌گرای اینترنتی شروع به استفاده از آن برای تحقیر مخالفان سیاسی خود به‌عنوان موجوداتی بی‌اراده و شست‌وشو مغزی شده کردند. این روزها، واژه «N.P.C.» می‌تواند برای توصیف دیگران یا حتی خود فرد هم به کار رود؛ به معنای کسی که کلیشه‌ای، بی‌اراده، فرعی و بی‌قدرت است.

وقتی به امکان استفاده از مدل‌های زبانی بزرگ در ساخت این شخصیت‌ها فکر کردم، جهانی را تصور کردم پر از گفت‌وگوهای پایان‌ناپذیر؛ جهانی که در آن هر شیء و هر کاراکتر، شخصیت مخصوص به خود را دارد. در ذهنم، فروشندگان پرحرف و عاشقان رنج‌کشیده را تصور می‌کردم که در لابلای این شخصیت‌ها دفن می‌شوند.

وقتی به امکان استفاده از مدل‌های زبانی بزرگ در ساخت این شخصیت‌ها فکر کردم، جهانی را تصور کردم پر از گفت‌وگوهای پایان‌ناپذیر؛ جهانی که در آن هر شیء و هر کاراکتر، شخصیت مخصوص به خود را دارد. در ذهنم، فروشندگان پرحرف و عاشقان رنج‌کشیده را تصور می‌کردم که در لابلای این شخصیت‌ها دفن می‌شوند. اما واقعیت ساده‌تر بود. در خلاصه یکی از سخنرانی‌ها، بن سوانسون، پژوهشگر شرکت یوبی‌سافت، نوشته بود:

«شخصیت‌های فرعی ممکن است با بازیکن، با یکدیگر یا حتی با خودشان صحبت کنند ــ اما باید بدون تردید، تکرار یا انحراف از طرح روایی سخن بگویند

ارائه او برنامه «گست‌رایتر » یوبی‌سافت را تبلیغ می‌کرد؛ برنامه‌ای که برای کاهش کار تکراری در ساخت «درخت‌های» گفت‌وگو طراحی شده است. در این ساختار، نوعی از مکالمه بارها و بارها تکرار می‌شود، با اندکی تغییر بسته به واکنش بازیکن. این برنامه از یک مدل زبانی بزرگ بر اساس معیارهایی که انسان‌ها به آن می‌دهند و به منظور پیشنهاد دیالوگ‌های احتمالی شخصیت‌ها استفاده می‌کند.در انتها، خروجی مدل توسط طراحان بررسی می‌شود. البته، بازیکن مستقیماً با این هوش مصنوعی تعامل ندارد.

با این حال، به نظر می‌رسد که «گفت‌وگو» با هوش مصنوعی در سال‌های آینده رایج‌تر شود. مدل‌های زبانی بزرگ در حال اضافه شدن به موتورهای جست‌وجو و وب‌سایت‌های تجارت الکترونیک و حتی به نرم‌افزارهای واژه‌پرداز هستند. در تئوری، توانایی دستیارهای صوتی مانند سیری اپل یا الکسا آمازون می‌تواند پیچیده‌تر و چندلایه‌تر شود. مراکز تماس در حال معرفی «دستیاران» هوش مصنوعی هستند؛ گفته می‌شود آمازون در حال ساخت یک چت‌بات است؛ رستوران زنجیره‌ای وِندیز یک سامانه هوش مصنوعی برای اخذ سفارش ایجادکرده است. اوایل همین بهار، مدرسه «خان لب[۳]»، یک ربات آموزشی آزمایشی را به دانش‌آموزانش معرفی کرد و «انجمن ملی اختلالات خوردن[۴]» نیز تلاش کرد اپراتور تلفن مشاوره انسانی خود را با رباتی به نام «تسا» جایگزین کند. البته پس از آنکه تسا به تماس‌گیرندگان توصیه‌های مضر داد، این سرویس تا انجام اصلاحات مجدد، متوقف شد.

شکل  ۱ بنظر می‌رسد در آینده‌ای نزدیک چت‌بات ها دوستان صمیمی ما خواهندشد

 

 

چت‌بات‌ها نقطه پایانی مدل‌های زبانی بزرگ نیستند. شاید توانایی‌های چشمگیر این فناوری بیشتر مربوط به پردازش داده باشد تا گفت‌وگو ــ یعنی کشف و تقلید الگوها و بازتولید ورودی‌ها برای ایجاد چیزی شبیه به خلاصه‌سازی ــ که متن مکالمه صرفاً یکی از گونه‌های آن است. با این حال، به نظر می‌رسد آینده می‌تواند سرشار از گپ و گفت‌های بی‌پایان با همراهانی خستگی‌ناپذیر باشد. بخشی از این گفت‌وگوها نوشتاری خواهد بود و بخشی ممکن است از طریق پیام‌های صوتی انجام شود که به دستورات، پرسش‌ها و ورودی‌های گفتاری پاسخ می‌دهند. هر چیزی که به یک پایگاه داده متصل باشد می‌تواند عملاً به یک ربات یا یک شخصیت فرعی در بازی تبدیل شود، چه در فضای مجازی و چه در دنیای فیزیکی. شاید در آستانه ورود به عصری باشیم که با «گفت‌وگویی بی‌پایان» تعریف می‌شود ــ مفید یا گذرا و البته بی‌انتها .

چت آنلاین با گفت‌وگو یا مکالمه رودررو تفاوت دارد و ریتم خاص خود را دارد. می‌تواند شلوغ و پرهیاهو باشد ــ شرکت‌کنندگان متن‌های کوتاه را پیاپی بر سر هم می‌ریزند ــ یا کاملاً غیرهمزمان، با جملاتی که در خلأ ارسال می‌شوند. معمولاً سطح اهمیت پایین است و فرصت مشارکت همه‌جا وجود دارد: می‌توان در پیام‌های مستقیم، در اپلیکیشن‌های قرار و آشنایی، در بازی‌های ویدیویی، در تماس‌های ویدیویی، در نرم‌افزارهای واژه‌پرداز و بسیاری جای دیگر گپ زد، چه رسد به برنامه‌های اختصاصی مانند واتس‌اپ یا آی‌مسیج. چت معمولاً خود را با امکانات، محدودیت‌ها و عرف‌های هر پلتفرم وفق می‌دهد. همیشه چیزی برای گفتن وجود دارد و همیشه جایی دیگر برای گفتنش، هرچند سکوت و آرامش می‌تواند معجزه‌آسا باشد.

در سال ۲۰۱۱، ویراستاران مجله‌ای ادبی، رساله‌ای طنزآمیز و پرآرایه درباره «چت» منتشر کردند. این رساله که «چت ایکس» نام داشت، به طور خاص لذت‌های ویژه چت کردن را مورد بررسی قرار داد. چت کردن ، آرامش در گفتگو را به اتاق‌خواب بازمی‌گرداند، چراکه نیمه‌شب‌ها خود را در وضعیتی از تمرکز می‌یابیم که هرگز در طول روز با آن روبرو نبوده‌ایم. بسیاری از ما به هنگام چت‌کردن بهترین ورژن خود را حس می‌کنیم. در سکوت، نمی‌توانیم در حرف دوستانمان بپریم، پس شنوندگان بهتری می‌شویم و همچنین سخن‌وران ــ یا نویسندگان ــ بهتری. آن‌ها اشاره کردند که چت می‌تواند صمیمی، راحت، گسترده، آشکارکننده و حتی شاعرانه باشد؛ و همواره یک زیرلایه عاطفی دارد. فوریت چت بر پاسخ‌گویی تأکید می‌کند و یادآور می‌شود که ما نه‌فقط خود را در نوشتن خلق و بیان می‌کنیم، بلکه روابطمان را نیز می‌سازیم و بیان می‌کنیم. اما آنچه چت‌بات‌ها ارائه می‌دهند، دقیقاً «چت» نیست ــ بلکه شبیه‌سازی آن است. برخی مدل‌های دوستانه‌تر، مانند رپلیکا « همراه هوش مصنوعی » یا نسخه نیمه‌فعال‌شده‌ی بینگ[۵]، می‌توانند ریتمی نزدیک به گفت‌وگوی واقعی تولید کنند.  چت جی‌پی‌تی نیز سعی دارد تا تصویری انسان گونه از خود به نمایش بگذارد، حتی با «شخصیت» خشک و عمداً مکانیکی‌اش: هنگام اشتباه عذرخواهی می‌کند، متن را به صورت اول‌شخص بازمی‌گرداند و نشانه «در حال تایپ بودن» دارد ــ خطی از نقطه‌ها که از یک تا سه بالا می‌رود و دوباره برمی‌گردد ــ طوری که گویی رایانه در حال اندیشیدن و مکث کردن است.

«استفاده از ضمایر اول‌شخص در این فناوری‌ها باید محدود شود. این امر منجر به کاهش خطر فریب خوردن افراد توسط مدل‌های زبانی بزرگ، چه مالی و چه عاطفی، خواهد شد…»[۶]

مانگر قائل به تغییر لحن فناوری به منظور تفکیک آن از ادبیات انسانی است اما با همین دیدگاه هم، سبک نوشتاری چت جی‌پی‌تی یکنواخت و خشک باقی می‌ماند؛ هرچند می‌توان آن را وادار کرد جملاتش را در لحن‌ها و حالت‌های عاطفی مختلف بازنویسی کند، اما استفاده از آن هنوز شبیه مکالمه با معادلات ریاضی است.

با تبدیل مدل‌های زبانی بزرگ به ابزارهای مکالمه‌ای، توسعه‌دهندگان، کاربران انسانی را در فرآیند آموزش و بهبود نرم‌افزار مشارکت می‌دهند. اما افزودن رابط‌های گفت‌وگومحور به مدل‌های مصرفی، تلاشی است برای ایجاد حس آشنایی و بهره‌گیری از عادات موجود. «چت» چیزی را تداعی می‌کند که موتورهای جست‌وجو و پایگاه‌های داده نمی‌توانند: نوعی درگیری شخصی. این مفهوم پای «خودِ فرد» را به میان می‌کشد و همین امر به پرورش رفتارهای خاص کمک می‌کند.

اوایل امسال، کالین فریزر، دانشمند داده در شرکت متا، در یادداشتی در مدیوم با عنوان «وقتی با این ربات‌ها حرف می‌زنیم، با چه کسی حرف می‌زنیم؟» نوشت: «رابط چت‌ جی‌پی‌تی کاربران را به سمت تولید ورودی‌های مورد نظر هدایت می‌کند.» او ادامه داد: هنگامی که کاربران از نقش مورد انتظارشان خارج می‌شوند، مدل زبانی احتمالاً خروجی نامطلوبی ارائه می‌دهد ــ جملات یا تکه‌جملاتی که ماهیت «تولیدکننده متن مصنوعی و بی‌ذهن» در زیرِ سطح را آشکار می‌کند. فریزر افزود: «یکی از دلایل اصلی که OpenAI می‌خواهد ورودی‌های شما در محدوده سبک مکالمه‌ای معمول بماند، این است که بتواند خروجی مدل را مؤثرتر کنترل کند. مدل فقط زمانی رفتار نسبتاً قابل پیش‌بینی دارد که کاربر هم رفتاری قابل پیش‌بینی داشته باشد.»

با چت‌بات‌های امروزی، کاربران انسانی در واقع «گفت‌وگو» نمی‌کنند؛ بلکه «پرامپت» می‌نویسند. پرامپت اصطلاحی است برای توصیف تحریک یا هدایت عمدی نرم‌افزار به سمت خروجی‌های خاص. شرکت OpenAI  در دستورالعمل اولیه خود، راهنمایی دارد با عنوان «بهترین شیوه‌ها برای مهندسی پرامپت» که به نگارش و تدوین پرامپت‌ها توسط کاربران کمک می‌کند. راهنمایی که شامل توصیه‌هایی از قبیل پرهیز از استفاده از نفی «به‌جای گفتن اینکه چه کاری نباید انجام شود، بگویید چه کاری باید انجام شود»، ارائه جزئیات درباره «زمینه، نتیجه، طول، قالب، سبک» و لحن پاسخ مطلوب می‌باشد. برخی شرکت‌ها که روی محصولات هوش مصنوعی کار می‌کنند، افرادی را با عنوان «مهندس پرامپت» استخدام کرده‌اند.[۷] یک آگهی استخدام برای موقعیت «مهندس/توسعه‌دهنده پرامپت» از سوی شرکت آنتروپیک ــ که چت‌بات آن به نام کلاود با شعار «مفید، صادق و بی‌ضرر» معرفی می‌شود ــ شرایط نیرو برای این موقعیت را «ترکیبی از برنامه‌نویسی، آموزش و تدریس» توصیف کرده بود.

اگر برخی پرامپت‌ها داده‌هایی با کیفیت بالاتر تولید کنند ــ محتوایی خواناتر، کامل‌تر و گاهی دقیق‌تر ــ آنگاه طراحی پرامپت به نوعی سواد جدید تبدیل می‌شود. اوایل همین بهار، تایمز مقاله‌ای آموزشی منتشر کرد با عنوان «با این پرامپت‌های طلایی بهترین خروجی را از چت جی‌پی‌تی بگیرید» که توصیه می‌کرد از عبارت (انگار که…)[۸] استفاده کنید تا چت‌بات‌ها را وادار کنید نقش یک کارشناس را ایفا کنند. البته کاربران نیز در حال «وانمود کردن» هستند. آن‌ها نیز باید در عمل دست به تقلید بزنند ــ همراهی کنند، به شیوه‌هایی گفت‌وگو کنند که برای محاسبات نرم‌افزار دوستانه‌تر است و تردید خود نسبت به تخصص ابزار گفتگو را موقتاً کنار بگذارند. ورودی‌های باکیفیت با خروجی‌های باکیفیت پاداش داده می‌شوند؛خلاصه اینکه نرم‌افزار نوعی آینه است. آنچه رخ می‌دهد تبادل داده میان کاربر و ربات است .

در فاصله بین جلسات، به مرکز خرید متریون رفتم تا از یک رستوران ویتنامی نهار بگیرم. حدود یک دهه پیش، زمانی که بیست‌وپنج سال داشتم و در یک استارتاپ نزدیک آنجا در پشتیبانی مشتری کار می‌کردم، به‌طور منظم به این رستوران می‌رفتم. آن روزها، روزم را با نوشتن ایمیل‌هایی می‌گذراندم که این گونه شروع می‌شدند: «لطفاً بگذارید بدانم که آیا این کمک می‌کند یا نه!» در آن سال‌ها، کتاب تونی هسیه با عنوان یافته های شورانگیز محبوب بود و بحث زیادی درباره چگونگی کشف «شگفتی و لذت» وجود داشت. در آن زمان عجیب بود که به آینده‌ای فکر کنم که در آن بیکار شوم یا ربات یا ابزاری خودکار جایم را بگیرد ــ آینده‌ای که در آن مدل‌های زبانی بزرگ و نه فارغ‌التحصیلان رشته‌های علوم انسانی، وظیفه تبدیل ناامیدی و خطای انسانی به چیزی مفید و دلپذیر را بر عهده خواهند داشت.

«چت» چیزی را تداعی می‌کند که موتورهای جست‌وجو و پایگاه‌های داده نمی‌توانند: نوعی درگیری شخصی. این مفهوم پای «خودِ فرد» را به میان می‌کشد و همین امر به پرورش رفتارهای خاص کمک می‌کند.

رستوران تقریباً همان‌طور بود که به یاد داشتم، اما با نمایشگرهای بیشتر و کاسه های جدیدتر. کاسه‌ها بخشی جدانشدنی از آشپزی در سراسر جهان هستند. افرادی با کارت رویداد( که بر گردن‌شان آویزان بود) پشت دو تبلت ایستاده بودند و منتظر بودند تا پایه، پروتئین، سس و رویه‌ها را انتخاب کنند. آن سوی تبلت‌ها، ردیفی از کارکنان مشت‌هایی از رشته‌برنج را از ظرف‌های فلزی سرد به ظرف‌های قابل‌کمپوست منتقل می‌کردند. وقتی نوبت من رسید، اجزای موردنظر را تقریباً تصادفی انتخاب کردم و بلافاصله احساس پشیمانی کردم. هنگامی که کارکنان کاسه مرا آماده می‌کردند، نقدهای یلپ[۹] درباره رستوران را خواندم. یک منتقد نوشته بود: «از نظر ارزش، هیچ چیز به پای این کاسه نمی‌رسد.» دیگری نوشته بود: «آن‌ها واقعاً کاسه را پر کردند.» سومی گفته بود: «کاسه‌ام لبریز بود!» همیشه از یلپ خوشم می‌آمد، نه به‌عنوان یک سرویس، بلکه به‌عنوان یک مرجع ادبی که نزدیک به بیست سال خواسته‌های اجتماعی-فرهنگی و انتظارات ناکام را ثبت کرده است ــ روایتی از تلاش یک نسل برای تجربه‌ای بهینه. سایتی که در سال ۲۰۰۴ تأسیس شد و نمونه‌ای کامل از وب ۲.۰ بود؛ نسخه‌ای از وب که سبک‌های تازه‌ای از محتوای کاربرمحور را به وجود آورد: توییت‌ها، پست‌های طنز، نظرها، میم‌ها، نقدها ــ گونه‌هایی از نوشتار عمومی با قراردادها، میانبرها و سبک‌های واژگانی خاص خود .

درباره کاسه انتخابی من اما ، نظرها متفاوت بود .«اگر می‌توانستم صفر ستاره می‌دادم»؛ «از کیفیت بد خیلی تعجب کردم»؛ «واقعاً ۳.۵ است، اما به خاطر رستوران به پایین گرد کردم و 3 میدم» و … بخشی از نظرات منفی درباره انتخاب بد من بودند.

با خود اندیشیدم که آیا چت‌بات‌ها و دیگر رابط‌های زبانی طبیعی، شکل‌های تازه‌ای از مکالمه، گونه‌های جدیدی از گفت‌وگو یا انواع جدیدی از محتوا را پدید خواهند آورد یا نه. همان‌طور که یلپ بر نحوه فکر کردن کاربران نسبت به برخی تجربه‌های آفلاین تأثیر گذاشت ــ از مراجعه به یک رستوران گرفته تا خدمات یک پمپ‌بنزین یا اندازه یک کاسه نهار ــ مدل‌های زبانی بزرگ نیز می‌توانند بر شیوه جست‌وجو و پردازش اطلاعات توسط مردم اثر بگذارند. هم‌اکنون، با وجود آنکه چت‌بات‌ها متن‌های پر از خطای واقعی تولید می‌کنند،در حال مطرح شدن به‌عنوان ابزار گردآوری اطلاعات هستند. این فناوری چگونه ممکن است بر انتظارات کاربران از دانش، یا نگرش آنان نسبت به تخصص و اقتدار، اثر بگذارد؟

کاسه‌ام را برداشتم و روی نیمکتی در میدان مجاور مرکز رویدادها نشستم. مردم به دیوار ساختمان تکیه داده بودند و سیگار می‌کشیدند، یا در گروه‌های کوچک ایستاده بودند و سیگار الکترونیکی می‌کشیدند. هوا معطر بود، آلوده و وهم‌برانگیز، صورتم در آفتاب گرم شد. به سال‌های جوانی فکر کردم، به ده سال قبل و به سال‌های حضورم در اینجا: اینکه گاهی به اتاق سرورها می‌رفتم تا تماس تصویری با مشتریان داشته باشم؛ اینکه آن‌ها گاهی از دیدن فردی در آن سوی ایمیل‌هایشان شگفت‌زده می‌شدند؛ و اینکه چگونه لحن مکالمه تغییر می‌کرد. گفت‌وگوی معاملاتی ــ صحبت کردن و شنیده شدن، همچون یک ربات ــ می‌تواند کارآمد باشد، حتی گاهی دلنشین، بسته به زمینه و روحیه طرفین. اما می‌تواند تحقیرآمیز، ساده‌انگارانه، دست‌کاری‌شده و کلیشه‌ای هم باشد ــ مثل زمانی که با شما همچون یک شخصیت فرعی در یک بازی رفتار می‌شود. کاسه نهار نوستالژیکم را خوردم. منتقدان یلپ درست می‌گفتند.کیفیت خوبی نداشت اما کاسه‌اش بزرگ بود.

در بازگشت به مرکز رویدادها، پس از گشتی دوباره در سالن نمایشگاه، با پله‌برقی به لابی رفتم، چند پیچ را رد کردم، از یک پله پایین رفتم و در زیرزمین مرکز، دو «اتاق شیردهی مخصوص مادران» یافتم. این اتاق‌ها سازه‌های مستقلی بودند که توسط شرکتی به نام ماموا[۱۰] ساخته شده بودند. یادداشت خوشامدگویی‌ای که پشت در چاپ شده بود می‌گفت: «سلام مامان‌ها! آرام باشید. شما بهترین هستید.» گلدانی پلاستیکی روی طاقچه کنار آینه‌ قرار داشت. به تصویرم در آینه نگاه کردم: یقه‌اسکی، کوله‌پشتی، گردن‌آویز کنفرانس، چشمانی خسته. برچسبی در پایین آینه نوشته بود: «خوش‌تیپی مامان!» فضا بیش از حد صمیمی بود و حتی کمی مبتذل. در آن اتاق‌ها «گفت‌وگو» بیش از حد بی‌ارزش به نظر می‌رسید.

زبان می‌تواند جهانی کامل در خود جای دهد، تاریخ، ارزش‌ها یا آسیب‌شناسی‌های گویندگانش را آشکار کند. اما می‌تواند رازآلود، انحرافی و لغزنده هم باشد. پرحرفی، با تکیه بر جاذبه‌های شخصیتی و حس آشنایی، می‌تواند وعده‌های دروغین، ابتذال، پوچی و جنجال بیافریند و زمینه واقعی وجود خود را پنهان یا نادیده بگیرد. به همین ترتیب، «چت شبیه‌سازی‌شده» واقعیتِ آنچه برای ایجاد، آموزش، به‌روزرسانی و نگهداری مدل‌های زبانی بزرگ لازم است را پنهان می‌کند؛ مدل‌هایی که دست‌کم در حال حاضر بسیار پرهزینه و غیر اقتصادی هستند.

تمام این زیرساخت‌ها از یک رویا نشات می‌گیرند. فناوران مدت‌هاست که رویای داشتن روابط انسانی با برنامه‌ها را در سر دارند. اخیراً سم آلتمن، مدیرعامل  OpenAI، در گفت‌وگویی با وال‌استریت ژورنال یادآور شد که وقتی کودک بود و به مکینتاش خود نگاه می‌کرد، ناگهان «دریافت» که «روزی کامپیوتر یاد خواهد گرفت فکر کند.» هفته گذشته، سرمایه‌گذار خطرپذیر مارک اندرسن مقاله‌ای منتشر کرد که در آن جهانی را تجسم کرده بود پر از ربات‌های همدل، آگاه و باانگیزه که «رضایت هر فرد را به حداکثر می‌رسانند» و در کنار هنرمندان، دانشمندان، رهبران کشورها و کودکان کار می‌کنند. او نوشت: «هر کودک یک معلم خصوصی هوش مصنوعی خواهد داشت که بی‌نهایت صبور، بی‌نهایت دلسوز، بی‌نهایت آگاه و بی‌نهایت کمک‌کننده است. این معلم خصوصی هوش مصنوعی در هر قدم رشد کودک کنار او خواهد بود و به او کمک خواهد کرد تا پتانسیل خود را به حداکثر برساند.»

وقتی تنها در خانه نشسته بودم و به درگاه چت جی‌پی‌تی نگاه می‌کردم، به این فکر افتادم که حتی پیشرفته‌ترین ابزار مصنوعی یا «هوش» تا کجا می‌تواند چنین فناوری‌ای را پیش ببرد ــ آیا هرگز می‌تواند قابل‌اعتماد باشد؟ سخت است اما باید باور کنیم یا لااقل فکر کنیم که آینده می‌تواند حیرت انگیزتر از این باشد. شاید با دانشی بی‌نهایت و عشقی بی‌انتها روبرو شویم، یا دست‌کم «نسخه‌های ماشینی» از این چیزها که توسط شرکت‌های فناورانه ایجاد می‌شوند. در همین حال، در لبه‌های صفحه‌ مانیتورم، اعلان‌ها چشمک می‌زدند و می‌لغزیدند؛ تلفنم می‌لرزید و صندوق ورودی‌ام با تیترها، هماهنگی‌های کاری، خبرهای شخصی، شوخی‌ها، همدردی‌ها و شایعات پر می‌شد. در کوتاه‌مدت، آینده بیشتر شبیه چت به نظر می‌رسید ــ نه میان دوستان، یا حتی غریبه‌ها، بلکه با قفسه‌های سرور در آلتونا و اشبرن؛ جهانی از واسطه‌های رنگارنگ که منتظر پرامپت‌ها هستند و آماده‌اند دقیقاً همان چیزی را بگویند که کاربران می‌خواهند بشنوند.

منابع
سایر مقالات