محققان دانشگاه تگزاس آستین موفق به توسعه «رمزگشای معنایی» شدهاند که از هوش مصنوعی برای تبدیل اسکنهای فعالیت گفتاری مغز انسان به متن بازنویسی شده استفاده میکند. اگرچه در مقایسه با متون مبداء هنوز نسبتا نادقیق است، اما توسعه نشاندهنده یک گام بزرگ رو به جلو برای نقش هوش مصنوعی در فناوری کمکی است و سازندگان آن قبلا هشدار میدهند که اگر به درستی تنظیم نشود، ممکن است مورد سوءاستفاده قرار گیرد.
یافتههای این تیم جزئیات سیستم جدیدی را ارائه میکند که یک برنامه مولد مشابه GPT-۴ OpenAI و Google Bard را در کنار فناوری موجود قادر به تفسیر اسکنهای تصویربرداری تشدید مغناطیسی کاربردی (fMRI) ادغام میکند، دستگاهی که نحوه و جایی که خون به مناطق خاصی از مغز جریان مییابد. در حالی که رابطهای قبلی مغز و کامپیوتر (BCIs) در دستیابی به تواناییهای ترجمهای مشابه نویدبخش بوده است، نسخه UT آستین اولین نسخه غیرتهاجمی است که نیازی به ایمپلنت فیزیکی یا سیمکشی واقعی ندارد.
در این مطالعه محققان از سه شرکت کنندگان خواستند که هر کدام در مجموع ۱۶ ساعت در دستگاه fMRI به پادکستهای صوتی گوش دهند. در همین حال، تیم یک مدل هوش مصنوعی را برای ایجاد و تجزیه ویژگیهای معنایی با تجزیه و تحلیل نظرات Reddit و متون زندگینامهای آموزش داد. با ترکیب دو مجموعه داده، هوش مصنوعی کلمات و عبارات مرتبط با اسکن مغز افراد را برای ایجاد پیوندهای معنایی یاد گرفت و مطابقت داد.
پس از این مرحله، یک بار دیگر از شرکت کنندگان خواسته شد تا در یک اسکنر fMRI دراز بکشند و به صدای جدیدی که بخشی از دادههای اصلی نبود گوش دهند. رمزگشای معنایی متعاقبا صدا را از طریق اسکن فعالیت مغز به متن ترجمه کرد و حتی میتوانست نتایج مشابهی را با تماشای کلیپهای ویدیویی بیصدا و یا تصور داستانهای خود در ذهن افراد ایجاد کند. در حالی که رونوشتهای هوش مصنوعی به طور کلی پاسخهای نامتناسب یا نامشخص ارائه میکردند، خروجی کلی همچنان مونولوگهای درونی شرکت کنندگان را با موفقیت بازنویسی میکرد. گاهی اوقات، حتی به دقت انتخاب کلمات صوتی را منعکس میکند. همانطور که نیویورک تایمز توضیح میدهد، نتایج نشان میدهد که رمزگشای هوش مصنوعی تیم UT Austin صرفا ترتیب کلمات را ضبط نمیکند، بلکه معنای ضمنی واقعی را نیز ثبت میکند.
در حالی که هنوز در مراحل اولیه خود است، محققان امیدوارند که نسخههای بهبودیافته در آینده بتواند ابزار ارتباطی جدید و قدرتمندی را برای افرادی که توانایی صحبت کردن را از دست دادهاند، مانند قربانیان سکته مغزی یا مبتلایان به ALS فراهم کند. اسکنرهای fMRI ماشینهای عظیم و غیرقابل حرکتی هستند که محدود به امکانات پزشکی هستند، اما این تیم امیدوار است که بررسی کند که چگونه یک سیستم مشابه میتواند با استفاده از طیفسنجی عملکردی مادون قرمز نزدیک (fNIRS) کار کند.
با این حال یک شرط عمده برای رمزگشای معنایی جدید وجود دارد؛ یک سوژه باید تلاشی هماهنگ و آگاهانه برای همکاری با اهداف برنامه هوش مصنوعی از طریق متمرکز ماندن بر اهداف خود انجام دهد. به عبارت سادهتر، مغز شلوغتر به معنای متن آشفتهتر است. به طور مشابه فناوری رمزگشا را فقط میتوان در یک زمان برای یک نفر آموزش داد.
علی رغم این محدودیتهای فعلی، تیم تحقیقاتی از قبل پتانسیل پیشرفت سریع در کنار استفاده نادرست را پیش بینی کرده است. این تیم در مطالعه خود نوشت: «توسعههای آینده ممکن است رمزگشاها را قادر به دور زدن این الزامات (حریم خصوصی) کند؛ علاوه بر این حتی اگر پیشبینیهای رمزگشا بدون همکاری موضوعی نادرست باشند، میتوانند عمدا برای اهداف مخرب سوء تعبیر شوند، به این دلایل و دیگر دلایل پیشبینی نشده، افزایش آگاهی در مورد خطرات فناوری رمزگشایی مغز و اتخاذ سیاستهایی که از ذهنیت هر فرد محافظت میکند، حیاتی است».