پژوهشگران ایرانی پرده از ضعف مدل‌های استدلالی هوش مصنوعی برداشتند

پژوهشگران در مقاله‌ای با عنوان «توهم تفکر» نشان داده‌اند که مدل‌های زبانی پیشرفته در مواجهه با مسائل پیچیده دچار فروپاشی عملکرد می‌شوند.

به گزارش تابش کوثر، چهار پژوهشگر ایرانی در همکاری با تیمی بین‌المللی در مقاله‌ای علمی به بررسی دقیق توانایی‌ها و ناتوانی‌های مدل‌های استدلال‌محور پرداخته‌اند. این مقاله با تمرکز بر رفتار این مدل‌ها در مواجهه با پیچیدگی‌های ترکیبی، تصویری دقیق از محدودیت‌های اساسی آن‌ها ارائه می‌دهد.

در مقاله‌ای با عنوان «توهم تفکر: درک توانایی‌ها و محدودیت‌های مدل‌های استدلال از منظر پیچیدگی مسئله» که با مشارکت پارشین شجاعی، ایمان میرزاده، کیوان علیزاده و مهرداد فرج‌تبار به نگارش درآمده است، عملکرد مدل‌های زبانی پیشرفته که با هدف تولید مسیرهای استدلالی طراحی شده‌اند، مورد ارزیابی قرار گرفته است.

این تحقیق که در وبسایت شرکت «اپل» منتشر شده است، نشان می‌دهد که مدل‌های استدلال‌محور (LRMها) اگرچه در وظایف با پیچیدگی متوسط عملکرد بهتری نسبت به مدل‌های استاندارد دارند، اما در مواجهه با وظایف با پیچیدگی بالا دچار فروپاشی کامل عملکرد می‌شوند. این مدل‌ها با افزایش سطح دشواری مسئله، ابتدا تلاش استدلالی خود را افزایش می‌دهند، اما پس از رسیدن به آستانه‌ای مشخص، میزان این تلاش کاهش می‌یابد؛ حتی در شرایطی که منابع محاسباتی کافی در اختیار دارند.

پژوهشگران در ادامه با استفاده از محیط‌های پازل کنترل‌شده، روند تفکر درونی مدل‌ها را بررسی کرده‌اند. آن‌ها دریافته‌اند که این مدل‌ها در به‌کارگیری الگوریتم‌های دقیق دچار کاستی هستند و استدلال‌های ناهماهنگ و متناقض در مواجهه با مسائل مشابه از خود نشان می‌دهند.

بر اساس یافته‌ها، عملکرد مدل‌ها در سه محدوده طبقه‌بندی شده است:

۱. وظایف ساده که در آن‌ها مدل‌های استاندارد بهتر عمل می‌کنند،

۲. وظایف با پیچیدگی متوسط که مدل‌های استدلال‌محور برتری نسبی دارند،

۳. وظایف با پیچیدگی بالا که در آن هر دو نوع مدل شکست می‌خورند.

این پژوهش با همکاری پژوهشگران دیگر از جمله «مکسول هورتون» و «سمی بنگیو» انجام شد. پارشین شجاعی این تحقیق را در دوره کارآموزی خود در شرکت اپل انجام داده است.

نتایج این مقاله با زیر سوال بردن برداشت رایج از «تفکر» در مدل‌های زبانی بزرگ، چالش‌های جدی در مسیر توسعه هوش مصنوعی مبتنی بر استدلال را مطرح می‌کند.

م/۱۱۰*

کد خبر 141437

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.
captcha