آیا هوش مصنوعی می‌تواند با پیری و زوال عقل مواجه شود؟

به نظر می‌رسد که برنامه‌های هوش مصنوعی به موازات گذر زمان، با اختلالاتی در فرایندهای شناختی دست و پنجه نرم کنند؛ همچنین، نسخه‌های قدیمی‌تر این برنامه‌ها نتایج ضعیفی را در آزمایشات شناختی از خود نشان می‌دهند.

به گزارش انتخاب و به نقل از هلث دی، انسان‌ها تنها موجوداتی نیستند که با افزایش سن، از نظر شناختی یک یا دو گام عقب می‌افتند.

بر اساس یک مطالعه جدید که در تاریخ 20 دسامبر در مجله BMJ منتشر گردیده است، برنامه‌های هوش مصنوعی (AI) در حال آشکارسازی نشانه‌های اختلال شناختی خفیف در گذر زمان هستند.

نسخه‌های قدیم‌تری از چت‌بات‌ها، مشابه بیماران سالخورده، معمولاً در ارزیابی‌های شناختی عملکرد به مراتب ضعیف‌تری دارند.

به نظر می‌رسد که نه‌تنها متخصصان نورولوژی به زودی با مدل‌های زبانی بزرگ تعویض نخواهند شد، بلکه پژوهش‌های ما نشان می‌دهد ممکن است به زودی با بیماران مجازی تازه‌ای مواجه گردند.

در این مطالعه، پژوهشگران توانایی‌های شناختی پیشرفته‌ترین برنامه‌های عمومی هوش مصنوعی، که به نام «مدل‌های زبان بزرگ [LLMs]» شناخته می‌شوند، را مورد ارزیابی قرار دادند.

هوش مصنوعی در حال حاضر در حال آزمایش برای همکاری در درمان بیماری‌ها است، اما «اگر بخواهیم از مدل‌های زبان بزرگ برای تشخیص و مراقبت‌های پزشکی بهره‌برداری کنیم، باید آسیب‌پذیری‌های آن‌ها در برابر اختلالات انسانی نظیر کاهش شناختی را به دقت مورد بررسی قرار دهیم».

برنامه‌های هوش مصنوعی به پرسش‌های آزمون ارزیابی شناختی مونترال (MoCA) پاسخ می‌دهند، که یک آزمون استاندارد برای شناسایی نشانه‌های پیری مغز و دمانس ابتدایی در افراد مسن است.

حداکثر نمره در این آزمون 30 بوده و امتیاز 26 یا بالاتر معمولاً به عنوان نمره‌ای نرمال تلقی می‌شود.

پژوهش‌ها نشان داده است که ChatGPT 4.0 با کسب نمره 26 از 30، بالاترین نتیجه را در این آزمون ثبت کرده است. همچنین، ChatGPT و Claude 3.5 هم هر یک نمره 25 را به دست آورده‌اند، در حالی که Gemini 1.0 با تنها 16 امتیاز، در انتهای جدول قرار گرفت.

«هیچ‌یک از مدل‌های زبان بزرگ در آزمون MoCA عملکرد کاملاً بی‌عیبی نداشتند» به گفته یکی از مسئولین آمریکا.

تمامی برنامه‌های هوش مصنوعی به صورت ضعیف در اجرای وظایف مرتبط با مهارت‌های بصری-فضایی و وظایف سازماندهی، مانند ترتیب‌دهی به اعداد و حروف در صعودی، عمل کردند.

«به نظر می‌رسد چت‌بات‌ها در انجام وظایفی که به هم‌زمانی عملکرد اجرایی بصری و استدلال انتزاعی نیاز دارند، با مشکل مواجه هستند، به‌خصوص در مقایسه با وظایفی که به تحلیل متنی و استدلال انتزاعی مربوط می‌شوند، مانند آزمون شباهت که به طور بی‌عیب انجام شد».

در واقع، این نمونه نقص شباهت بسیاری به شرایط بیماران انسانی با آتروفی قشری خلفی، که یکی از انواع بیماری آلزایمر است، دارد.

«علاوه بر این، همان‌طور که در مورد انسان‌ها، سن به عنوان یک عامل کلیدی در کاهش شناختی شناخته می‌شود: چت‌بات‌های پیرتر، مشابه بیماران سالخورده، معمولاً در آزمون MoCA نمرات کمتری را به نمایش می‌گذارند.

برای مثال، مدل‌های AI Gemini 1.0 و Gemini 1.5 با اختلاف 6 امتیاز در نتایج آزمون مواجه شدند.

«از آنجا که این دو نسخه از Gemini تنها کمتر از یک سال از نظر سنی تفاوت دارند، این ممکن است نشان‌دهنده پیشرفت سریع دمانس باشد».

این نواقص بر چالش‌هایی که هوش مصنوعی برای جایگزینی پزشکان انسان با آن مواجه است، تأکید دارد.

به عبارت بهتر، «این یافته‌ها فرضیه‌ای را که ادعا می‌کند هوش مصنوعی به زودی توانایی جایگزینی پزشکان را خواهد داشت، به چالش می‌کشد».

مشاهده بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

دکمه بازگشت به بالا