این ادعا در مقالهای از دیوید سیلور و ریچارد ساتن، دو تن از پژوهشگران برجسته این حوزه، مطرح شده است. این دو پژوهشگر در مقالهای با عنوان «به عصر تجربه خوش آمدید» تأکید کردهاند که مدلهای کنونی هوش مصنوعی بیش از حد به دادههای ایستا و تعاملات محدود انسانی وابستهاند.
سیلور و ساتن معتقدند برای رسیدن به دستاوردهای نوین در هوش مصنوعی باید از روشهای فعلی آموزش فراتر رفت. بهگفته آنها، دادههایی که مدلهایی چون چتجیپیتی با آنها آموزش میبینند، تنها بازتابدهنده رخدادهای گذشتهاند و نمیتوانند مسیر کشفهای کاملاً جدید را برای هوش مصنوعی باز کنند. آنها خاطرنشان کردهاند که تغییر تمرکز جامعه پژوهشی از یادگیری تقویتی به مدلهای زبانی بزرگ باعث شده قابلیت کشف مستقل و خلاقانه در هوش مصنوعی کاهش یابد.
یکی از انتقادات اصلی این دو پژوهشگر به مقطعی بودن تعاملات انسانی با هوش مصنوعی است؛ یعنی ارتباطی کوتاهمدت که در یک نوبت پرسش و پاسخ خلاصه میشود. آنها پیشنهاد کردهاند که مدلهای آینده باید در جریانهای بلندمدت و پیوسته از تجربه قرار گیرند، مشابه فرآیند یادگیری انسان در طول زندگی. در چنین مدلی، عامل هوش مصنوعی با دریافت پاداش از محیط واقعی یا شبیهسازیشده، به بهبود مستمر رفتار و تصمیمگیری خود دست مییابد.
سیلور و ساتن تأکید کردهاند که این روند به معنای حذف کامل انسان نیست، بلکه انسان همچنان تعیینکننده اهداف نهایی سیستمها باقی میماند. آنها اضافه کردهاند که پاداشهایی همچون بازخوردهای کاربر، نرخ موفقیت یا حتی نشانههایی مانند لایکها میتوانند محرک یادگیری در سیستمهای جدید باشند.
این دو پژوهشگر در پایان پیشبینی کردهاند که چنین مدلهایی میتوانند به هوش مصنوعی عمومی و حتی فراتر از آن منتهی شوند، چرا که یادگیری از جهان واقعی بدون پیشفرضهای انسانی، افقهای تازهای را در کشف و استدلال برای این فناوری رقم خواهد زد.