شرکت مایکروسافت، سازنده OpenAI روز بیستم آگوست سال 2023 با همکاری دانشگاه فناوری ویرجینیا مقاله سفیدی منتشر کرده و در آن به معرفی الگوریتم افکار (Algorithm of Thoughts یا به اختصار AoT) پرداخته است. هدف این رویکرد جدید در حوزه هوش مصنوعی، تولید مدلهای زبانی بزرگ (LLM) مثل ChatGPT است که با پیشرفتی شبیه به انسانها یاد میگیرند.
پیشنهاد AoT این است که برای آموزش دادن LLMها از روشهایی فراتر از روشهای قدیمی استفاده شود و در آن ادعا شده که "نتایج ما نشان میدهند که آموزش دادن LLM با استفاده از یک الگوریتم میتواند منجر به ایجاد عملکردی فراتر از عملکرد خود آن الگوریتم شود."
آیا این یعنی یک الگوریتم به تدریج از خودش باهوشتر میشود؟ میتوان گفت که طرز کار مغز انسانها هم به همین صورت است و این مهمترین ویژگی هوش مصنوعی است که از ابتدا وجود داشته است.
شناخت انسانی
مایکروسافت ادعا میکند که AoT ظرافتهای استدلال و منطق انسانی را با دقت روشهای الگوریتمی ترکیب میکند.
گرچه این ادعا قابل توجه است اما خود این هدف و آرزو چندان تازه نیست. ریشههای "یادگیری ماشینی" به دهه 1950 میلادی برمیگردد و پیشگام این حوزه یعنی آرتور ساموئل آن را به این صورت تعریف میکند: "حوزه مطالعهای که به کامپیوترها امکان میدهد بدون برنامه ریزی دقیق، قابلیت یادگیری را پیدا کنند." برخلاف برنامه نویسی کامپیوتری سنتی - که در آن باید برای رسیدن به یک هدف، یک برنامه نویس فهرست دقیق دستورالعملها را مشخص کند تا کامپیوتر آنها را به ترتیب انجام دهد - یک الگوریتم یادگیری ماشینی از دادهها استفاده میکند تا خودش را برای پیدا کردن الگوها و حل مسائل آموزش دهد. به عبارت دیگر، این سیستم به صورت مبهم و شبیه به سیستم شناخت انسان کار میکند. ChatGPT از OpenAI هم از یک دسته بندی خاص از الگوریتمهای یادگیری ماشینی به نام RLHF (یادگیری تقویتی از بازخوردهای انسانی) استفاده میکند که به آن امکان میدهد در گفتگوهای انسانی شرکت کند.
AoT فراتر از این عمل میکند و ادعا شده که قصد دارد روش "زنجیره افکار" را پشت سر بگذارد.
زنجیره افکار: AoT به دنبال حل چه مسائلی است؟
میتوان گفت که AoT با هدف حل کاستیهای روش "زنجیره افکار" طراحی شده است. به گفته مایکروسافت، در روش زنجیره افکار، LLMها با تقسیم بندی یک سوال یا جمله به "مراحل خطی کوتاهتر برای رسیدن به جواب" آن را حل میکنند.
گرچه این روش نسبت به روشهای معمولی که شامل یک گام ساده هستند، دستاورد مهمی محسوب میشود اما کاستیهای خاصی هم دارد.
گاهی اوقات این روش باعث میشود که برای رسیدن به پاسخ، گامهای غلطی طی شود چون طوری طراحی شده که بر اساس سوابق به نتیجه گیری برسد و سابقهای که بر اساس یک مجموعه داده مشخص به دست آمده، محدود به همان مجموعه داده میشود. به گفته مایکروسافت، این باعث افزایش سربار محاسباتی، مصرف حافظه و هزینهها میشود.
AoT سعی دارد این نقطه ضعفها را رفع کند. این الگوریتم ارزیابی میکند که آیا مراحل اولیه - افکار- منطقی هستند یا خیر و به این ترتیب از ایجاد شرایطی که در آن یک فکر غلط باعث رسیدن به یک نتیجه و خروجی پوچ میشود، جلوگیری میکند.
مایکروسافت با AoT چه کارهایی انجام میدهد؟
گرچه پاسخ این سوال به صورت صریح توسط مایکروسافت اعلام نشده اما AoT میتواند به کاهش توهمات هوش مصنوعی کمک کند - پدیده هشدار دهنده و مضحکی که باعث شده نرمافزارهایی مثل ChatGPT اطلاعات غلطی ارایه دهند. در یکی از مثالهای شناخته شدهتر که مربوط به ماه می سال 2023 است، وکیلی به نام استفان اِی. شوارتز اعتراف کرده که هنگام تحقیق برای یک حکم 10 صفحهای از ChatGPT به عنوان منبع استفاده کرده اما مشکل اینجاست که در این حکم به چند رأی دادگاهی اشاره شده که هیچ وقت وجود نداشتهاند.
OpenAI در مطلبی که در سایت رسمی خودش منتشر کرده میگوید "کاهش این توهمات، گامی مهم و حیاتی در زمینه تولید یک AGI (هوش مصنوعی جامع) قوی است."