الگوریتم افکار AoT چیست؟ آشنایی با تکنیک خاص مایکروسافت برای آموزش دادن هوش مصنوعی

شناخت انسانی

مایکروسافت ادعا می‌کند که AoT ظرافت‌های استدلال و منطق انسانی را با دقت روش‌های الگوریتمی ترکیب می‌کند.

گرچه این ادعا قابل توجه است اما خود این هدف و آرزو چندان تازه نیست. ریشه‌های "یادگیری ماشینی" به دهه 1950 میلادی برمی‌گردد و پیشگام این حوزه یعنی آرتور ساموئل آن را به این صورت تعریف می‌کند: "حوزه مطالعه‌ای که به کامپیوترها امکان می‌دهد بدون برنامه ریزی دقیق، قابلیت یادگیری را پیدا کنند." برخلاف برنامه نویسی کامپیوتری سنتی - که در آن باید برای رسیدن به یک هدف، یک برنامه نویس فهرست دقیق دستورالعمل‌ها را مشخص کند تا کامپیوتر آنها را به ترتیب انجام دهد - یک الگوریتم یادگیری ماشینی از داده‌ها استفاده می‌کند تا خودش را برای پیدا کردن الگوها و حل مسائل آموزش دهد. به عبارت دیگر، این سیستم به صورت مبهم و شبیه به سیستم شناخت انسان کار می‌کند. ChatGPT از OpenAI هم از یک دسته بندی خاص از الگوریتم‌های یادگیری ماشینی به نام RLHF (یادگیری تقویتی از بازخوردهای انسانی) استفاده می‌کند که به آن امکان می‌دهد در گفتگوهای انسانی شرکت کند.

AoT فراتر از این عمل می‌کند و ادعا شده که قصد دارد روش "زنجیره افکار" را پشت سر بگذارد.

زنجیره افکار: AoT به دنبال حل چه مسائلی است؟

می‌توان گفت که AoT با هدف حل کاستی‌های روش "زنجیره افکار" طراحی شده است. به گفته مایکروسافت، در روش زنجیره افکار، LLMها با تقسیم بندی یک سوال یا جمله به "مراحل خطی کوتاه‌تر برای رسیدن به جواب" آن را حل می‌کنند.

گرچه این روش نسبت به روش‌های معمولی که شامل یک گام ساده هستند، دستاورد مهمی محسوب می‌شود اما کاستی‌های خاصی هم دارد.

گاهی اوقات این روش باعث می‌شود که برای رسیدن به پاسخ، گام‌های غلطی طی شود چون طوری طراحی شده که بر اساس سوابق به نتیجه گیری برسد و سابقه‌ای که بر اساس یک مجموعه داده مشخص به دست آمده، محدود به همان مجموعه داده می‌شود. به گفته مایکروسافت، این باعث افزایش سربار محاسباتی، مصرف حافظه و هزینه‌ها می‌شود.

AoT سعی دارد این نقطه ضعف‌ها را رفع کند. این الگوریتم ارزیابی می‌کند که آیا مراحل اولیه - افکار- منطقی هستند یا خیر و به این ترتیب از ایجاد شرایطی که در آن یک فکر غلط باعث رسیدن به یک نتیجه و خروجی پوچ می‌شود، جلوگیری می‌کند.

مایکروسافت با AoT چه کارهایی انجام می‌دهد؟

گرچه پاسخ این سوال به صورت صریح توسط مایکروسافت اعلام نشده اما AoT می‌تواند به کاهش توهمات هوش مصنوعی کمک کند - پدیده هشدار دهنده و مضحکی که باعث شده نرم‌افزارهایی مثل ChatGPT اطلاعات غلطی ارایه دهند. در یکی از مثال‌های شناخته شده‌تر که مربوط به ماه می سال 2023 است، وکیلی به نام استفان اِی. شوارتز اعتراف کرده که هنگام تحقیق برای یک حکم 10 صفحه‌ای از ChatGPT به عنوان منبع استفاده کرده اما مشکل اینجاست که در این حکم به چند رأی دادگاهی اشاره شده که هیچ وقت وجود نداشته‌اند.

OpenAI در مطلبی که در سایت رسمی خودش منتشر کرده می‌گوید "کاهش این توهمات، گامی مهم و حیاتی در زمینه تولید یک AGI (هوش مصنوعی جامع) قوی است."