عامل هوش مصنوعی چگونه فکر می‌کند؟

یک عامل هدفی را دریافت می‌کند، می‌اندیشد، اقدامی انجام می‌دهد و نتیجه را مشاهده می‌کند — و این چرخه را تا رسیدن به هدف تکرار می‌کند. مدلی ساده برای درک استدلال و تصمیم‌گیری عامل.

حلقهٔ ادراک، استدلال، کنش

یک عامل چگونه «فکر می‌کند»؟ ساده‌ترین تصویر برای درک این فرآیند، حلقه‌ای است که تا زمان رسیدن به هدف تکرار می‌شود: ادراک، سپس استدلال و برنامه‌ریزی، پس از آن کنش، و بازگشت دوباره به ادراک. در مرحلهٔ ادراک، هر ورودی — اعم از متن، تصویر، صدا یا داده — به متنی تبدیل می‌شود که برای مدل قابل‌فهم باشد؛ هرچه این توصیف دقیق‌تر باشد، عامل نیز بهتر استدلال خواهد کرد. سپس عامل دربارهٔ اقدام بعدی تصمیم می‌گیرد، آن را اجرا می‌کند، نتیجه را می‌بیند و این حلقه را ادامه می‌دهد.

استدلال پیش از کنش

رایج‌ترین الگوی پیاده‌سازی این حلقه «استدلال و کنش» نام دارد و از سه گام متناوب تشکیل شده است: اندیشه، کنش و مشاهده. در گام اندیشه، عامل با طرح این پرسش که «اکنون چه کاری باید انجام دهم؟» به صورت مرحله‌به‌مرحله استدلال می‌کند. در گام کنش، ابزار مشخصی را با ورودی تعیین‌شده فرا می‌خواند. در گام مشاهده، نتیجهٔ حاصل را بررسی می‌کند و سپس بار دیگر به تفکر می‌پردازد. نکتهٔ کلیدی اینجاست که اگر عامل را وادار کنیم پیش از اقدام عملی، «بلند فکر کند»، تصمیم‌های بهتری اتخاذ خواهد کرد.

ابزارها

یک عاملِ بدون ابزار، چیزی فراتر از خودِ مدل نیست. هر ابزار از سه بخش تشکیل می‌شود: یک نام، یک توصیف (که مدل با خواندن آن درمی‌یابد چه زمانی باید به سراغ این ابزار برود) و ورودی‌های مشخص. دقت در نگارش این توصیف اهمیت بسزایی دارد؛ چرا که توصیف‌های مبهم ممکن است عامل را به انتخاب ابزار نادرست سوق دهند. یک اصل کلیدی دیگر را نیز باید به خاطر داشت: تنها ابزارهایی را در اختیار عامل بگذارید که واقعاً به آن‌ها نیاز دارد، و برای اقدامات بازگشت‌ناپذیر، تأیید انسان را الزامی کنید.

چرا این ساختار، عامل را قابل‌بازرسی می‌کند

در نحوهٔ قرارگیری این اجزا در کنار یکدیگر، مزیتی ظریف نهفته است. توانایی‌های یک عامل درون آن پنهان نیستند، بلکه کاملاً آشکارا به او سپرده می‌شوند: از مدلِ مشخصی گرفته تا ابزارهای معینی که هرکدام نام و توصیفی خوانا دارند. بنابراین، تنها با بررسی آنچه به عامل داده شده است، می‌توان در یک نگاه دریافت که چه کارهایی از او برمی‌آید؛ هیچ قابلیتی در خفا و به دور از چشم به کار گرفته نمی‌شود.

وقتی این ویژگی را در کنار همان ردپای «بلند فکر کردن» (که پیش‌تر گفتیم) بگذارید، تک‌تک گام‌های فرآیند، سنجش‌پذیر و قابل‌بررسی می‌شود. برای هر کنشی که از عامل سر می‌زند، دلیل صریحی که برای آن آورده («اکنون چه کاری باید انجام دهم؟»)، ابزار دقیقی که فراخوانده و نتیجه‌ای که مشاهده کرده است، در دسترس ما قرار دارد. می‌توانیم کل این زنجیره را پس از پایان کار دنبال کنیم تا ببینیم کدام ابزار، با چه ورودی و دقیقاً به چه دلیلی فعال شده است. عاملی که این‌گونه ساخته شود، یک «جعبهٔ سیاه» نیست که صرفاً پاسخی بیرون بدهد؛ بلکه فرآیندِ تصمیمی است که می‌توان گام‌به‌گام آن را بازرسی کرد.

کِی باید متوقف شد

یک حلقه بدون داشتن شرط پایان، می‌تواند تا بی‌نهایت بچرخد و هزینه‌های زیادی تحمیل کند. از این رو، عامل به معیارهای روشنی برای توقف نیاز دارد: زمانی که پاسخ نهایی آماده شده باشد، هنگامی که تعداد گام‌ها به سقف مجاز برسد، یا زمانی که عامل یک ابزار را با ورودی کاملاً یکسان چندین بار پیاپی فراخوانی کند و عملاً گرفتار چرخه تکرار شود. تعیین دقیق این شرایط توقف، به اندازهٔ طراحی خودِ حلقه اهمیت دارد.

یک هدف، چند درجه از خودگردانی

میزان استقلال تمام عامل‌ها یکسان نیست. در یک سوی این طیف، دستیاری قرار دارد که صرفاً پیشنهادهایی ارائه می‌دهد و تصمیم‌گیری نهایی در هر گام بر عهدهٔ انسان است. در میانهٔ طیف، عاملی است که هدفی کلی را دریافت می‌کند، گام‌های اجرایی را می‌چیند و در نقاط حساس، تأیید کاربر را جویا می‌شود. در سوی دیگر نیز عاملی کاملاً خودگردان و مستقل قرار دارد که البته این مورد هنوز بیشتر جنبهٔ آزمایشگاهی دارد و آمادهٔ استفاده در محیط‌های واقعی نیست. انتخاب سطح مناسب از خودگردانی، خود یکی از مراحل اساسی طراحی است.