حلقهٔ ادراک، استدلال، کنش
یک عامل چگونه «فکر میکند»؟ سادهترین تصویر برای درک این فرآیند، حلقهای است که تا زمان رسیدن به هدف تکرار میشود: ادراک، سپس استدلال و برنامهریزی، پس از آن کنش، و بازگشت دوباره به ادراک. در مرحلهٔ ادراک، هر ورودی — اعم از متن، تصویر، صدا یا داده — به متنی تبدیل میشود که برای مدل قابلفهم باشد؛ هرچه این توصیف دقیقتر باشد، عامل نیز بهتر استدلال خواهد کرد. سپس عامل دربارهٔ اقدام بعدی تصمیم میگیرد، آن را اجرا میکند، نتیجه را میبیند و این حلقه را ادامه میدهد.
استدلال پیش از کنش
رایجترین الگوی پیادهسازی این حلقه «استدلال و کنش» نام دارد و از سه گام متناوب تشکیل شده است: اندیشه، کنش و مشاهده. در گام اندیشه، عامل با طرح این پرسش که «اکنون چه کاری باید انجام دهم؟» به صورت مرحلهبهمرحله استدلال میکند. در گام کنش، ابزار مشخصی را با ورودی تعیینشده فرا میخواند. در گام مشاهده، نتیجهٔ حاصل را بررسی میکند و سپس بار دیگر به تفکر میپردازد. نکتهٔ کلیدی اینجاست که اگر عامل را وادار کنیم پیش از اقدام عملی، «بلند فکر کند»، تصمیمهای بهتری اتخاذ خواهد کرد.
ابزارها
یک عاملِ بدون ابزار، چیزی فراتر از خودِ مدل نیست. هر ابزار از سه بخش تشکیل میشود: یک نام، یک توصیف (که مدل با خواندن آن درمییابد چه زمانی باید به سراغ این ابزار برود) و ورودیهای مشخص. دقت در نگارش این توصیف اهمیت بسزایی دارد؛ چرا که توصیفهای مبهم ممکن است عامل را به انتخاب ابزار نادرست سوق دهند. یک اصل کلیدی دیگر را نیز باید به خاطر داشت: تنها ابزارهایی را در اختیار عامل بگذارید که واقعاً به آنها نیاز دارد، و برای اقدامات بازگشتناپذیر، تأیید انسان را الزامی کنید.
چرا این ساختار، عامل را قابلبازرسی میکند
در نحوهٔ قرارگیری این اجزا در کنار یکدیگر، مزیتی ظریف نهفته است. تواناییهای یک عامل درون آن پنهان نیستند، بلکه کاملاً آشکارا به او سپرده میشوند: از مدلِ مشخصی گرفته تا ابزارهای معینی که هرکدام نام و توصیفی خوانا دارند. بنابراین، تنها با بررسی آنچه به عامل داده شده است، میتوان در یک نگاه دریافت که چه کارهایی از او برمیآید؛ هیچ قابلیتی در خفا و به دور از چشم به کار گرفته نمیشود.
وقتی این ویژگی را در کنار همان ردپای «بلند فکر کردن» (که پیشتر گفتیم) بگذارید، تکتک گامهای فرآیند، سنجشپذیر و قابلبررسی میشود. برای هر کنشی که از عامل سر میزند، دلیل صریحی که برای آن آورده («اکنون چه کاری باید انجام دهم؟»)، ابزار دقیقی که فراخوانده و نتیجهای که مشاهده کرده است، در دسترس ما قرار دارد. میتوانیم کل این زنجیره را پس از پایان کار دنبال کنیم تا ببینیم کدام ابزار، با چه ورودی و دقیقاً به چه دلیلی فعال شده است. عاملی که اینگونه ساخته شود، یک «جعبهٔ سیاه» نیست که صرفاً پاسخی بیرون بدهد؛ بلکه فرآیندِ تصمیمی است که میتوان گامبهگام آن را بازرسی کرد.
کِی باید متوقف شد
یک حلقه بدون داشتن شرط پایان، میتواند تا بینهایت بچرخد و هزینههای زیادی تحمیل کند. از این رو، عامل به معیارهای روشنی برای توقف نیاز دارد: زمانی که پاسخ نهایی آماده شده باشد، هنگامی که تعداد گامها به سقف مجاز برسد، یا زمانی که عامل یک ابزار را با ورودی کاملاً یکسان چندین بار پیاپی فراخوانی کند و عملاً گرفتار چرخه تکرار شود. تعیین دقیق این شرایط توقف، به اندازهٔ طراحی خودِ حلقه اهمیت دارد.
یک هدف، چند درجه از خودگردانی
میزان استقلال تمام عاملها یکسان نیست. در یک سوی این طیف، دستیاری قرار دارد که صرفاً پیشنهادهایی ارائه میدهد و تصمیمگیری نهایی در هر گام بر عهدهٔ انسان است. در میانهٔ طیف، عاملی است که هدفی کلی را دریافت میکند، گامهای اجرایی را میچیند و در نقاط حساس، تأیید کاربر را جویا میشود. در سوی دیگر نیز عاملی کاملاً خودگردان و مستقل قرار دارد که البته این مورد هنوز بیشتر جنبهٔ آزمایشگاهی دارد و آمادهٔ استفاده در محیطهای واقعی نیست. انتخاب سطح مناسب از خودگردانی، خود یکی از مراحل اساسی طراحی است.