در مواجهه با مفهومِ دستیار هوشمند، اغلب تصویری واحد در ذهنمان نقش میبندد: ابزاری که با ما سخن میگوید. با این حال، کارکردِ واقعیِ چنین دستیاری فراتر از گفتوگوی ساده است. پشتِ هر گفتوگوی روان، باید پردازشِ شناختیِ عمیقی صورت گیرد: درکِ نیتِ کاربر، استخراجِ جزئیات و تبدیلِ خواستهای مبهم به اقدامی صریح و روشن. بر این باوریم که این دو کارکرد، دو لایهٔ متفاوت از هوش به شمار میروند و تفکیکِ آنها — و نه ادغامشان — کلیدِ طراحیِ سامانهای است که بهدرستی کار میکند.
دو لایه، دو مسئولیت
لایهٔ نخست، هوشِ گفتوگو است؛ لایهای که در تعاملِ مستقیم با کاربر قرار میگیرد، زبانِ طبیعی را درک میکند، مسیر گفتوگو را پیش میبرد و در صورت بروز ابهام، پرسشهای شفافکننده میپرسد. این لایه باید روان، شکیبا و با لحنی انسانی رفتار کند. با این حال، این بخش عمداً خود را درگیر منطقِ پیچیدهٔ حوزهٔ تخصصی نمیکند و وظیفهاش تنها شفافسازیِ نیتِ کاربر و گردآوریِ زمینهها و اطلاعاتِ کافی است.
لایهٔ دوم، هوشِ پسزمینه نام دارد؛ سرویسهای تخصصی که پردازشهای شناختیِ سنگین را بر عهده دارند. این لایه ارتباط مستقیمی با انسان برقرار نمیکند، بلکه تمرکزِ آن بر پردازشِ عمیق است: تبدیلِ یک خواسته به ساختاری مشخص، تشخیصِ اولویتها و اجرای منطقِ حوزهٔ تخصصی. تخصصِ واقعیِ سامانه در همین لایه جریان دارد.
چرا جداکردن مهم است
راهکارِ سادهتر و وسوسهانگیز، تجمیعِ همهچیز در یک لایه است؛ یعنی طراحیِ یک عامل که همزمان وظیفهٔ گفتوگو و پردازشِ سنگین را به دوش بکشد. اما این دو مأموریت ماهیتی کاملاً متفاوت دارند. گفتوگو نیازمندِ سرعت و روانی است، در حالی که پردازشِ شناختیِ عمیق میتواند زمانبر و سنگین باشد. در صورت ادغامِ این دو، یا روانیِ گفتوگو آسیب میبیند یا عمقِ پردازشِ شناختی فدا میشود. تفکیکِ این لایهها فضایی فراهم میکند تا هر بخش در بالاترین سطحِ تواناییِ خود عمل کند.
یک نمونهٔ ساده
فرض کنید کاربری چنین پیامی میفرستد: «سفارشم نرسیده و کسی جواب نمیدهد.» لایهٔ گفتوگو این پیام را دریافت کرده، متوجه میشود با شکایتی دربارهٔ تأخیر روبهروست و در صورت نیاز، شمارهٔ سفارش را جویا میشود. در گام بعد، کار را به لایهٔ پسزمینه واگذار میکند تا پیام را به قالبی ساختاریافته (شاملِ نوعِ مسئله، درجهٔ اهمیت و اقدامِ مناسب) تبدیل کند. در نهایت، لایهٔ گفتوگو پاسخی روشن و شایسته به کاربر ارائه میدهد. از نگاه کاربر، همهچیز در قالبِ یک گفتوگوی ساده پیش رفته است؛ اما در پسزمینه، دو لایهٔ هوشمند با هماهنگیِ کامل با یکدیگر همکاری کردهاند.
این یک چتبات بهعلاوهٔ یک API نیست
تأکید میکنیم که این ساختار، صرفاً «اتصالِ یک چتبات به یک سرویس» نیست. تفاوتِ بنیادی در هوشمندیِ هر دو لایه است. لایهٔ گفتوگو تنها یک واسط کاربری نیست، بلکه نیتِ مخاطب را درک کرده و جریانِ گفتوگو را هدایت میکند. از سوی دیگر، لایهٔ پسزمینه نیز صرفاً یک تابعِ ثابت با خروجیِ ازپیشتعیینشده نیست؛ بلکه قدرتِ استدلال و تصمیمگیری دارد. این رویکرد، همان لایهبندیِ شناختی است: همنشینیِ هوشِ گفتوگویی و عمقِ تخصصی، به گونهای که هیچیک بهتنهایی کارساز نخواهند بود.
جمعبندی
بر این باوریم که آیندهٔ دستیارهای هوشمند در گروِ توسعهٔ یک عاملِ تککاره و جامع نیست؛ بلکه در طراحیِ لایههای مجزایی از هوش نهفته است که هرکدام وظیفهٔ خود را به بهترین شکل انجام میدهند و با یکدیگر هماهنگ میشوند. لایهٔ گفتوگو وظیفهٔ تعامل با انسان را بر عهده میگیرد و لایهٔ پسزمینه، عمقِ تحلیل را فراهم میآورد. دقیقاً همین تقسیمِ کار است که اجازه میدهد پیامی ساده به اقدامی درست و دقیق تبدیل شود؛ بیآنکه روانیِ گفتوگو تحتالشعاع قرار گیرد یا از عمقِ تخصصِ فنی کاسته شود.