در مواجهه با مفهومِ دستیار هوشمند، اغلب تصویری واحد در ذهنمان نقش می‌بندد: ابزاری که با ما سخن می‌گوید. با این حال، کارکردِ واقعیِ چنین دستیاری فراتر از گفت‌وگوی ساده است. پشتِ هر گفت‌وگوی روان، باید پردازشِ شناختیِ عمیقی صورت گیرد: درکِ نیتِ کاربر، استخراجِ جزئیات و تبدیلِ خواسته‌ای مبهم به اقدامی صریح و روشن. بر این باوریم که این دو کارکرد، دو لایهٔ متفاوت از هوش به شمار می‌روند و تفکیکِ آن‌ها — و نه ادغامشان — کلیدِ طراحیِ سامانه‌ای است که به‌درستی کار می‌کند.

دو لایه، دو مسئولیت

لایهٔ نخست، هوشِ گفت‌وگو است؛ لایه‌ای که در تعاملِ مستقیم با کاربر قرار می‌گیرد، زبانِ طبیعی را درک می‌کند، مسیر گفت‌وگو را پیش می‌برد و در صورت بروز ابهام، پرسش‌های شفاف‌کننده می‌پرسد. این لایه باید روان، شکیبا و با لحنی انسانی رفتار کند. با این حال، این بخش عمداً خود را درگیر منطقِ پیچیدهٔ حوزهٔ تخصصی نمی‌کند و وظیفه‌اش تنها شفاف‌سازیِ نیتِ کاربر و گردآوریِ زمینه‌ها و اطلاعاتِ کافی است.

لایهٔ دوم، هوشِ پس‌زمینه نام دارد؛ سرویس‌های تخصصی که پردازش‌های شناختیِ سنگین را بر عهده دارند. این لایه ارتباط مستقیمی با انسان برقرار نمی‌کند، بلکه تمرکزِ آن بر پردازشِ عمیق است: تبدیلِ یک خواسته به ساختاری مشخص، تشخیصِ اولویت‌ها و اجرای منطقِ حوزهٔ تخصصی. تخصصِ واقعیِ سامانه در همین لایه جریان دارد.

چرا جداکردن مهم است

راهکارِ ساده‌تر و وسوسه‌انگیز، تجمیعِ همه‌چیز در یک لایه است؛ یعنی طراحیِ یک عامل که هم‌زمان وظیفهٔ گفت‌وگو و پردازشِ سنگین را به دوش بکشد. اما این دو مأموریت ماهیتی کاملاً متفاوت دارند. گفت‌وگو نیازمندِ سرعت و روانی است، در حالی که پردازشِ شناختیِ عمیق می‌تواند زمان‌بر و سنگین باشد. در صورت ادغامِ این دو، یا روانیِ گفت‌وگو آسیب می‌بیند یا عمقِ پردازشِ شناختی فدا می‌شود. تفکیکِ این لایه‌ها فضایی فراهم می‌کند تا هر بخش در بالاترین سطحِ تواناییِ خود عمل کند.

یک نمونهٔ ساده

فرض کنید کاربری چنین پیامی می‌فرستد: «سفارشم نرسیده و کسی جواب نمی‌دهد.» لایهٔ گفت‌وگو این پیام را دریافت کرده، متوجه می‌شود با شکایتی دربارهٔ تأخیر روبه‌روست و در صورت نیاز، شمارهٔ سفارش را جویا می‌شود. در گام بعد، کار را به لایهٔ پس‌زمینه واگذار می‌کند تا پیام را به قالبی ساختاریافته (شاملِ نوعِ مسئله، درجهٔ اهمیت و اقدامِ مناسب) تبدیل کند. در نهایت، لایهٔ گفت‌وگو پاسخی روشن و شایسته به کاربر ارائه می‌دهد. از نگاه کاربر، همه‌چیز در قالبِ یک گفت‌وگوی ساده پیش رفته است؛ اما در پس‌زمینه، دو لایهٔ هوشمند با هماهنگیِ کامل با یکدیگر همکاری کرده‌اند.

این یک چت‌بات به‌علاوهٔ یک API نیست

تأکید می‌کنیم که این ساختار، صرفاً «اتصالِ یک چت‌بات به یک سرویس» نیست. تفاوتِ بنیادی در هوشمندیِ هر دو لایه است. لایهٔ گفت‌وگو تنها یک واسط کاربری نیست، بلکه نیتِ مخاطب را درک کرده و جریانِ گفت‌وگو را هدایت می‌کند. از سوی دیگر، لایهٔ پس‌زمینه نیز صرفاً یک تابعِ ثابت با خروجیِ از‌پیش‌تعیین‌شده نیست؛ بلکه قدرتِ استدلال و تصمیم‌گیری دارد. این رویکرد، همان لایه‌بندیِ شناختی است: هم‌نشینیِ هوشِ گفت‌وگویی و عمقِ تخصصی، به گونه‌ای که هیچ‌یک به‌تنهایی کارساز نخواهند بود.

جمع‌بندی

بر این باوریم که آیندهٔ دستیارهای هوشمند در گروِ توسعهٔ یک عاملِ تک‌کاره و جامع نیست؛ بلکه در طراحیِ لایه‌های مجزایی از هوش نهفته است که هرکدام وظیفهٔ خود را به بهترین شکل انجام می‌دهند و با یکدیگر هماهنگ می‌شوند. لایهٔ گفت‌وگو وظیفهٔ تعامل با انسان را بر عهده می‌گیرد و لایهٔ پس‌زمینه، عمقِ تحلیل را فراهم می‌آورد. دقیقاً همین تقسیمِ کار است که اجازه می‌دهد پیامی ساده به اقدامی درست و دقیق تبدیل شود؛ بی‌آنکه روانیِ گفت‌وگو تحت‌الشعاع قرار گیرد یا از عمقِ تخصصِ فنی کاسته شود.