یک مدل بزرگ برای همهچیز
شاید وسوسهانگیز باشد که قویترین مدل موجود را انتخاب کنیم و انجام تمام کارها را به آن بسپاریم. اما واقعیت این است که بیشتر وظایف کاری به تمام توان یک مدل پیشرو نیاز ندارند؛ این وظایف صرفاً قابلیتی مشخص را در سطحی معین میطلبند. استفاده از مدلی بزرگ برای انجام کارهای ساده، یعنی هزینهکردن برای قدرتی که هیچگاه به کارمان نمیآید.
هر کار، یک نیازِ متمرکز
بهجای تکیه بر جدولهای رتبهبندی کلی، بهتر است هر بخش از کار را بهطور مستقل بسنجیم. برای نمونه، ابزاری که وظیفه دستهبندی و تشخیص نیت کاربر را بر عهده دارد، نیازی به استدلال عمیق ندارد، بلکه کاراییاش به سرعت بالا و پایداری متکی است. در مقابل، یک ابزار خلاصهساز به انضباط و ساختارمند بودن قالب خروجی نیاز دارد. هر بخش از فرآیند، متناسب با حساسیت و پیامدهای خطای آن، تنها به زیرمجموعه خاصی از توانمندیها نیاز دارد. با مشخص کردن دقیق نیازها، اغلب درمییابیم که مدلی کوچکتر و متمرکزتر نیز میتواند همان کار را بهخوبی انجام دهد.
بهای پنهانِ بزرگی
این مسئله تنها به ظرافتهای فنی محدود نمیشود؛ دغدغه اصلی سرعت و هزینه است. مدلهای بزرگتر، کندتر و گرانترند و در فرآیندهایی که مستقیماً با کاربر نهایی سروکار دارند، این تاخیر و هزینه در مقیاسهای بزرگ بهشکلی چشمگیر خود را نشان میدهد. در این میان، یک قاعده ساده راهگشاست: از میان مدلهایی که نیاز واقعی کار را برآورده میکنند، کوچکترین گزینه را انتخاب کنیم. بهکارگیری مدلهای بزرگتر تنها زمانی توجیهپذیر است که مدل کوچکتر در یکی از قابلیتهای حیاتی واقعاً ناتوان باشد.
وقتی هیچ مدلی بهتنهایی کافی نیست
گاهی هیچ مدل کوچکی بهتنهایی نمیتواند تمام ابعاد یک کار را پوشش دهد. در چنین شرایطی، راهکار درست روی آوردن به مدلهای غولپیکر نیست، بلکه باید مدل اصلی را با یک راستیآزمای متمرکز ترکیب کرد؛ ناظری که ضعفهای خاص را تنها در بخشهای ضروری از جریان داده جبران کند. اصل بنیادی در همه جا یکسان است: شکافها را با افزودن هوش متمرکز پر کنیم، نه با بزرگ کردن مقیاس کل سامانه.