توسعه — فلش

توسعه — فلشتوسعهhttps://blog.felesh.ai/سه درس از ذهن انسان برای معماری عاملhttps://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/https://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/چند مسئله دشوار در طراحی عامل، به نحوه کارکرد ذهن انسان شباهت دارند: تمرکز به‌جای شلوغی، تشخیص زمان پایان کار و جداسازی لایه‌های حافظه. این شباهت‌ها راهنمای خوبی برای طراحی هستند.Sun, 21 Jun 2026 00:00:00 GMTاصل کمترین دانش: عامل شما فقط باید آنچه را نیاز دارد بداندhttps://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/https://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/هر اطلاعاتی که به کار عامل نیاید، هم دقت را کاهش می‌دهد و هم سطح حمله را افزایش می‌دهد. با اقتباس از اصل کمترین دسترسی در امنیت، این قاعده را به دانش عامل تعمیم دهید.Sun, 21 Jun 2026 00:00:00 GMTمدل‌ها را با داده‌های خودتان ارزیابی کنید، نه با جدول‌های عمومیhttps://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/https://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/جدول‌های رتبه‌بندی عمومی کمتر از آنچه فکر می‌کنید درباره کار شما می‌گویند. راهکار مطمئن این است: یک مجموعه ارزیابی کوچک و معرف کار واقعی خود بسازید و گزینه‌ها را با همان ارزیابی کنید.Sun, 21 Jun 2026 00:00:00 GMTرویدادمحور از پایه: تیم‌هایی از عامل‌ها که پیامی را از دست نمی‌دهندhttps://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/https://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/هنگام همکاری چند عامل با یکدیگر، بزرگ‌ترین خطر، از دست رفتن پیام‌ها و فروپاشی زنجیره است؛ معماری رویدادمحور با چند قاعده ساده این خطر را برطرف می‌کند.Sun, 21 Jun 2026 00:00:00 GMTدام‌های رایج در ریزتنظیم و روش‌های اشکال‌زداییhttps://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/https://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/ریشه بیشتر ریزتنظیم‌های ناموفق به چند الگوی تکراری برمی‌گردد؛ با شناخت این نشانه‌ها، اشکال‌زدایی به‌جای حدس و گمان به یک فهرست بررسی ساده تبدیل می‌شود.Sun, 21 Jun 2026 00:00:00 GMTخانواده LoRA: QLoRA، DoRA و LoRA+؛ کدام‌یک و چه زمانی؟https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/از زمان معرفی LoRA، چندین نسخه بهبودیافته ارائه شده‌اند که هرکدام مشکل خاصی را هدف قرار می‌دهند. شناخت این نسخه‌ها کمک می‌کند برای هر کار، گزینه مناسب را انتخاب کنید.Sun, 21 Jun 2026 00:00:00 GMTMLP حافظه مدل است: دانش در کجا جای دارد؟https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/در یک مدل زبانی، لایه‌های Attention اطلاعات را مسیریابی می‌کنند، اما دانش واقعی در جای دیگری ذخیره می‌شود؛ در لایه‌های MLP که بخش بزرگی از مدل را تشکیل می‌دهند.Sun, 21 Jun 2026 00:00:00 GMTPagedAttention و continuous batching: چگونه یک سرور به کاربران بیشتری پاسخ می‌دهدhttps://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/https://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/دو ترفند زیرساختی، ظرفیت یک سرور مدل زبانی را چند برابر می‌کنند: continuous batching و مدیریت هوشمند حافظهٔ KV. هر دو از یک ایدهٔ ساده می‌آیند — هدر ندادن منابع.Sun, 21 Jun 2026 00:00:00 GMTوقتی هیچ مدلی به‌تنهایی کافی نیست: الگوی Generator-Verifierhttps://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/https://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/گاهی یک مسئله دو نیازمندی حیاتی دارد که هیچ مدلی به‌تنهایی هر دو را برآورده نمی‌کند. راهکار، پذیرش مدلی ضعیف نیست، بلکه ترکیب دو مدل است.Sun, 21 Jun 2026 00:00:00 GMTحالت‌های رایج شکست در سامانه‌های مدل زبانی — و چگونگی شناسایی و مهار آن‌هاhttps://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/https://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/مدل‌های زبانی نه به‌صورت تصادفی، بلکه به شیوه‌هایی مشخص دچار شکست می‌شوند؛ با شناخت این حالت‌ها، می‌توانید پیش از مواجهه کاربر، آن‌ها را شناسایی و مهار کنید.Sun, 21 Jun 2026 00:00:00 GMTرتبه‌بندی مدل‌ها را کنار بگذارید و آن‌ها را پروفایل کنیدhttps://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/https://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/یک عدد در جدول رتبه‌بندی مشخص نمی‌کند کدام مدل برای کار شما مناسب است؛ اما یک پروفایل چندبعدی از قابلیت‌ها، چرا.Sun, 21 Jun 2026 00:00:00 GMTدفاع در برابر Prompt Injection و Jailbreak و کاهش توهمhttps://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/https://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/وقتی ورودی کاربر می‌تواند رفتار عامل را تغییر دهد، امنیت به مسئله‌ای در طراحی تبدیل می‌شود. رعایت چند اصل روشن، بیشتر این حملات را خنثی می‌کند.Sun, 21 Jun 2026 00:00:00 GMTابتدا ذخیره، سپس انتشار: قاعده‌ای ساده برای جلوگیری از دست رفتن کارhttps://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/https://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/یکی از رایج‌ترین خطاهای پنهان در سامانه‌های رویدادمحور این است که خبر پیش از واقعیت منتشر شود. رعایت ترتیب درست (ابتدا ذخیره و سپس انتشار)، این خطا را به‌کلی از بین می‌برد.Sun, 21 Jun 2026 00:00:00 GMTلایهٔ قاعده: حصارهای قطعی پیرامون یک مدل احتمالاتیhttps://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/https://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/مدل زبانی ساختاری احتمالاتی دارد و گاهی خطا می‌کند؛ راهِ افزایش قابلیت اطمینان آن، کامل‌تر کردن خود مدل نیست، بلکه ساخت لایه‌ای قطعی است که لغزش‌های مدل را مهار کند.Sun, 21 Jun 2026 00:00:00 GMTرهگیری یک درخواست در سامانه‌ای چندعاملیhttps://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/https://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/بهترین راه برای درک معماری چندعاملی، دنبال کردن یک درخواست واقعی از ابتدا تا انتهاست. بیایید یک پیام مبهم را گام‌به‌گام تا رسیدن به کنشی ساختارمند دنبال کنیم.Sun, 21 Jun 2026 00:00:00 GMTکوانتش دقیقاً چه می‌کند: افت دقت و فروپاشی فضای برداریhttps://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/https://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/کوانتش یعنی ذخیره‌سازی وزن‌های مدل با بیت‌های کمتر. اما این کاهش دقت دقیقاً چه بر سر مدل می‌آورد و چرا مدل‌ها در برابر آن تا این حد مقاوم هستند؟Sun, 21 Jun 2026 00:00:00 GMTچرا LoRA کار می‌کند: داستان بعد ذاتیhttps://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/https://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/اگر یک مدل بزرگ میلیاردها پارامتر دارد، چگونه می‌توان آن را تنها با آموزش چند ماتریس کوچک تنظیم کرد؟ پاسخ در یک ایده‌ی ظریف نهفته است: تغییر لازم، بعد ذاتی کوچکی دارد.Sun, 21 Jun 2026 00:00:00 GMTاز کارگر تا متخصص: عاملی که کنترل یک حوزه را در دست داردhttps://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/https://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/تفاوت کارگر مجری با متخصص در این است که اولی کاری را انجام می‌دهد و کنار می‌رود، اما دومی کنترل یک حوزه را در دست دارد و وضعیت آن را در طول زمان حفظ می‌کند.Sun, 21 Jun 2026 00:00:00 GMT