<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"><channel><title>توسعه — فلش</title><description>توسعه</description><link>https://blog.felesh.ai/</link><item><title>سه درس از ذهن انسان برای معماری عامل</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/</guid><description>چند مسئله دشوار در طراحی عامل، به نحوه کارکرد ذهن انسان شباهت دارند: تمرکز به‌جای شلوغی، تشخیص زمان پایان کار و جداسازی لایه‌های حافظه. این شباهت‌ها راهنمای خوبی برای طراحی هستند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>اصل کمترین دانش: عامل شما فقط باید آنچه را نیاز دارد بداند</title><link>https://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/</guid><description>هر اطلاعاتی که به کار عامل نیاید، هم دقت را کاهش می‌دهد و هم سطح حمله را افزایش می‌دهد. با اقتباس از اصل کمترین دسترسی در امنیت، این قاعده را به دانش عامل تعمیم دهید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>مدل‌ها را با داده‌های خودتان ارزیابی کنید، نه با جدول‌های عمومی</title><link>https://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/</guid><description>جدول‌های رتبه‌بندی عمومی کمتر از آنچه فکر می‌کنید درباره کار شما می‌گویند. راهکار مطمئن این است: یک مجموعه ارزیابی کوچک و معرف کار واقعی خود بسازید و گزینه‌ها را با همان ارزیابی کنید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>رویدادمحور از پایه: تیم‌هایی از عامل‌ها که پیامی را از دست نمی‌دهند</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/</guid><description>هنگام همکاری چند عامل با یکدیگر، بزرگ‌ترین خطر، از دست رفتن پیام‌ها و فروپاشی زنجیره است؛ معماری رویدادمحور با چند قاعده ساده این خطر را برطرف می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>دام‌های رایج در ریزتنظیم و روش‌های اشکال‌زدایی</title><link>https://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/</guid><description>ریشه بیشتر ریزتنظیم‌های ناموفق به چند الگوی تکراری برمی‌گردد؛ با شناخت این نشانه‌ها، اشکال‌زدایی به‌جای حدس و گمان به یک فهرست بررسی ساده تبدیل می‌شود.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>خانواده LoRA: QLoRA، DoRA و LoRA+؛ کدام‌یک و چه زمانی؟</title><link>https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/</guid><description>از زمان معرفی LoRA، چندین نسخه بهبودیافته ارائه شده‌اند که هرکدام مشکل خاصی را هدف قرار می‌دهند. شناخت این نسخه‌ها کمک می‌کند برای هر کار، گزینه مناسب را انتخاب کنید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>MLP حافظه مدل است: دانش در کجا جای دارد؟</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/</guid><description>در یک مدل زبانی، لایه‌های Attention اطلاعات را مسیریابی می‌کنند، اما دانش واقعی در جای دیگری ذخیره می‌شود؛ در لایه‌های MLP که بخش بزرگی از مدل را تشکیل می‌دهند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>PagedAttention و continuous batching: چگونه یک سرور به کاربران بیشتری پاسخ می‌دهد</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/</guid><description>دو ترفند زیرساختی، ظرفیت یک سرور مدل زبانی را چند برابر می‌کنند: continuous batching و مدیریت هوشمند حافظهٔ KV. هر دو از یک ایدهٔ ساده می‌آیند — هدر ندادن منابع.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>وقتی هیچ مدلی به‌تنهایی کافی نیست: الگوی Generator-Verifier</title><link>https://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/</guid><description>گاهی یک مسئله دو نیازمندی حیاتی دارد که هیچ مدلی به‌تنهایی هر دو را برآورده نمی‌کند. راهکار، پذیرش مدلی ضعیف نیست، بلکه ترکیب دو مدل است.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>حالت‌های رایج شکست در سامانه‌های مدل زبانی — و چگونگی شناسایی و مهار آن‌ها</title><link>https://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/</guid><description>مدل‌های زبانی نه به‌صورت تصادفی، بلکه به شیوه‌هایی مشخص دچار شکست می‌شوند؛ با شناخت این حالت‌ها، می‌توانید پیش از مواجهه کاربر، آن‌ها را شناسایی و مهار کنید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>رتبه‌بندی مدل‌ها را کنار بگذارید و آن‌ها را پروفایل کنید</title><link>https://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/</guid><description>یک عدد در جدول رتبه‌بندی مشخص نمی‌کند کدام مدل برای کار شما مناسب است؛ اما یک پروفایل چندبعدی از قابلیت‌ها، چرا.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>دفاع در برابر Prompt Injection و Jailbreak و کاهش توهم</title><link>https://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/</guid><description>وقتی ورودی کاربر می‌تواند رفتار عامل را تغییر دهد، امنیت به مسئله‌ای در طراحی تبدیل می‌شود. رعایت چند اصل روشن، بیشتر این حملات را خنثی می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>ابتدا ذخیره، سپس انتشار: قاعده‌ای ساده برای جلوگیری از دست رفتن کار</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/</guid><description>یکی از رایج‌ترین خطاهای پنهان در سامانه‌های رویدادمحور این است که خبر پیش از واقعیت منتشر شود. رعایت ترتیب درست (ابتدا ذخیره و سپس انتشار)، این خطا را به‌کلی از بین می‌برد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>لایهٔ قاعده: حصارهای قطعی پیرامون یک مدل احتمالاتی</title><link>https://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/</guid><description>مدل زبانی ساختاری احتمالاتی دارد و گاهی خطا می‌کند؛ راهِ افزایش قابلیت اطمینان آن، کامل‌تر کردن خود مدل نیست، بلکه ساخت لایه‌ای قطعی است که لغزش‌های مدل را مهار کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>رهگیری یک درخواست در سامانه‌ای چندعاملی</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/</guid><description>بهترین راه برای درک معماری چندعاملی، دنبال کردن یک درخواست واقعی از ابتدا تا انتهاست. بیایید یک پیام مبهم را گام‌به‌گام تا رسیدن به کنشی ساختارمند دنبال کنیم.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>کوانتش دقیقاً چه می‌کند: افت دقت و فروپاشی فضای برداری</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/</guid><description>کوانتش یعنی ذخیره‌سازی وزن‌های مدل با بیت‌های کمتر. اما این کاهش دقت دقیقاً چه بر سر مدل می‌آورد و چرا مدل‌ها در برابر آن تا این حد مقاوم هستند؟</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>چرا LoRA کار می‌کند: داستان بعد ذاتی</title><link>https://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/</guid><description>اگر یک مدل بزرگ میلیاردها پارامتر دارد، چگونه می‌توان آن را تنها با آموزش چند ماتریس کوچک تنظیم کرد؟ پاسخ در یک ایده‌ی ظریف نهفته است: تغییر لازم، بعد ذاتی کوچکی دارد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>از کارگر تا متخصص: عاملی که کنترل یک حوزه را در دست دارد</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/</guid><description>تفاوت کارگر مجری با متخصص در این است که اولی کاری را انجام می‌دهد و کنار می‌رود، اما دومی کنترل یک حوزه را در دست دارد و وضعیت آن را در طول زمان حفظ می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item></channel></rss>