<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"><channel><title>فلش</title><description>آخرین نوشته‌های فلش</description><link>https://blog.felesh.ai/</link><item><title>چرا پیش از اقدامِ هوش مصنوعی، یک انسان تأیید می‌کند</title><link>https://blog.felesh.ai/fa/method/a-person-approves-before-the-ai-acts/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/method/a-person-approves-before-the-ai-acts/</guid><description>خودمختاری هدف نیست؛ اقدامِ درخورِ اعتماد هدف است. عامل‌های ما پیشنهاد می‌دهند؛ یک انسان تأیید می‌کند یا یادداشتی برای بازنگری می‌فرستد؛ تنها آنگاه کار اعمال می‌شود. اختیار به دست می‌آید، نه اینکه بخشیده شود.</description><pubDate>Tue, 23 Jun 2026 00:00:00 GMT</pubDate></item><item><title>هر اقدام، دلیل خود را به همراه دارد</title><link>https://blog.felesh.ai/fa/method/every-action-carries-its-reason/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/method/every-action-carries-its-reason/</guid><description>بیشتر سامانه‌ها ثبت می‌کنند که چه چیزی تغییر کرده است؛ اما آنچه هرگز نمی‌توان بعدها بازسازی کرد، «چرا»ی آن است — پس ما دلیل را به بخشی الزامی از هر تغییر تبدیل می‌کنیم که در همان لحظهٔ وقوع ثبت می‌شود.</description><pubDate>Tue, 23 Jun 2026 00:00:00 GMT</pubDate></item><item><title>یک رابطه، چند متخصص</title><link>https://blog.felesh.ai/fa/method/one-relationship-many-specialists/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/method/one-relationship-many-specialists/</guid><description>مشتری باید یک رابطهٔ واحد را حس کند، نه آنکه از رباتی به ربات دیگر دست‌به‌دست شود. در پسِ یک درگاه واحد، هر متخصص حوزه‌ای از آنِ خود دارد — یکپارچه در حالت پیش‌فرض، جداشدنی با یک تنظیم، و هرگز با بازسازی از پایه.</description><pubDate>Tue, 23 Jun 2026 00:00:00 GMT</pubDate></item><item><title>عامل‌هایی که فقط پاسخ نمی‌دهند، بلکه به‌شکلی ایمن عمل می‌کنند</title><link>https://blog.felesh.ai/fa/insights/agents-that-act-safely/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/agents-that-act-safely/</guid><description>جهش واقعی زمانی رخ می‌دهد که سامانه نه‌تنها پاسخ دهد، بلکه کاری را در یک سامانه واقعی به انجام برساند. از آنجا که عمل کردن خطا را پرهزینه می‌کند، «ایمن بودن» باید ساختاری باشد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>هوشی که از ممیزی سربلند بیرون می‌آید</title><link>https://blog.felesh.ai/fa/insights/ai-that-survives-an-audit/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/ai-that-survives-an-audit/</guid><description>وقتی سامانه‌ای هوشمند تصمیم می‌گیرد، دیر یا زود کسی می‌پرسد «چرا؟»؛ سامانه‌ای که نتواند پاسخ دهد، در ممیزی شکست می‌خورد. باور داریم قابلیت ممیزی باید از همان روز اول در خود طراحی گنجانده شود، نه به عنوان یک افزونهٔ بعدی.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>هوش مصنوعی متمرکز: چرا مدل‌های دقیق از مدل‌های بزرگ بهترند</title><link>https://blog.felesh.ai/fa/insights/attentive-ai/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/attentive-ai/</guid><description>بزرگ‌ترین مدل همیشه بهترین پاسخ نیست؛ وقتی هر کار مرزهای مشخص خود را دارد، هوش متمرکز همواره از هوش همه‌کاره پیشی می‌گیرد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>اختیار یک مسیر است، نه یک کلید</title><link>https://blog.felesh.ai/fa/insights/authority-as-a-trajectory/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/authority-as-a-trajectory/</guid><description>در روز نخست، کلید همه چیز را به یک کارآموز نمی‌سپارید؛ عامل‌های هوش مصنوعی نیز باید اختیار خود را به‌مرور و در طول مسیر به دست آورند—درست مانند پیشرفت در یک حرفه.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>سه درس از ذهن انسان برای معماری عامل</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/</guid><description>چند مسئله دشوار در طراحی عامل، به نحوه کارکرد ذهن انسان شباهت دارند: تمرکز به‌جای شلوغی، تشخیص زمان پایان کار و جداسازی لایه‌های حافظه. این شباهت‌ها راهنمای خوبی برای طراحی هستند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>اصل کمترین دانش: عامل شما فقط باید آنچه را نیاز دارد بداند</title><link>https://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/</guid><description>هر اطلاعاتی که به کار عامل نیاید، هم دقت را کاهش می‌دهد و هم سطح حمله را افزایش می‌دهد. با اقتباس از اصل کمترین دسترسی در امنیت، این قاعده را به دانش عامل تعمیم دهید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>CRM حالت خاصی از یک الگوی بزرگ‌تر است</title><link>https://blog.felesh.ai/fa/insights/crm-is-a-special-case/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/crm-is-a-special-case/</guid><description>آنچه برای مدیریت رابطه با مشتری ساخته‌ایم، در نگاه اول یک CRM است؛ اما در زیر آن، الگوی عمومی‌تری نهفته که فراتر از رابطه می‌رود.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>شما نرم‌افزار نمی‌خرید، بلکه زیست‌بومی می‌خرید که همگام با شما رشد می‌کند.</title><link>https://blog.felesh.ai/fa/insights/ecosystem-that-compounds/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/ecosystem-that-compounds/</guid><description>یک ابزار، مسئله‌ای را یک‌بار حل می‌کند و همان‌جا باقی می‌ماند؛ اما آنچه ما می‌سازیم زیست‌بومی است که هوشمندی‌اش با هر افزوده انباشته می‌شود.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>مدل‌ها را با داده‌های خودتان ارزیابی کنید، نه با جدول‌های عمومی</title><link>https://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/</guid><description>جدول‌های رتبه‌بندی عمومی کمتر از آنچه فکر می‌کنید درباره کار شما می‌گویند. راهکار مطمئن این است: یک مجموعه ارزیابی کوچک و معرف کار واقعی خود بسازید و گزینه‌ها را با همان ارزیابی کنید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>رویدادمحور از پایه: تیم‌هایی از عامل‌ها که پیامی را از دست نمی‌دهند</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/</guid><description>هنگام همکاری چند عامل با یکدیگر، بزرگ‌ترین خطر، از دست رفتن پیام‌ها و فروپاشی زنجیره است؛ معماری رویدادمحور با چند قاعده ساده این خطر را برطرف می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>Fine-tuning، RAG یا پرامپت: کدام‌یک و هرکدام چه هزینه‌ای دارد؟</title><link>https://blog.felesh.ai/fa/insights/fine-tune-rag-or-prompt/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/fine-tune-rag-or-prompt/</guid><description>سه راه برای متناسب‌سازی یک مدل با نیازهای شما وجود دارد و انتخاب اشتباه می‌تواند گران تمام شود؛ تفاوت در این است که هرکدام چه مشکلی را حل می‌کنند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>دام‌های رایج در ریزتنظیم و روش‌های اشکال‌زدایی</title><link>https://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/</guid><description>ریشه بیشتر ریزتنظیم‌های ناموفق به چند الگوی تکراری برمی‌گردد؛ با شناخت این نشانه‌ها، اشکال‌زدایی به‌جای حدس و گمان به یک فهرست بررسی ساده تبدیل می‌شود.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>از مدل‌های زبانی تا عامل‌ها: مسیر کامل</title><link>https://blog.felesh.ai/fa/learn/llms-to-agents/from-llms-to-agents/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/learn/llms-to-agents/from-llms-to-agents/</guid><description>یک مدل زبانی در اصل فقط کلمه بعدی را پیش‌بینی می‌کند. در این مطلب می‌بینیم که چگونه با افزودن ابزار، حافظه و برنامه‌ریزی به همین پیش‌بینی ساده، به یک عامل می‌رسیم و چه زمانی واقعاً به آن نیاز داریم.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>از مهندسی پرامپت تا مهندسی زمینه</title><link>https://blog.felesh.ai/fa/insights/from-prompt-to-context-engineering/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/from-prompt-to-context-engineering/</guid><description>زمانی هنر کار با مدل در نوشتن یک پرامپت خوب خلاصه می‌شد، اما به باور ما، مرکز ثقل در حال جابه‌جایی است: از ساختن یک دستور به طراحی کل زمینه‌ای که مدل در آن کار می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>از یک پیام مبهم تا کنش درست و ساختارمند</title><link>https://blog.felesh.ai/fa/insights/from-vague-message-to-action/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/from-vague-message-to-action/</guid><description>انسان‌ها مبهم، ناقص و آشفته صحبت می‌کنند. کار دشوار یک سامانه هوشمند، بیرون کشیدن کنش درست از دل این آشفتگی است — بی‌آنکه از کاربر بخواهد مانند یک فرم صحبت کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>عامل‌ها چگونه به خاطر می‌سپارند: حافظه و بازنمایی دانش</title><link>https://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-remember/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-remember/</guid><description>یک مدل زبانی به خودی خود حافظه‌ای ندارد و هر گفت‌وگو را از صفر آغاز می‌کند. آنچه به یک عامل حافظه می‌دهد، لایه‌هایی است که پیرامون مدل ساخته می‌شوند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>عامل هوش مصنوعی چگونه فکر می‌کند؟</title><link>https://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-think/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-think/</guid><description>یک عامل هدفی را دریافت می‌کند، می‌اندیشد، اقدامی انجام می‌دهد و نتیجه را مشاهده می‌کند — و این چرخه را تا رسیدن به هدف تکرار می‌کند. مدلی ساده برای درک استدلال و تصمیم‌گیری عامل.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>هوش لایه‌ای: وقتی هوش گفت‌وگو با هوش پس‌زمینه پیوند می‌خورد</title><link>https://blog.felesh.ai/fa/insights/layered-intelligence/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/layered-intelligence/</guid><description>یک عامل خوب باید هم‌زمان دو کار را به‌خوبی انجام دهد: گفت‌وگوی روان با انسان و کار شناختی عمیق در پشت صحنه. این دو، دو لایه متفاوت از هوش هستند — و بر این باوریم که جداسازی آن‌ها کلید کار است.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>خانواده LoRA: QLoRA، DoRA و LoRA+؛ کدام‌یک و چه زمانی؟</title><link>https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/</guid><description>از زمان معرفی LoRA، چندین نسخه بهبودیافته ارائه شده‌اند که هرکدام مشکل خاصی را هدف قرار می‌دهند. شناخت این نسخه‌ها کمک می‌کند برای هر کار، گزینه مناسب را انتخاب کنید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>ابرپارامترهای LoRA بدون ابهام: رتبه، آلفا و آنچه باید تنظیم کنید</title><link>https://blog.felesh.ai/fa/tutorials/lora-hyperparameters-demystified/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/tutorials/lora-hyperparameters-demystified/</guid><description>ریزتنظیم با LoRA چند مقدار کلیدی دارد که با درک معنای آن‌ها، انتخابشان آسان می‌شود. این راهنما رتبه، آلفا، نرخ یادگیری و سایر موارد را شفاف می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>MLP حافظه مدل است: دانش در کجا جای دارد؟</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/</guid><description>در یک مدل زبانی، لایه‌های Attention اطلاعات را مسیریابی می‌کنند، اما دانش واقعی در جای دیگری ذخیره می‌شود؛ در لایه‌های MLP که بخش بزرگی از مدل را تشکیل می‌دهند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>چرا مدل‌های خود را روی زیرساخت داخلی اجرا می‌کنیم</title><link>https://blog.felesh.ai/fa/insights/our-own-models/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/our-own-models/</guid><description>اجرای مدل روی زیرساخت خود، تنها یک انتخاب فنی نیست؛ بلکه باوری به استقلال، ماندن داده‌ها در خانه و پایداری است. این، تصمیم ما و دلیل آن است.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>کارمندان هوش مصنوعی خود را استخدام کنید، آموزش دهید و یاد بگیرید به آن‌ها اعتماد کنید</title><link>https://blog.felesh.ai/fa/insights/owner-ai-employees/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/owner-ai-employees/</guid><description>نرم‌افزار را نصب می‌کنید اما کارمند را استخدام؛ همین تفاوت کوچک، همه‌چیز را در ساخت یک سازمان دیجیتال دگرگون می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>PagedAttention و continuous batching: چگونه یک سرور به کاربران بیشتری پاسخ می‌دهد</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/</guid><description>دو ترفند زیرساختی، ظرفیت یک سرور مدل زبانی را چند برابر می‌کنند: continuous batching و مدیریت هوشمند حافظهٔ KV. هر دو از یک ایدهٔ ساده می‌آیند — هدر ندادن منابع.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>فهرستی عملی برای انتخاب مدل زبانی متناسب با قابلیت‌های شما</title><link>https://blog.felesh.ai/fa/tutorials/pick-an-llm-checklist/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/tutorials/pick-an-llm-checklist/</guid><description>انتخاب مدل، بیش از آنکه به جدول‌های رتبه‌بندی مربوط باشد، به شناخت دقیق نیازهایتان بستگی دارد؛ شش گام ساده که می‌توانید از همین امروز دنبال کنید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>استنتاج مدل زبانی واقعاً چگونه کار می‌کند: پیش‌پر کردن در برابر کدگشایی</title><link>https://blog.felesh.ai/fa/tutorials/prefill-vs-decode/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/tutorials/prefill-vs-decode/</guid><description>تولید متن شامل دو مرحله با رفتارهای کاملاً متفاوت است: یکی محدود به محاسبات و دیگری محدود به حافظه. درک این تفاوت توضیح می‌دهد چرا حافظه نهان وجود دارد و چرا کدگشایی کند است.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>وقتی هیچ مدلی به‌تنهایی کافی نیست: الگوی Generator-Verifier</title><link>https://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/</guid><description>گاهی یک مسئله دو نیازمندی حیاتی دارد که هیچ مدلی به‌تنهایی هر دو را برآورده نمی‌کند. راهکار، پذیرش مدلی ضعیف نیست، بلکه ترکیب دو مدل است.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>حالت‌های رایج شکست در سامانه‌های مدل زبانی — و چگونگی شناسایی و مهار آن‌ها</title><link>https://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/</guid><description>مدل‌های زبانی نه به‌صورت تصادفی، بلکه به شیوه‌هایی مشخص دچار شکست می‌شوند؛ با شناخت این حالت‌ها، می‌توانید پیش از مواجهه کاربر، آن‌ها را شناسایی و مهار کنید.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>رتبه‌بندی مدل‌ها را کنار بگذارید و آن‌ها را پروفایل کنید</title><link>https://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/</guid><description>یک عدد در جدول رتبه‌بندی مشخص نمی‌کند کدام مدل برای کار شما مناسب است؛ اما یک پروفایل چندبعدی از قابلیت‌ها، چرا.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>پرامپت‌نویسی از صفر: مانند نامه‌ای رسمی فکر کنید، نه پیامی در واتساپ</title><link>https://blog.felesh.ai/fa/learn/llms-to-agents/prompt-engineering-from-zero/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/learn/llms-to-agents/prompt-engineering-from-zero/</guid><description>مدل زبانی ذهن شما را نمی‌خواند؛ بنابراین هر آنچه را در گفت‌وگویی دوستانه بدیهی فرض می‌کنید، باید صراحتاً در پرامپت بنویسید — ۶ جزئی که یک پرامپت خوب را می‌سازند و ۵ اشتباهی که تازه‌کارها مرتکب می‌شوند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>دفاع در برابر Prompt Injection و Jailbreak و کاهش توهم</title><link>https://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/</guid><description>وقتی ورودی کاربر می‌تواند رفتار عامل را تغییر دهد، امنیت به مسئله‌ای در طراحی تبدیل می‌شود. رعایت چند اصل روشن، بیشتر این حملات را خنثی می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>اولین مدل خود را روی Colab رایگان ریزتنظیم کنید: QLoRA در حدود ۴۰ خط</title><link>https://blog.felesh.ai/fa/tutorials/qlora-on-free-colab/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/tutorials/qlora-on-free-colab/</guid><description>ریزتنظیم یک مدل نیازی به خوشه‌ای پرهزینه ندارد. با QLoRA می‌توان مدلی کوچک را روی یک GPU رایگان و تنها با چند ده خط کد تنظیم کرد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>قابل‌اعتماد کردن هوش مصنوعی در مواجهه با اسناد واقعی و آشفته</title><link>https://blog.felesh.ai/fa/insights/reliable-on-messy-documents/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/reliable-on-messy-documents/</guid><description>هر مدلی در مواجهه با یک سند تمیز خوب به نظر می‌رسد؛ اما تفاوت اصلی در دنباله آشفته آشکار می‌شود—جایی که اسناد واقعی جریان دارند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>یک مدل ۷۰ میلیاردی روی یک کارت گرافیک: راهنمای عملی کوانتش</title><link>https://blog.felesh.ai/fa/tutorials/run-a-70b-on-one-gpu/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/tutorials/run-a-70b-on-one-gpu/</guid><description>یک مدل ۷۰ میلیاردی با دقت کامل به حدود ۱۴۰ گیگابایت حافظه نیاز دارد. با کوانتش می‌توان این مدل را آن‌قدر فشرده کرد که روی یک کارت گرافیک جا شود و کیفیت آن تقریباً دست‌نخورده باقی بماند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>ابتدا ذخیره، سپس انتشار: قاعده‌ای ساده برای جلوگیری از دست رفتن کار</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/</guid><description>یکی از رایج‌ترین خطاهای پنهان در سامانه‌های رویدادمحور این است که خبر پیش از واقعیت منتشر شود. رعایت ترتیب درست (ابتدا ذخیره و سپس انتشار)، این خطا را به‌کلی از بین می‌برد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>عامل واحد یا چندعامل؟ هریک چه زمانی به کار می‌آیند</title><link>https://blog.felesh.ai/fa/learn/llms-to-agents/single-agent-vs-multi-agent/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/learn/llms-to-agents/single-agent-vs-multi-agent/</guid><description>گاهی یک عامل واحد بهترین پاسخ است و گاهی باید کار را میان چند عامل تقسیم کرد؛ تفاوت در پیچیدگی کار است، نه پیشرفته‌بودن معماری.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>کوچک‌تر، سریع‌تر، ارزان‌تر؛ چرا یک مدل بزرگ پاسخ‌گوی همه‌چیز نیست؟</title><link>https://blog.felesh.ai/fa/insights/smaller-faster-cheaper/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/smaller-faster-cheaper/</guid><description>سپردن هر کاری به قوی‌ترین مدل وسوسه‌انگیز است، اما بیشتر کارها فقط به قابلیتی متمرکز نیاز دارند و یک مدل کوچک‌تر و مناسب، همان کار را سریع‌تر و ارزان‌تر انجام می‌دهد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>لایهٔ قاعده: حصارهای قطعی پیرامون یک مدل احتمالاتی</title><link>https://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/</guid><description>مدل زبانی ساختاری احتمالاتی دارد و گاهی خطا می‌کند؛ راهِ افزایش قابلیت اطمینان آن، کامل‌تر کردن خود مدل نیست، بلکه ساخت لایه‌ای قطعی است که لغزش‌های مدل را مهار کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>همکار خودآموز: نقشه‌ای به سوی آینده</title><link>https://blog.felesh.ai/fa/insights/the-self-learning-colleague/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/the-self-learning-colleague/</guid><description>امروز یک عامل هر گفت‌وگو را از نو آغاز می‌کند و از کار دیروز خود چیزی نمی‌آموزد. آنچه در ادامه می‌آید یک چشم‌انداز است، نه قابلیتی امروزی: عاملی که از کار خود یاد می‌گیرد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>رهگیری یک درخواست در سامانه‌ای چندعاملی</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/</guid><description>بهترین راه برای درک معماری چندعاملی، دنبال کردن یک درخواست واقعی از ابتدا تا انتهاست. بیایید یک پیام مبهم را گام‌به‌گام تا رسیدن به کنشی ساختارمند دنبال کنیم.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>کوانتش دقیقاً چه می‌کند: افت دقت و فروپاشی فضای برداری</title><link>https://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/</guid><description>کوانتش یعنی ذخیره‌سازی وزن‌های مدل با بیت‌های کمتر. اما این کاهش دقت دقیقاً چه بر سر مدل می‌آورد و چرا مدل‌ها در برابر آن تا این حد مقاوم هستند؟</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>هزینه سرویس‌دهی مدل زبانی واقعاً کجا صرف می‌شود</title><link>https://blog.felesh.ai/fa/insights/where-llm-serving-costs-go/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/where-llm-serving-costs-go/</guid><description>با باز کردن صورت‌حساب سرویس‌دهی یک مدل، می‌بینید که بخش عمده هزینه در یک‌جا متمرکز شده است؛ درک این تمرکز، پاسخ به پرسش «بسازیم یا بخریم» را هم روشن می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>چرا LoRA کار می‌کند: داستان بعد ذاتی</title><link>https://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/</guid><description>اگر یک مدل بزرگ میلیاردها پارامتر دارد، چگونه می‌توان آن را تنها با آموزش چند ماتریس کوچک تنظیم کرد؟ پاسخ در یک ایده‌ی ظریف نهفته است: تغییر لازم، بعد ذاتی کوچکی دارد.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>چرا چت‌بات نمی‌سازیم: دو الگوی چندعاملی که کنار گذاشتیم</title><link>https://blog.felesh.ai/fa/insights/why-not-chatbots/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/insights/why-not-chatbots/</guid><description>بیشتر سامانه‌های هوش مصنوعی با یکی از دو روش ساخته می‌شوند و هر دو در مقیاس بزرگ شکست می‌خورند؛ این، روایت رویکرد جایگزینی است که برگزیده‌ایم.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>از کارگر تا متخصص: عاملی که کنترل یک حوزه را در دست دارد</title><link>https://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/</guid><description>تفاوت کارگر مجری با متخصص در این است که اولی کاری را انجام می‌دهد و کنار می‌رود، اما دومی کنترل یک حوزه را در دست دارد و وضعیت آن را در طول زمان حفظ می‌کند.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>کار با APIهای مدل زبانی: اولین فراخوانی، توکن‌ها و خروجی ساختارمند</title><link>https://blog.felesh.ai/fa/tutorials/working-with-llm-apis/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/tutorials/working-with-llm-apis/</guid><description>اولین فراخوانی یک API مدل زبانی ساده‌تر از آن است که به نظر می‌رسد. اگر چند مفهوم پایه را بشناسید — نقش‌ها، توکن‌ها، دما و خروجی ساختارمند — بقیه مسیر روشن می‌شود.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item><item><title>بدون مثال، با مثال یا Chain of Thought: تکنیک مناسب را انتخاب کنید</title><link>https://blog.felesh.ai/fa/tutorials/zero-shot-few-shot-cot/</link><guid isPermaLink="true">https://blog.felesh.ai/fa/tutorials/zero-shot-few-shot-cot/</guid><description>سه تکنیک پایه برای پرامپت‌نویسی وجود دارد که هرکدام جایگاه خود را دارند؛ دانستن زمان استفاده از هریک، از خود این تکنیک‌ها مهم‌تر است.</description><pubDate>Sun, 21 Jun 2026 00:00:00 GMT</pubDate></item></channel></rss>