فلش

فلشآخرین نوشته‌های فلشhttps://blog.felesh.ai/چرا پیش از اقدامِ هوش مصنوعی، یک انسان تأیید می‌کندhttps://blog.felesh.ai/fa/method/a-person-approves-before-the-ai-acts/https://blog.felesh.ai/fa/method/a-person-approves-before-the-ai-acts/خودمختاری هدف نیست؛ اقدامِ درخورِ اعتماد هدف است. عامل‌های ما پیشنهاد می‌دهند؛ یک انسان تأیید می‌کند یا یادداشتی برای بازنگری می‌فرستد؛ تنها آنگاه کار اعمال می‌شود. اختیار به دست می‌آید، نه اینکه بخشیده شود.Tue, 23 Jun 2026 00:00:00 GMTهر اقدام، دلیل خود را به همراه داردhttps://blog.felesh.ai/fa/method/every-action-carries-its-reason/https://blog.felesh.ai/fa/method/every-action-carries-its-reason/بیشتر سامانه‌ها ثبت می‌کنند که چه چیزی تغییر کرده است؛ اما آنچه هرگز نمی‌توان بعدها بازسازی کرد، «چرا»ی آن است — پس ما دلیل را به بخشی الزامی از هر تغییر تبدیل می‌کنیم که در همان لحظهٔ وقوع ثبت می‌شود.Tue, 23 Jun 2026 00:00:00 GMTیک رابطه، چند متخصصhttps://blog.felesh.ai/fa/method/one-relationship-many-specialists/https://blog.felesh.ai/fa/method/one-relationship-many-specialists/مشتری باید یک رابطهٔ واحد را حس کند، نه آنکه از رباتی به ربات دیگر دست‌به‌دست شود. در پسِ یک درگاه واحد، هر متخصص حوزه‌ای از آنِ خود دارد — یکپارچه در حالت پیش‌فرض، جداشدنی با یک تنظیم، و هرگز با بازسازی از پایه.Tue, 23 Jun 2026 00:00:00 GMTعامل‌هایی که فقط پاسخ نمی‌دهند، بلکه به‌شکلی ایمن عمل می‌کنندhttps://blog.felesh.ai/fa/insights/agents-that-act-safely/https://blog.felesh.ai/fa/insights/agents-that-act-safely/جهش واقعی زمانی رخ می‌دهد که سامانه نه‌تنها پاسخ دهد، بلکه کاری را در یک سامانه واقعی به انجام برساند. از آنجا که عمل کردن خطا را پرهزینه می‌کند، «ایمن بودن» باید ساختاری باشد.Sun, 21 Jun 2026 00:00:00 GMTهوشی که از ممیزی سربلند بیرون می‌آیدhttps://blog.felesh.ai/fa/insights/ai-that-survives-an-audit/https://blog.felesh.ai/fa/insights/ai-that-survives-an-audit/وقتی سامانه‌ای هوشمند تصمیم می‌گیرد، دیر یا زود کسی می‌پرسد «چرا؟»؛ سامانه‌ای که نتواند پاسخ دهد، در ممیزی شکست می‌خورد. باور داریم قابلیت ممیزی باید از همان روز اول در خود طراحی گنجانده شود، نه به عنوان یک افزونهٔ بعدی.Sun, 21 Jun 2026 00:00:00 GMTهوش مصنوعی متمرکز: چرا مدل‌های دقیق از مدل‌های بزرگ بهترندhttps://blog.felesh.ai/fa/insights/attentive-ai/https://blog.felesh.ai/fa/insights/attentive-ai/بزرگ‌ترین مدل همیشه بهترین پاسخ نیست؛ وقتی هر کار مرزهای مشخص خود را دارد، هوش متمرکز همواره از هوش همه‌کاره پیشی می‌گیرد.Sun, 21 Jun 2026 00:00:00 GMTاختیار یک مسیر است، نه یک کلیدhttps://blog.felesh.ai/fa/insights/authority-as-a-trajectory/https://blog.felesh.ai/fa/insights/authority-as-a-trajectory/در روز نخست، کلید همه چیز را به یک کارآموز نمی‌سپارید؛ عامل‌های هوش مصنوعی نیز باید اختیار خود را به‌مرور و در طول مسیر به دست آورند—درست مانند پیشرفت در یک حرفه.Sun, 21 Jun 2026 00:00:00 GMTسه درس از ذهن انسان برای معماری عاملhttps://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/https://blog.felesh.ai/fa/engineering/agent-architecture/brain-lessons-for-agent-architecture/چند مسئله دشوار در طراحی عامل، به نحوه کارکرد ذهن انسان شباهت دارند: تمرکز به‌جای شلوغی، تشخیص زمان پایان کار و جداسازی لایه‌های حافظه. این شباهت‌ها راهنمای خوبی برای طراحی هستند.Sun, 21 Jun 2026 00:00:00 GMTاصل کمترین دانش: عامل شما فقط باید آنچه را نیاز دارد بداندhttps://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/https://blog.felesh.ai/fa/engineering/prompting/cognitive-least-privilege/هر اطلاعاتی که به کار عامل نیاید، هم دقت را کاهش می‌دهد و هم سطح حمله را افزایش می‌دهد. با اقتباس از اصل کمترین دسترسی در امنیت، این قاعده را به دانش عامل تعمیم دهید.Sun, 21 Jun 2026 00:00:00 GMTCRM حالت خاصی از یک الگوی بزرگ‌تر استhttps://blog.felesh.ai/fa/insights/crm-is-a-special-case/https://blog.felesh.ai/fa/insights/crm-is-a-special-case/آنچه برای مدیریت رابطه با مشتری ساخته‌ایم، در نگاه اول یک CRM است؛ اما در زیر آن، الگوی عمومی‌تری نهفته که فراتر از رابطه می‌رود.Sun, 21 Jun 2026 00:00:00 GMTشما نرم‌افزار نمی‌خرید، بلکه زیست‌بومی می‌خرید که همگام با شما رشد می‌کند.https://blog.felesh.ai/fa/insights/ecosystem-that-compounds/https://blog.felesh.ai/fa/insights/ecosystem-that-compounds/یک ابزار، مسئله‌ای را یک‌بار حل می‌کند و همان‌جا باقی می‌ماند؛ اما آنچه ما می‌سازیم زیست‌بومی است که هوشمندی‌اش با هر افزوده انباشته می‌شود.Sun, 21 Jun 2026 00:00:00 GMTمدل‌ها را با داده‌های خودتان ارزیابی کنید، نه با جدول‌های عمومیhttps://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/https://blog.felesh.ai/fa/engineering/model-selection/evaluate-on-your-own-set/جدول‌های رتبه‌بندی عمومی کمتر از آنچه فکر می‌کنید درباره کار شما می‌گویند. راهکار مطمئن این است: یک مجموعه ارزیابی کوچک و معرف کار واقعی خود بسازید و گزینه‌ها را با همان ارزیابی کنید.Sun, 21 Jun 2026 00:00:00 GMTرویدادمحور از پایه: تیم‌هایی از عامل‌ها که پیامی را از دست نمی‌دهندhttps://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/https://blog.felesh.ai/fa/engineering/agent-architecture/event-driven-agent-teams/هنگام همکاری چند عامل با یکدیگر، بزرگ‌ترین خطر، از دست رفتن پیام‌ها و فروپاشی زنجیره است؛ معماری رویدادمحور با چند قاعده ساده این خطر را برطرف می‌کند.Sun, 21 Jun 2026 00:00:00 GMTFine-tuning، RAG یا پرامپت: کدام‌یک و هرکدام چه هزینه‌ای دارد؟https://blog.felesh.ai/fa/insights/fine-tune-rag-or-prompt/https://blog.felesh.ai/fa/insights/fine-tune-rag-or-prompt/سه راه برای متناسب‌سازی یک مدل با نیازهای شما وجود دارد و انتخاب اشتباه می‌تواند گران تمام شود؛ تفاوت در این است که هرکدام چه مشکلی را حل می‌کنند.Sun, 21 Jun 2026 00:00:00 GMTدام‌های رایج در ریزتنظیم و روش‌های اشکال‌زداییhttps://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/https://blog.felesh.ai/fa/engineering/fine-tuning/fine-tuning-pitfalls/ریشه بیشتر ریزتنظیم‌های ناموفق به چند الگوی تکراری برمی‌گردد؛ با شناخت این نشانه‌ها، اشکال‌زدایی به‌جای حدس و گمان به یک فهرست بررسی ساده تبدیل می‌شود.Sun, 21 Jun 2026 00:00:00 GMTاز مدل‌های زبانی تا عامل‌ها: مسیر کاملhttps://blog.felesh.ai/fa/learn/llms-to-agents/from-llms-to-agents/https://blog.felesh.ai/fa/learn/llms-to-agents/from-llms-to-agents/یک مدل زبانی در اصل فقط کلمه بعدی را پیش‌بینی می‌کند. در این مطلب می‌بینیم که چگونه با افزودن ابزار، حافظه و برنامه‌ریزی به همین پیش‌بینی ساده، به یک عامل می‌رسیم و چه زمانی واقعاً به آن نیاز داریم.Sun, 21 Jun 2026 00:00:00 GMTاز مهندسی پرامپت تا مهندسی زمینهhttps://blog.felesh.ai/fa/insights/from-prompt-to-context-engineering/https://blog.felesh.ai/fa/insights/from-prompt-to-context-engineering/زمانی هنر کار با مدل در نوشتن یک پرامپت خوب خلاصه می‌شد، اما به باور ما، مرکز ثقل در حال جابه‌جایی است: از ساختن یک دستور به طراحی کل زمینه‌ای که مدل در آن کار می‌کند.Sun, 21 Jun 2026 00:00:00 GMTاز یک پیام مبهم تا کنش درست و ساختارمندhttps://blog.felesh.ai/fa/insights/from-vague-message-to-action/https://blog.felesh.ai/fa/insights/from-vague-message-to-action/انسان‌ها مبهم، ناقص و آشفته صحبت می‌کنند. کار دشوار یک سامانه هوشمند، بیرون کشیدن کنش درست از دل این آشفتگی است — بی‌آنکه از کاربر بخواهد مانند یک فرم صحبت کند.Sun, 21 Jun 2026 00:00:00 GMTعامل‌ها چگونه به خاطر می‌سپارند: حافظه و بازنمایی دانشhttps://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-remember/https://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-remember/یک مدل زبانی به خودی خود حافظه‌ای ندارد و هر گفت‌وگو را از صفر آغاز می‌کند. آنچه به یک عامل حافظه می‌دهد، لایه‌هایی است که پیرامون مدل ساخته می‌شوند.Sun, 21 Jun 2026 00:00:00 GMTعامل هوش مصنوعی چگونه فکر می‌کند؟https://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-think/https://blog.felesh.ai/fa/learn/llms-to-agents/how-agents-think/یک عامل هدفی را دریافت می‌کند، می‌اندیشد، اقدامی انجام می‌دهد و نتیجه را مشاهده می‌کند — و این چرخه را تا رسیدن به هدف تکرار می‌کند. مدلی ساده برای درک استدلال و تصمیم‌گیری عامل.Sun, 21 Jun 2026 00:00:00 GMTهوش لایه‌ای: وقتی هوش گفت‌وگو با هوش پس‌زمینه پیوند می‌خوردhttps://blog.felesh.ai/fa/insights/layered-intelligence/https://blog.felesh.ai/fa/insights/layered-intelligence/یک عامل خوب باید هم‌زمان دو کار را به‌خوبی انجام دهد: گفت‌وگوی روان با انسان و کار شناختی عمیق در پشت صحنه. این دو، دو لایه متفاوت از هوش هستند — و بر این باوریم که جداسازی آن‌ها کلید کار است.Sun, 21 Jun 2026 00:00:00 GMTخانواده LoRA: QLoRA، DoRA و LoRA+؛ کدام‌یک و چه زمانی؟https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/https://blog.felesh.ai/fa/engineering/fine-tuning/lora-family-variants/از زمان معرفی LoRA، چندین نسخه بهبودیافته ارائه شده‌اند که هرکدام مشکل خاصی را هدف قرار می‌دهند. شناخت این نسخه‌ها کمک می‌کند برای هر کار، گزینه مناسب را انتخاب کنید.Sun, 21 Jun 2026 00:00:00 GMTابرپارامترهای LoRA بدون ابهام: رتبه، آلفا و آنچه باید تنظیم کنیدhttps://blog.felesh.ai/fa/tutorials/lora-hyperparameters-demystified/https://blog.felesh.ai/fa/tutorials/lora-hyperparameters-demystified/ریزتنظیم با LoRA چند مقدار کلیدی دارد که با درک معنای آن‌ها، انتخابشان آسان می‌شود. این راهنما رتبه، آلفا، نرخ یادگیری و سایر موارد را شفاف می‌کند.Sun, 21 Jun 2026 00:00:00 GMTMLP حافظه مدل است: دانش در کجا جای دارد؟https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/https://blog.felesh.ai/fa/engineering/llm-infra/mlp-is-the-models-memory/در یک مدل زبانی، لایه‌های Attention اطلاعات را مسیریابی می‌کنند، اما دانش واقعی در جای دیگری ذخیره می‌شود؛ در لایه‌های MLP که بخش بزرگی از مدل را تشکیل می‌دهند.Sun, 21 Jun 2026 00:00:00 GMTچرا مدل‌های خود را روی زیرساخت داخلی اجرا می‌کنیمhttps://blog.felesh.ai/fa/insights/our-own-models/https://blog.felesh.ai/fa/insights/our-own-models/اجرای مدل روی زیرساخت خود، تنها یک انتخاب فنی نیست؛ بلکه باوری به استقلال، ماندن داده‌ها در خانه و پایداری است. این، تصمیم ما و دلیل آن است.Sun, 21 Jun 2026 00:00:00 GMTکارمندان هوش مصنوعی خود را استخدام کنید، آموزش دهید و یاد بگیرید به آن‌ها اعتماد کنیدhttps://blog.felesh.ai/fa/insights/owner-ai-employees/https://blog.felesh.ai/fa/insights/owner-ai-employees/نرم‌افزار را نصب می‌کنید اما کارمند را استخدام؛ همین تفاوت کوچک، همه‌چیز را در ساخت یک سازمان دیجیتال دگرگون می‌کند.Sun, 21 Jun 2026 00:00:00 GMTPagedAttention و continuous batching: چگونه یک سرور به کاربران بیشتری پاسخ می‌دهدhttps://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/https://blog.felesh.ai/fa/engineering/llm-infra/paged-attention-continuous-batching/دو ترفند زیرساختی، ظرفیت یک سرور مدل زبانی را چند برابر می‌کنند: continuous batching و مدیریت هوشمند حافظهٔ KV. هر دو از یک ایدهٔ ساده می‌آیند — هدر ندادن منابع.Sun, 21 Jun 2026 00:00:00 GMTفهرستی عملی برای انتخاب مدل زبانی متناسب با قابلیت‌های شماhttps://blog.felesh.ai/fa/tutorials/pick-an-llm-checklist/https://blog.felesh.ai/fa/tutorials/pick-an-llm-checklist/انتخاب مدل، بیش از آنکه به جدول‌های رتبه‌بندی مربوط باشد، به شناخت دقیق نیازهایتان بستگی دارد؛ شش گام ساده که می‌توانید از همین امروز دنبال کنید.Sun, 21 Jun 2026 00:00:00 GMTاستنتاج مدل زبانی واقعاً چگونه کار می‌کند: پیش‌پر کردن در برابر کدگشاییhttps://blog.felesh.ai/fa/tutorials/prefill-vs-decode/https://blog.felesh.ai/fa/tutorials/prefill-vs-decode/تولید متن شامل دو مرحله با رفتارهای کاملاً متفاوت است: یکی محدود به محاسبات و دیگری محدود به حافظه. درک این تفاوت توضیح می‌دهد چرا حافظه نهان وجود دارد و چرا کدگشایی کند است.Sun, 21 Jun 2026 00:00:00 GMTوقتی هیچ مدلی به‌تنهایی کافی نیست: الگوی Generator-Verifierhttps://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/https://blog.felesh.ai/fa/engineering/model-selection/primary-and-verifier/گاهی یک مسئله دو نیازمندی حیاتی دارد که هیچ مدلی به‌تنهایی هر دو را برآورده نمی‌کند. راهکار، پذیرش مدلی ضعیف نیست، بلکه ترکیب دو مدل است.Sun, 21 Jun 2026 00:00:00 GMTحالت‌های رایج شکست در سامانه‌های مدل زبانی — و چگونگی شناسایی و مهار آن‌هاhttps://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/https://blog.felesh.ai/fa/engineering/model-selection/production-failure-modes/مدل‌های زبانی نه به‌صورت تصادفی، بلکه به شیوه‌هایی مشخص دچار شکست می‌شوند؛ با شناخت این حالت‌ها، می‌توانید پیش از مواجهه کاربر، آن‌ها را شناسایی و مهار کنید.Sun, 21 Jun 2026 00:00:00 GMTرتبه‌بندی مدل‌ها را کنار بگذارید و آن‌ها را پروفایل کنیدhttps://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/https://blog.felesh.ai/fa/engineering/model-selection/profile-dont-rank-llms/یک عدد در جدول رتبه‌بندی مشخص نمی‌کند کدام مدل برای کار شما مناسب است؛ اما یک پروفایل چندبعدی از قابلیت‌ها، چرا.Sun, 21 Jun 2026 00:00:00 GMTپرامپت‌نویسی از صفر: مانند نامه‌ای رسمی فکر کنید، نه پیامی در واتساپhttps://blog.felesh.ai/fa/learn/llms-to-agents/prompt-engineering-from-zero/https://blog.felesh.ai/fa/learn/llms-to-agents/prompt-engineering-from-zero/مدل زبانی ذهن شما را نمی‌خواند؛ بنابراین هر آنچه را در گفت‌وگویی دوستانه بدیهی فرض می‌کنید، باید صراحتاً در پرامپت بنویسید — ۶ جزئی که یک پرامپت خوب را می‌سازند و ۵ اشتباهی که تازه‌کارها مرتکب می‌شوند.Sun, 21 Jun 2026 00:00:00 GMTدفاع در برابر Prompt Injection و Jailbreak و کاهش توهمhttps://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/https://blog.felesh.ai/fa/engineering/prompting/prompt-injection-and-defense/وقتی ورودی کاربر می‌تواند رفتار عامل را تغییر دهد، امنیت به مسئله‌ای در طراحی تبدیل می‌شود. رعایت چند اصل روشن، بیشتر این حملات را خنثی می‌کند.Sun, 21 Jun 2026 00:00:00 GMTاولین مدل خود را روی Colab رایگان ریزتنظیم کنید: QLoRA در حدود ۴۰ خطhttps://blog.felesh.ai/fa/tutorials/qlora-on-free-colab/https://blog.felesh.ai/fa/tutorials/qlora-on-free-colab/ریزتنظیم یک مدل نیازی به خوشه‌ای پرهزینه ندارد. با QLoRA می‌توان مدلی کوچک را روی یک GPU رایگان و تنها با چند ده خط کد تنظیم کرد.Sun, 21 Jun 2026 00:00:00 GMTقابل‌اعتماد کردن هوش مصنوعی در مواجهه با اسناد واقعی و آشفتهhttps://blog.felesh.ai/fa/insights/reliable-on-messy-documents/https://blog.felesh.ai/fa/insights/reliable-on-messy-documents/هر مدلی در مواجهه با یک سند تمیز خوب به نظر می‌رسد؛ اما تفاوت اصلی در دنباله آشفته آشکار می‌شود—جایی که اسناد واقعی جریان دارند.Sun, 21 Jun 2026 00:00:00 GMTیک مدل ۷۰ میلیاردی روی یک کارت گرافیک: راهنمای عملی کوانتشhttps://blog.felesh.ai/fa/tutorials/run-a-70b-on-one-gpu/https://blog.felesh.ai/fa/tutorials/run-a-70b-on-one-gpu/یک مدل ۷۰ میلیاردی با دقت کامل به حدود ۱۴۰ گیگابایت حافظه نیاز دارد. با کوانتش می‌توان این مدل را آن‌قدر فشرده کرد که روی یک کارت گرافیک جا شود و کیفیت آن تقریباً دست‌نخورده باقی بماند.Sun, 21 Jun 2026 00:00:00 GMTابتدا ذخیره، سپس انتشار: قاعده‌ای ساده برای جلوگیری از دست رفتن کارhttps://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/https://blog.felesh.ai/fa/engineering/llm-infra/save-before-publish/یکی از رایج‌ترین خطاهای پنهان در سامانه‌های رویدادمحور این است که خبر پیش از واقعیت منتشر شود. رعایت ترتیب درست (ابتدا ذخیره و سپس انتشار)، این خطا را به‌کلی از بین می‌برد.Sun, 21 Jun 2026 00:00:00 GMTعامل واحد یا چندعامل؟ هریک چه زمانی به کار می‌آیندhttps://blog.felesh.ai/fa/learn/llms-to-agents/single-agent-vs-multi-agent/https://blog.felesh.ai/fa/learn/llms-to-agents/single-agent-vs-multi-agent/گاهی یک عامل واحد بهترین پاسخ است و گاهی باید کار را میان چند عامل تقسیم کرد؛ تفاوت در پیچیدگی کار است، نه پیشرفته‌بودن معماری.Sun, 21 Jun 2026 00:00:00 GMTکوچک‌تر، سریع‌تر، ارزان‌تر؛ چرا یک مدل بزرگ پاسخ‌گوی همه‌چیز نیست؟https://blog.felesh.ai/fa/insights/smaller-faster-cheaper/https://blog.felesh.ai/fa/insights/smaller-faster-cheaper/سپردن هر کاری به قوی‌ترین مدل وسوسه‌انگیز است، اما بیشتر کارها فقط به قابلیتی متمرکز نیاز دارند و یک مدل کوچک‌تر و مناسب، همان کار را سریع‌تر و ارزان‌تر انجام می‌دهد.Sun, 21 Jun 2026 00:00:00 GMTلایهٔ قاعده: حصارهای قطعی پیرامون یک مدل احتمالاتیhttps://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/https://blog.felesh.ai/fa/engineering/model-selection/the-rule-layer/مدل زبانی ساختاری احتمالاتی دارد و گاهی خطا می‌کند؛ راهِ افزایش قابلیت اطمینان آن، کامل‌تر کردن خود مدل نیست، بلکه ساخت لایه‌ای قطعی است که لغزش‌های مدل را مهار کند.Sun, 21 Jun 2026 00:00:00 GMTهمکار خودآموز: نقشه‌ای به سوی آیندهhttps://blog.felesh.ai/fa/insights/the-self-learning-colleague/https://blog.felesh.ai/fa/insights/the-self-learning-colleague/امروز یک عامل هر گفت‌وگو را از نو آغاز می‌کند و از کار دیروز خود چیزی نمی‌آموزد. آنچه در ادامه می‌آید یک چشم‌انداز است، نه قابلیتی امروزی: عاملی که از کار خود یاد می‌گیرد.Sun, 21 Jun 2026 00:00:00 GMTرهگیری یک درخواست در سامانه‌ای چندعاملیhttps://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/https://blog.felesh.ai/fa/engineering/agent-architecture/trace-a-request-through-agents/بهترین راه برای درک معماری چندعاملی، دنبال کردن یک درخواست واقعی از ابتدا تا انتهاست. بیایید یک پیام مبهم را گام‌به‌گام تا رسیدن به کنشی ساختارمند دنبال کنیم.Sun, 21 Jun 2026 00:00:00 GMTکوانتش دقیقاً چه می‌کند: افت دقت و فروپاشی فضای برداریhttps://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/https://blog.felesh.ai/fa/engineering/llm-infra/what-quantization-actually-does/کوانتش یعنی ذخیره‌سازی وزن‌های مدل با بیت‌های کمتر. اما این کاهش دقت دقیقاً چه بر سر مدل می‌آورد و چرا مدل‌ها در برابر آن تا این حد مقاوم هستند؟Sun, 21 Jun 2026 00:00:00 GMTهزینه سرویس‌دهی مدل زبانی واقعاً کجا صرف می‌شودhttps://blog.felesh.ai/fa/insights/where-llm-serving-costs-go/https://blog.felesh.ai/fa/insights/where-llm-serving-costs-go/با باز کردن صورت‌حساب سرویس‌دهی یک مدل، می‌بینید که بخش عمده هزینه در یک‌جا متمرکز شده است؛ درک این تمرکز، پاسخ به پرسش «بسازیم یا بخریم» را هم روشن می‌کند.Sun, 21 Jun 2026 00:00:00 GMTچرا LoRA کار می‌کند: داستان بعد ذاتیhttps://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/https://blog.felesh.ai/fa/engineering/fine-tuning/why-lora-works/اگر یک مدل بزرگ میلیاردها پارامتر دارد، چگونه می‌توان آن را تنها با آموزش چند ماتریس کوچک تنظیم کرد؟ پاسخ در یک ایده‌ی ظریف نهفته است: تغییر لازم، بعد ذاتی کوچکی دارد.Sun, 21 Jun 2026 00:00:00 GMTچرا چت‌بات نمی‌سازیم: دو الگوی چندعاملی که کنار گذاشتیمhttps://blog.felesh.ai/fa/insights/why-not-chatbots/https://blog.felesh.ai/fa/insights/why-not-chatbots/بیشتر سامانه‌های هوش مصنوعی با یکی از دو روش ساخته می‌شوند و هر دو در مقیاس بزرگ شکست می‌خورند؛ این، روایت رویکرد جایگزینی است که برگزیده‌ایم.Sun, 21 Jun 2026 00:00:00 GMTاز کارگر تا متخصص: عاملی که کنترل یک حوزه را در دست داردhttps://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/https://blog.felesh.ai/fa/engineering/agent-architecture/worker-to-specialist/تفاوت کارگر مجری با متخصص در این است که اولی کاری را انجام می‌دهد و کنار می‌رود، اما دومی کنترل یک حوزه را در دست دارد و وضعیت آن را در طول زمان حفظ می‌کند.Sun, 21 Jun 2026 00:00:00 GMTکار با APIهای مدل زبانی: اولین فراخوانی، توکن‌ها و خروجی ساختارمندhttps://blog.felesh.ai/fa/tutorials/working-with-llm-apis/https://blog.felesh.ai/fa/tutorials/working-with-llm-apis/اولین فراخوانی یک API مدل زبانی ساده‌تر از آن است که به نظر می‌رسد. اگر چند مفهوم پایه را بشناسید — نقش‌ها، توکن‌ها، دما و خروجی ساختارمند — بقیه مسیر روشن می‌شود.Sun, 21 Jun 2026 00:00:00 GMTبدون مثال، با مثال یا Chain of Thought: تکنیک مناسب را انتخاب کنیدhttps://blog.felesh.ai/fa/tutorials/zero-shot-few-shot-cot/https://blog.felesh.ai/fa/tutorials/zero-shot-few-shot-cot/سه تکنیک پایه برای پرامپت‌نویسی وجود دارد که هرکدام جایگاه خود را دارند؛ دانستن زمان استفاده از هریک، از خود این تکنیک‌ها مهم‌تر است.Sun, 21 Jun 2026 00:00:00 GMT