خانواده LoRA: QLoRA، DoRA و LoRA+؛ کدام‌یک و چه زمانی؟

از زمان معرفی LoRA، چندین نسخه بهبودیافته ارائه شده‌اند که هرکدام مشکل خاصی را هدف قرار می‌دهند. شناخت این نسخه‌ها کمک می‌کند برای هر کار، گزینه مناسب را انتخاب کنید.

LoRA روش پایه و اصلی است، اما تنها عضو این خانواده به شمار نمی‌رود. از زمان معرفی این روش، چند نسخه‌ی بهبودیافته ارائه شده‌اند که هرکدام محدودیت خاصی را هدف قرار می‌دهند: یکی برای کاهش مصرف حافظه، دیگری برای ارتقای کیفیت و سومی برای افزایش سرعت. شناخت این گونه‌ها به شما کمک می‌کند تا برای هر مسئله، گزینه‌ی مناسب را انتخاب کنید.

QLoRA: وقتی حافظه محدود است

QLoRA با هدف کاهش مصرف حافظه طراحی شده است. سازوکار این روش بدین صورت است که بدنه اصلی مدل را در دقت ۴بیتی (با قالبی به نام NF4) فشرده نگه می‌دارد و تنها در زمان محاسبه، آن را به دقت بالاتر بازمی‌گرداند. نتیجه بسیار چشمگیر است: یک مدل ۷میلیاردی به جای نیاز به حدود ۱۶ گیگابایت حافظه، تنها با حدود ۶ گیگابایت اجرا می‌شود. نکته‌ی مهم اینکه کیفیت مدل تقریباً بدون تغییر باقی می‌ماند و بسیار نزدیک به عملکرد LoRAی معمولی است. اگر کارت گرافیک محدودی در اختیار دارید یا می‌خواهید مدل بزرگ‌تری را روی سخت‌افزار محدود تنظیم کنید، QLoRA گزینه‌ی پیش‌فرض خواهد بود.

DoRA: وقتی کیفیت در اولویت است

DoRA چالش دیگری را هدف قرار می‌دهد: جبران شکاف کیفی میان LoRA و تنظیم دقیق کامل. ایده‌ی این روش، تجزیه‌ی هر وزن به دو مؤلفه‌ی اندازه و جهت است. DoRA این دو را به طور مستقل مدیریت می‌کند؛ بدین ترتیب که LoRA را روی جهت اعمال کرده و پارامتر اندازه را به شکل جداگانه آموزش می‌دهد. این تفکیک ساختاری، به‌ویژه در کارهای پیچیده‌ای مانند استدلال و کدنویسی، کیفیت را چند درصد بهبود می‌بخشد، در حالی که کمتر از ۵ درصد روی تعداد پارامترها سربار دارد. اگر حفظ کیفیت برایتان حیاتی است و LoRAی معمولی عملکرد مطلوبی نشان نمی‌دهد، DoRA ارزش امتحان کردن را دارد.

LoRA+: وقتی سرعت مهم است

LoRA+ بهبود جزئی اما مؤثری به همراه می‌آورد. همان‌طور که می‌دانید، در روش LoRA، ماتریس B با صفر مقداردهی اولیه می‌شود و باید مسیر طولانی‌تری را طی کند تا به مقدار بهینه برسد. LoRA+ این چالش را با اختصاص نرخ یادگیری بزرگ‌تر به ماتریس B نسبت به ماتریس A جبران می‌کند. نتیجه، دستیابی به همگرایی سریع‌تر است؛ به طوری که مدل حدود ۱.۵ تا ۲ برابر سریع‌تر به کیفیت مطلوب می‌رسد. اگر بودجه‌ی آموزشی محدودی دارید یا به تکرار سریع نیاز دارید، LoRA+ با ایجاد تغییری کوچک در تنظیمات، زمان زیادی را برای شما ذخیره می‌کند.

یک درخت تصمیم ساده

انتخاب میان این روش‌ها را می‌توان در قالب چند پرسش ساده خلاصه کرد:

آیا محدودیت اصلی حافظه است؟ → QLoRA.
آیا کیفیت نقشی حیاتی دارد و عملکرد LoRAی معمولی کافی نیست؟ → DoRA.
آیا سرعت آموزش اولویت اول شماست؟ → LoRA+.
اگر هیچ‌کدام به‌طور خاص اولویت ندارند؟ → همان LoRAی استاندارد که هنوز برای بیشتر کارها به‌خوبی پاسخگو است.

جمع‌بندی

این نسخه‌های مختلف رقیب یکدیگر نیستند، بلکه ابزارهایی برای پاسخگویی به محدودیت‌های متفاوت به شمار می‌روند. مزیت بزرگ این روش‌ها در این است که با هم ناسازگار نیستند و برای مثال، می‌توان ایده‌های آن‌ها را با یکدیگر ترکیب کرد. با این حال، پیش از پیچیده کردن فرآیند، بهتر است کار را از مسیر ساده آغاز کنید: ابتدا LoRAی استاندارد را بسنجید و تنها زمانی به سراغ گزینه‌های دیگر بروید که با محدودیت خاصی روبه‌رو شده باشید و بخواهید دقیقاً همان چالش را برطرف کنید.