શું તમે ક્યારેય કોઈ મોટા ભાષા મોડેલને (large language model) આડેધડ માહિતી આપવાનું બંધ કરવા અને તમારા ચોક્કસ, ખૂબ જ ઓછો પગાર ધરાવતા મદદનીશની જેમ વર્તવા માટે મનાવવાનો પ્રયાસ કર્યો છે? 2025માં ફાઇન-ટ્યુનિંગ એ કંઈક આના જેવું લાગે છે: વાલીપણું, પરંતુ YAML સાથે. સારા સમાચાર એ છે કે LLaMA-Factory સમગ્ર પ્રક્રિયાને આશ્ચર્યજનક રીતે... ખરાબ નથી બનાવતું. વધુ સારા સમાચાર એ છે કે મેં શ્રેષ્ઠ LLaMA-Factory ટ્યુટોરિયલ્સ શોધવા માટે એડેપ્ટર અને ટોકનાઇઝર પર એક અઠવાડિયું વિતાવ્યું છે, જેથી તમારે તે કરવાની જરૂર ન પડે.
અહીં શ્રેષ્ઠ સંસાધનો માટે કોઈ BS વગરની, Joanna-શૈલીની માર્ગદર્શિકા છે, દરેકનો ઉપયોગ ક્યારે કરવો અને ત્રણ સૌથી સામાન્ય ભૂલોથી કેવી રીતે બચવું (સ્પોઇલર: VRAM એ માત્ર એક વિચાર નથી, તે એક બજેટ છે).
તમે અહીં શા માટે છો (અને તમે ખરેખર શું ઇચ્છો છો)
- તમે વિતરિત તાલીમ પર નિબંધ લખ્યા વિના Llama 2 અથવા Llama 3 મોડેલોને ફાઇન-ટ્યુન કરવા માંગો છો.
- તમે સાંભળ્યું છે કે LLaMA-Factory પાસે WebUI અને CLI અને Google Colab મેજિક પણ છે.
- તમારે એવા ટ્યુટોરિયલ્સ જોઈએ છે જે એવું ન ધારે કે તમે ક્લાઉડ GPU ફાર્મની અંદર રહો છો.
આ શ્રેષ્ઠ/ટોચની યાદી છે જેમાં થોડીક વ્યવહારિક સલાહ પણ છે. હું ટ્યુટોરિયલ્સને સ્પષ્ટતા, આધુનિકતા (Llama 3, QLoRA, 4-bit, WebUI વર્કફ્લો), અને શું તે તમને શૂન્યથી "મારું મોડેલ ખરેખર ચાલે છે" સુધી લઈ જાય છે તેના આધારે ક્રમ આપી રહ્યો છું. ચાલો શરૂ કરીએ.
શોર્ટલિસ્ટ: અત્યારે શ્રેષ્ઠ LLaMA-Factory ટ્યુટોરિયલ્સ
- વિઝ્યુઅલ લર્નર્સ (અને અધીરા લોકો) માટે યુટ્યુબ ક્રેશ કોર્સ
- YouTube પર “Any one can Fine Tune LLMs using LLaMA Factory: End-to-End”. જો તમારું ધ્યાન TikTok જેવું હોય અને તમારું GPU બજેટ કોફી જેટલું હોય, તો આ ટ્યુટોરિયલ તમારા માટે છે. તે સેટઅપ, ડેટા પ્રિપેરેશન અને LLaMA-Factory ફ્લોમાં એન્ડ-ટુ-એન્ડ રન દ્વારા લઈ જાય છે. તે શરૂઆત કરનારાઓ માટે સરળ છે, WebUI બતાવે છે અને કયા બટનો ક્લિક કરવા અને શા માટે તે પણ સમજાવે છે. પ્રક્રિયાને લાઈવ જોવા અને કમાન્ડની નકલ કરવા માટે દર 12 સેકન્ડે થોભાવવા માટે શ્રેષ્ઠ.
શ્રેષ્ઠ છે: વિઝ્યુઅલ લર્નર્સ, વીકેન્ડ પ્રોજેક્ટ્સ, “મને કામ કરતી વસ્તુ બતાવો.”
ધ્યાન રાખો: ચોક્કસ વર્ઝન અને ફ્લેગ્સ બદલાઈ શકે છે—જો તમને કોઈ ભૂલ આવે તો રેપો ડિફોલ્ટ્સને ફરીથી તપાસો.
- પહેલીવાર ફાઇન-ટ્યુનર્સ માટે સ્ટેપ-બાય-સ્ટેપ WebUI માર્ગદર્શિકા
- DataCamp તરફથી “LLaMA-Factory WebUI Beginner’s Guide: Fine-Tuning LLMs”. આ એક સ્વચ્છ, લેખિત વોકથ્રુ છે: ઇન્સ્ટોલ કરો, Llama 3 8B લોડ કરો, LoRA અથવા QLoRA પસંદ કરો, ડેટાસેટ ફીડ કરો, તાલીમ આપો, મૂલ્યાંકન કરો, નિકાસ કરો. તમને સ્ક્રીનશોટ, રૂપરેખાંકનો અને સંદર્ભ મળે છે. જો તમને ક્યારેય CLI દ્વારા ખખડાવવામાં આવ્યા હોય, તો આ અવાજ-રદ કરનારા હેડફોન્સ જેવું લાગે છે.
શ્રેષ્ઠ છે: શરૂઆત કરનારાઓ, જેમને માળખું જોઈએ છે, ડોકર-કમ્પોઝ કોન્ફેટીથી એલર્જી હોય તેવા કોઈપણ.
ધ્યાન રાખો: ક્લાઉડ સેટઅપ અને VRAM જરૂરિયાતો બધા માટે એકસરખી નથી—જો તમે સમાન હાર્ડવેર પર ન હોવ તો ફેરફારોની અપેક્ષા રાખો.
- Colab-ફ્રેન્ડલી, ફાસ્ટ-સ્ટાર્ટ રેસીપી
- મીડિયમ પર “Fine-Tuning Made Easy: Your Guide to LLaMA Factory”. તે એક વ્યવહારુ Colab-આધારિત ટ્યુટોરિયલ છે જે Llama 3 સાથે LoRA નો ઉપયોગ કરે છે. જો તમે લોકલ ઇન્સ્ટોલ કરવાનું ટાળવા માંગતા હો અને મફત/સસ્તા GPU સમય સાથે ટેસ્ટ-ડ્રાઇવ કરવા માંગતા હોવ તો સરસ. નોટબુકની નકલ કરો, ડેટાસેટ પાથ બદલો, અને બૂમ: તમારું પ્રથમ મોડેલ બાળક જન્મે છે. તે સારી રીતે અભિપ્રાયવાળું છે: LoRA, Colab અને ન્યૂનતમ ધમાલ.
શ્રેષ્ઠ છે: Colab વપરાશકર્તાઓ, બજેટ GPU શોધકો, “મારે એક કલાકમાં કંઈક કામ કરતું જોઈએ છે.”
ધ્યાન રાખો: મફત Colab તમને મર્યાદિત કરે છે. તાલીમ સમય સમાપ્ત થઈ શકે છે અથવા થ્રોટલ થઈ શકે છે. વહેલા અને વારંવાર ચેકપોઇન્ટ્સ સાચવો.
ઠીક છે, પરંતુ LLaMA-Factory મારા માટે ખરેખર શું કરી રહ્યું છે?
LLaMA-Factory ને ફાઇન-ટ્યુનિંગના IKEA તરીકે વિચારો: તે તમને બધા ભાગો આપે છે, તેમાંના મોટાભાગનાને લેબલ કરે છે અને તમને એક નાની એલન કી (WebUI) આપે છે જેથી તમે તમારા પોતાના નમ્રતાથી-રૂપરેખાંકિત LLM ને એસેમ્બલ કરી શકો. તે ડરામણી બીટ્સ—QLoRA ક્વોન્ટાઇઝેશન, એડેપ્ટર્સ, ટોકનાઇઝર્સ—ને પ્રીસેટ્સ અને સમજદાર ડિફોલ્ટ્સ પાછળ અમૂર્ત કરે છે. તમારે હજી પણ ડેટાસેટ અને સારા વર્તનવાળા GPU ની જરૂર પડશે, પરંતુ તમારે કાચા ઝાડમાંથી પલંગ બનાવવાની જરૂર નથી.
તમારા ઉપયોગના કેસ માટે યોગ્ય ટ્યુટોરિયલ કેવી રીતે પસંદ કરવું
- મેં મારા જીવનમાં ક્યારેય કંઈપણ ફાઇન-ટ્યુન કર્યું નથી: DataCamp WebUI માર્ગદર્શિકાથી શરૂઆત કરો, પછી YouTube વોકથ્રુ જુઓ. એક તમને બતાવે છે કે શું ક્લિક કરવું, બીજું તમને બતાવે છે કે જ્યારે તે ખરેખર કામ કરે છે ત્યારે તે કેવું લાગે છે (અને તે ક્યાં આસાનીથી નિષ્ફળ જાય છે).
- મારે બજેટ પર ઝડપી POC ની જરૂર છે: Colab ટ્યુટોરિયલનો ઉપયોગ કરો. તમારા ડેટાસેટને નાનો અને તમારી અપેક્ષાઓને નાની રાખો. પછી એડેપ્ટર નિકાસ કરો અને તમારી લોકલ મશીન અથવા સસ્તા ક્લાઉડ પર પરીક્ષણ કરો.
- હું આ વર્કસ્ટેશન અથવા ક્લાઉડ GPU પર “યોગ્ય રીતે” કરવા માંગુ છું: ખ્યાલો શીખવા માટે WebUI ટ્યુટોરિયલથી શરૂઆત કરો, પછી CLI પર જાઓ જેથી તમે પ્રયોગોને સ્ક્રિપ્ટ કરી શકો અને પ્રોની જેમ રન્સને ટ્રેક કરી શકો. જો તમારી VRAM લચીલી ન હોય તો 4-બીટ કાર્યક્ષમતા માટે QLoRA ને મિક્સ કરો.
પાંચ-મિનિટનો ક્રેશ કોર્સ: LLaMA-Factory આવશ્યકતાઓ
- WebUI વિ. CLI: WebUI શીખવા માટે ઝડપી છે, પ્રથમ રન્સ અને સેનિટી ચેક્સ માટે શ્રેષ્ઠ છે. CLI એ તમે તમારી ટ્રેકપેડને રડાવ્યા વિના પ્રયોગોને બેચ, ઓટોમેટ અને વર્ઝન કેવી રીતે કરો છો.
- LoRA વિ. QLoRA: LoRA હળવા એડેપ્ટર સ્તરો ઉમેરે છે—ઝડપી અને કાર્યક્ષમ. QLoRA ક્વોન્ટાઇઝેશન ઉમેરે છે જેથી તમે નાના GPUs પર મોટા મોડેલોને ફાઇન-ટ્યુન કરી શકો. તે તાલીમનું IKEA પેક-ફ્લેટ વર્ઝન છે.
- ડેટાસેટ્સ: તેને ચુસ્ત અને સ્વચ્છ રાખો. જો તમારું ડેટાસેટ તમારા કૉલેજ નિબંધ ડ્રાફ્ટ્સ જેવું લાગે છે, તો તમારું મોડેલ પણ તેવું જ હશે.
- ચેકપોઇન્ટ્સ અને મૂલ્યાંકન: વારંવાર સાચવો. વહેલું મૂલ્યાંકન કરો. હા, તમારું મોડેલ “શીખી રહ્યું છે”, પરંતુ શું તે તમને લાગે છે તે શીખી રહ્યું છે? માર્કર્સવાળા ટોડલરની જેમ, દેખરેખ મહત્વપૂર્ણ છે.
સ્ટર્ન-શૈલીની મીની-સેટઅપ માર્ગદર્શિકા (કોઈપણ ટ્યુટોરિયલ સાથે ઉપયોગ કરવા માટે)
- તમારું મોડેલ પસંદ કરો: Llama 3 8B એ મૈત્રીપૂર્ણ શરૂઆત છે. નાનું જોઈએ છે? તાલીમ પીડા ઘટાડવા માટે સૂચના-ટ્યુન કરેલ 7–8B વેરિઅન્ટ અજમાવો.
- તમારું બજેટ નક્કી કરો: 16GB VRAM થી ઓછું? QLoRA પર જાઓ. આસપાસ 24GB? LoRA આરામદાયક છે. 48GB+? તમે ફેન્સી છો; જો તમે જાણતા હોવ કે તમે શું કરી રહ્યા છો, તો મોટા સંદર્ભ વિંડોઝ અથવા સંપૂર્ણ ફાઇનટ્યુન્સનો વિચાર કરો.
- ડેટા તૈયાર કરો: સ્પષ્ટ પ્રોમ્પ્ટ/જવાબ ક્ષેત્રો સાથે JSON અથવા CSV નો ઉપયોગ કરો. સ્કેલિંગ કરતા પહેલાં 2–10K ઉચ્ચ-ગુણવત્તાવાળા ઉદાહરણોથી પ્રારંભ કરો.
- તમારો પાથ પસંદ કરો: WebUI (સૌથી સરળ) અથવા CLI (વધુ સારી રીતે સ્કેલ થાય છે). ઉપરના ટ્યુટોરિયલ્સ બંને શૈલીઓ બતાવે છે: YouTube અને DataCamp માર્ગદર્શિકાઓ WebUI તરફ ઝુકે છે; માધ્યમનો ભાગ નોટબુક/CLI હાઇબ્રિડ તરફ ઝુકે છે.
- સ્માર્ટ તાલીમ આપો: નાની શરૂઆત કરો—થોડા યુગ, ઉચ્ચ શીખવાની ગતિ, નાનો સબસેટ. જો તે 10–20 મિનિટમાં સુધરતું નથી, તો કંઈક બદલો અને ફરીથી પ્રયાસ કરો. પુનરાવર્તન આંધળી શ્રદ્ધાને હરાવે છે.
- સંશયવાદીની જેમ મૂલ્યાંકન કરો: 50–100 ઉદાહરણોનો ટેસ્ટ સેટ બનાવો જે વાસ્તવિક ઉપયોગને પ્રતિબિંબિત કરે છે. કઠિન પ્રશ્નો પૂછો. સત્યને પુરસ્કાર આપો, શબ્દોને નહીં.
શ્રેષ્ઠ ટ્યુટોરિયલ્સનું રેન્કિંગ (અને શા માટે)
- DataCamp ની LLaMA-Factory WebUI માર્ગદર્શિકા — એકંદરે શ્રેષ્ઠ લેખિત વોકથ્રુ
- તે શા માટે શ્રેષ્ઠ છે: તે તાજેતરનું છે, તે Llama 3 નો ઉપયોગ કરે છે અને તે તમને સિદ્ધાંતમાં દફનાવતું નથી. તે "એલન કી સાથે આને એસેમ્બલ કરો" નો પાઠ છે જે તમે ખરેખર ઇચ્છો છો.
- કોણે તેનો ઉપયોગ કરવો જોઈએ: ફાઇન-ટ્યુનિંગ અથવા WebUI માં નવા કોઈપણ. તે વાસ્તવિક આઉટપુટ સાથે આત્મવિશ્વાસ વધારનાર છે.
- YouTube એન્ડ-ટુ-એન્ડ વિડિયો — શ્રેષ્ઠ વિઝ્યુઅલ પ્રાઇમર અને વેગ આપનાર
- તે શા માટે શ્રેષ્ઠ છે: તમે પ્રવાહ, ગતિ અને ભૂલો જુઓ છો. તમે કરો તે પહેલાં સ્ક્રીન પર મિત્ર હોવા જેવું જ છે.
- કોણે તેનો ઉપયોગ કરવો જોઈએ: વિઝ્યુઅલ લર્નર્સ, અધીરા બિલ્ડર્સ, વીકેન્ડ ટીંકરર્સ.
- માધ્યમની Colab માર્ગદર્શિકા — શૂન્ય-ઇન્સ્ટોલ પ્રયોગો માટે શ્રેષ્ઠ
- તે શા માટે શ્રેષ્ઠ છે: તમારે તમારા લેપટોપ પર PyTorch વ્હીલ્સ સામે લડવાની જરૂર નથી. ચલાવો, જુઓ, નિકાસ કરો.
- કોણે તેનો ઉપયોગ કરવો જોઈએ: પાણીનું પરીક્ષણ કરતા અથવા લોકલ CUDA ડ્રામાને ટાળતા લોકો.
આ ટ્યુટોરિયલ્સ શું ચૂકી જાય છે (અને ગાબડા કેવી રીતે ભરવા)
- વર્ઝન પિનિંગ: ટૂલિંગ ઝડપથી આગળ વધે છે. જો તમારું રન તૂટી જાય, તો ટ્યુટોરિયલમાં વપરાયેલ LLaMA-Factory વર્ઝન અને તમે ઇન્સ્ટોલ કરેલું વર્ઝન તપાસો. તેમને મેચ કરો, અથવા રેપો ચેન્જલોગને પ્લોટ ટ્વિસ્ટની જેમ વાંચો.
- ટોકનાઇઝર મિસમેચ: જો જવાબો મૂળાક્ષર સૂપ જેવા લાગે છે, તો ચકાસો કે ટોકનાઇઝર બેઝ મોડેલ સાથે મેળ ખાય છે. તે ખોટા સબટાઈટલ સાથે ઓડિયોબુક વાંચવાનો પ્રયાસ કરવા જેવું છે.
- VRAM બજેટિંગ: ટ્યુટોરિયલ્સ ઘણીવાર "મેં તે કેવી રીતે કર્યું તે અહીં છે" બતાવે છે, "તેને કેવી રીતે સ્કેલ કરવું તે અહીં છે" નહીં. જો તમને CUDA આઉટ-ઓફ-મેમરી ભૂલો આવી રહી હોય, તો બેચ સાઈઝ ઓછી કરો, ગ્રેડિયન્ટ ચેકપોઈન્ટીંગનો ઉપયોગ કરો અને 4-બીટ QLoRA ચાલુ કરો. તમારું GPU તમારો આભાર માનશે.
તમારું પ્રથમ ફાઇન-ટ્યુન: એક ટેમ્પ્લેટ યોજના જે તમે ખરેખર ચોરી શકો છો
- ધ્યેય: ગ્રાહક-સપોર્ટ શૈલીના ચેટબોટ માટે QLoRA સાથે Llama 3 8B ને ફાઇન-ટ્યુન કરો.
- હાર્ડવેર: 16GB GPU (હા, ખરેખર), અથવા ક્લાઉડ T4/A10G/A100 જો તમે વધુ પરવડી શકો છો.
- ડેટા: તમારા ડોમેનમાંથી 5,000 ક્યુરેટેડ Q&A જોડી. સ્વચ્છ, સુસંગત શૈલી. કોઈ નકલ નહીં. માન્યતા માટે 500 સમર્પિત કરો.
- પર્યાવરણ અને UI ચલાવવા માટે DataCamp WebUI ટ્યુટોરિયલને અનુસરો.
- તાલીમ સેટિંગ્સ હેઠળ, પસંદ કરો: બેઝ મોડેલ = Llama 3 8B Instruct; પદ્ધતિ = QLoRA; 4-બીટમાં લોડ કરો; બેચ સાઈઝ નાની (1–2); મોટા બેચનું અનુકરણ કરવા માટે ગ્રેડિયન્ટ એક્યુમ્યુલેશન; 1–2 યુગ.
- 10% ડેટા સબસેટથી શરૂઆત કરો. જો નુકસાન ઓછું થાય છે અને માન્યતા યોગ્ય લાગે છે, તો સંપૂર્ણ સેટ પર જાઓ.
- એડેપ્ટર નિકાસ કરો અને અનુમાન સ્ક્રિપ્ટમાં પરીક્ષણ કરો. જો જવાબો ખૂબ જ શબ્દાળુ હોય, તો સિસ્ટમ પ્રોમ્પ્ટ્સને ટ્વિક કરો અને તાપમાન ઘટાડો.
- ધોઈ નાખો અને પુનરાવર્તન કરો: શીખવાની ગતિ, યુગની ગણતરી અને ઓછી-ગુણવત્તાવાળા ઉદાહરણો કાપો.
- સફળતા તપાસો: તમારું મોડેલ ડોમેન પ્રશ્નોના સંક્ષિપ્તમાં જવાબ આપે છે, યોગ્ય શબ્દોનો ઉલ્લેખ કરે છે અને નીતિઓ શોધતું નથી. જો તે તમારા સર્જનાત્મક લેખન ઇન્ટર્નની જેમ ભૂમિકા ભજવે છે, તો તમે વધુ પડતું ફિટ કર્યું છે અથવા ઓછું સાફ કર્યું છે.
GPU માં મુશ્કેલી આવે છે? આ અજમાવો
- "CUDA OOM": બેચ સાઈઝ ઓછી કરો, ગ્રેડિયન્ટ ચેકપોઈન્ટીંગ સક્ષમ કરો અથવા 4-બીટનો ઉપયોગ કરો. જો તમે હજી પણ અટવાયેલા છો, તો એક નાનું મોડેલ પર સ્વિચ કરો અથવા અંતિમ યુગ માટે મોટા GPU ભાડે લો.
- "નુકસાન ઓછું થશે નહીં": ખરાબ ડેટા અથવા ખૂબ નાનું. ડેટાની વિવિધતા વધારો, શીખવાની ગતિ ઓછી કરો અથવા તપાસો કે તમારી LoRA રેન્ક ખૂબ નાની છે.
- "આઉટપુટ અસભ્ય/વિચિત્ર છે": સૂચના-ટ્યુન કરેલ બેઝ મોડેલો અને તમારા ડેટાસેટમાં સુસંગત પ્રતિભાવ ફોર્મેટ દ્વારા શૈલીને સંરેખિત કરો. મોડેલો તેઓ જે જુએ છે તેનું અનુકરણ કરે છે—તમે તેનો અર્થ કરો ત્યારે તાલીમ આપો.
જમાવટ: લેબથી લેપટોપ સુધી (અને તેનાથી આગળ)
- LoRA એડેપ્ટર્સ નિકાસ કરો અને જો જરૂરી હોય તો મર્જ કરો. એજ ઉપકરણો માટે, પોર્ટેબિલિટી માટે એડેપ્ટર્સને અલગ રાખો. સર્વર્સ માટે, સરળતા અને ગતિ માટે મર્જ કરો.
- અનુમાન માટે ક્વોન્ટાઇઝ કરો. જો તમે 4-બીટ પર તાલીમ આપી હોય, તો લેટન્સી અને ફિડેલિટીને સંતુલિત કરવા માટે 4-, 5- અને 8-બીટ અનુમાનનું પરીક્ષણ કરો.
- ગાર્ડરેલ્સ ઉમેરો. ઉદાહરણો સાથેનું એક સરળ પ્રોમ્પ્ટ રેપર અજાયબીઓ કરે છે. અથવા એક નાનું નિયમોનું ચેકર મોડેલ વાપરો જે તમારા વપરાશકર્તાઓને ફટકારતા પહેલાં બકવાસને ફિલ્ટર કરે છે.
શું તમારે લાંબા ગાળે WebUI અથવા CLI પસંદ કરવું જોઈએ?
- WebUI તમારી મનપસંદ કોફી શોપ છે: આરામદાયક, ઝડપી, ઓછું ઘર્ષણ.
- CLI એ તમારું હોમ કિચન છે: વધુ નોબ્સ, વધુ ગરબડ, વધુ નિયંત્રણ. જો તમે સાપ્તાહિક ફાઇન-ટ્યુનિંગ કરી રહ્યા હો, તો આખરે તમને સ્ક્રિપ્ટ્સ, પ્રયોગ ટ્રેકર્સ અને પુનઃઉત્પાદન યોગ્ય રૂપરેખાંકનો જોઈશે. WebUI માં શરૂઆત કરો, CLI માં સ્નાતક થાઓ.
નોંધવા જેવું: Sider.AI “મને આ સમજાવો જાણે હું મારા ત્રીજા એસ્પ્રેસો પર છું” ની ક્ષણોમાં મદદ કરી શકે છે. જો તમે તમારા રૂપરેખાંકન અથવા લોગને Sider.AI ચેટમાં પેસ્ટ કરો છો, તો તમને ટ્વિક કરવા માટેના પરિમાણો, તમે સંભવતઃ કયું ટ્યુટોરિયલ પગલું ચૂકી ગયા છો અને ખોટી શીખવાની ગતિમાં બે કલાક ડૂબતા પહેલાં સેનિટી ચેક માટે ઝડપી સૂચનો મળી શકે છે. તે એક મૈત્રીપૂર્ણ TA જેવું છે જે તમને ગ્રેડિંગ કરતું નથી—ફક્ત તમારી ઝડપ વધારે છે. ઝડપી સરખામણી: કયું ટ્યુટોરિયલ કયા કામ માટે જીતે છે
- સંપૂર્ણ શરૂઆત કરનારાઓ માટે શ્રેષ્ઠ: DataCamp ની WebUI માર્ગદર્શિકા (સ્પષ્ટ પગલાં, આધુનિક મોડેલો).
- "મને હમણાં બતાવો" માટે શ્રેષ્ઠ: YouTube એન્ડ-ટુ-એન્ડ (વિઝ્યુઅલ ફ્લો, નકલ-ધ-ક્લિક્સ).
- કોઈ ઇન્સ્ટોલ પ્રયોગો માટે શ્રેષ્ઠ: માધ્યમની Colab માર્ગદર્શિકા (ઝડપથી ચલાવો, ઓછો ખર્ચ કરો).
અદ્યતન એડ-ઓન્સ (જ્યારે તમે લેવલ અપ કરવા માટે તૈયાર હોવ)
- LoRA થી આગળ PEFT એડેપ્ટર્સ: વિવિધ રેન્ક અને આલ્ફા અજમાવો. નાના ફેરફારો, મોટી અસર.
- અભ્યાસક્રમ ફાઇન-ટ્યુનિંગ: સામાન્ય સૂચના ડેટાથી શરૂઆત કરો, પછી સંકુચિત ડોમેન ડેટા પર જાઓ.
- મિશ્ર ચોકસાઈ અને મેમરી યુક્તિઓ: bf16 જો સપોર્ટેડ હોય; ફ્લેશ એટેન્શન; તમારા GPU ને મ્યાઉં કરાવો.
- મૂલ્યાંકન સ્યુટ્સ: કસ્ટમ ઇવલ સેટ અને થોડા જાહેર કાર્યો બનાવો. તમારા વેલ સેટ અને નાના આઉટ-ઓફ-ડોમેન સેટ વચ્ચેના તફાવતનું નિરીક્ષણ કરીને ઓવરફિટિંગને ટ્રેક કરો.
એક નાની ગ્લોસરી જેથી તમારે માથું ધુણાવીને ડોળ કરવાની જરૂર ન પડે
- LoRA: હળવા એડેપ્ટર સ્તરો કે જેને તમે આખા વિશાળ મોડેલને બદલે તાલીમ આપો છો. સમય અને VRAM બચાવે છે.
- QLoRA: LoRA જેવું જ, પરંતુ તાલીમ દરમિયાન બેઝ વજન સંકુચિત (ક્વોન્ટાઇઝ્ડ) થાય છે. હેલો, 4-બીટ.
- એડેપ્ટર મર્જિંગ: સરળ જમાવટ માટે બેઝ મોડેલ સાથે એડેપ્ટર વજનને જોડો.
- ટોકનાઇઝર: તે વસ્તુ જે વાક્યોને ટોકન્સમાં કાપે છે. ખોટું ટોકનાઇઝર = ઈંડાનો ભૂકો.
મારું માનવું: તમારે કયા ટ્યુટોરિયલથી શરૂઆત કરવી જોઈએ?
જો તમારો ધ્યેય પ્રથમ સફળતા માટે ઝડપ છે, તો DataCamp થી શરૂઆત કરો. તેને YouTube વોકથ્રુ સાથે જોડો—જુઓ, ક્લિક કરો, જીતો. પછી, તમારા બીજા રન માટે, બીજી રીત જોવા માટે Colab માર્ગદર્શિકાને સ્પિન કરો. તમે એક મોટો થ્રેડ વાંચવા કરતાં બે નાના રન કરીને વધુ શીખશો. અને તમારું GPU HR સાથે ફરિયાદ નોંધાવશે નહીં.
સ્ટર્ન રેપ-અપ: ફાઇન-ટ્યુનિંગ હવે સંપૂર્ણપણે શક્ય છે. LLaMA-Factory એ "નિરાશાની ભેખડ" ને હેન્ડરેલ્સવાળી સીડીમાં ફેરવી દીધી છે. એક ટ્યુટોરિયલ પસંદ કરો, નાની શરૂઆત કરો અને પુનરાવર્તન કરો. તમારું ભાવિ ફાઇન-ટ્યુન કરેલું મોડેલ તમારી રિફંડ નીતિને આડેધડ ન જણાવીને તમારો આભાર માનશે.
લિંક્સ જેનો તમે ખરેખર ઉપયોગ કરશો
- YouTube: એન્ડ-ટુ-એન્ડ LLaMA-Factory ફાઇન-ટ્યુન વોકથ્રુ.
- DataCamp: LLaMA-Factory WebUI શરૂઆત કરનારાઓ માટેની માર્ગદર્શિકા.
- માધ્યમ: Colab-આધારિત LLaMA-Factory ક્વિકસ્ટાર્ટ.
90 સેકન્ડમાં એક્શન પ્લાન
- DataCamp માર્ગદર્શિકા પસંદ કરો અને WebUI સેટ કરો.
- એક નાનો ડેટાસેટ તૈયાર કરો (500–1,000 જોડી). તેને સ્વચ્છ રાખો.
- QLoRA, 4-બીટ, નાના બેચ સાથે તાલીમ આપો.
- હાથથી પસંદ કરેલા 100 પ્રશ્નો પર મૂલ્યાંકન કરો.
- બે કે ત્રણ વાર પુનરાવર્તન કરો. પછી લાંબા રન અને મોટા ડેટા પર સ્નાતક થાઓ.
હવે કંઈક ઉપયોગી ફાઇન-ટ્યુન કરવા જાઓ. અને યાદ રાખો: જો તમારું GPU ચીસો પાડે છે, તો તે ફક્ત એટલું જ કહે છે કે "બેચ સાઈઝ ઓછી કરો."
FAQ
Q1: સાચા શરૂઆત કરનારાઓ માટે શ્રેષ્ઠ LLaMA-Factory ટ્યુટોરિયલ કયું છે?
DataCamp તરફથી LLaMA-Factory WebUI માર્ગદર્શિકાથી શરૂઆત કરો—તે સ્પષ્ટ, વર્તમાન છે અને Llama 3 નો ઉપયોગ કરે છે. વિઝ્યુઅલ સેનિટી ચેક માટે YouTube એન્ડ-ટુ-એન્ડ વોકથ્રુ સાથે જોડો જેથી તમને તાલીમ પર ક્લિક કરતા પહેલાં સફળતા કેવી દેખાય છે તે ખબર પડે.
Q2: શું હું Google Colab પર LLaMA-Factory મોડેલોને ફાઇન-ટ્યુન કરી શકું?
હા, Colab-આધારિત ટ્યુટોરિયલ LLaMA-Factory ફાઇન-ટ્યુનિંગને આશ્ચર્યજનક રીતે પીડારહિત બનાવે છે. ફક્ત તમારા સેશન સમય અને VRAM મર્યાદાઓનું ધ્યાન રાખો, ચેકપોઇન્ટ્સ વારંવાર સાચવો અને તમારા પ્રથમ રન માટે ડેટાસેટને નાનો રાખો.
Q3: મારે LLaMA-Factory સાથે LoRA અથવા QLoRA નો ઉપયોગ કરવો જોઈએ?
જો તમે VRAM પર મર્યાદિત છો, તો QLoRA તમારો મિત્ર છે—4-બીટ તાલીમ, નાનું મેમરી ફૂટપ્રિન્ટ. જો તમારી પાસે વધુ GPU હેડરૂમ છે, તો સ્ટાન્ડર્ડ LoRA સરળ છે અને ફાઇન-ટ્યુનિંગ માટે હજી પણ ખૂબ કાર્યક્ષમ છે.
Q4: તાલીમ દરમિયાન CUDA આઉટ-ઓફ-મેમરી ભૂલોને હું કેવી રીતે ઠીક કરી શકું?
તમારી બેચ સાઈઝ ઓછી કરો, ગ્રેડિયન્ટ ચેકપોઈન્ટીંગ ચાલુ કરો અને 4-બીટ QLoRA નો ઉપયોગ કરો. જો તે હજી પણ નિષ્ફળ જાય છે, તો એક નાનું બેઝ મોડેલ અજમાવો અથવા સૌથી ભારે પગલા માટે વધુ VRAM સાથે GPU ભાડે લો.
Q5: મને કેવી રીતે ખબર પડે કે મારું LLaMA-Factory ફાઇન-ટ્યુન ખરેખર કામ કર્યું છે?
એક નાનો, વાસ્તવિક મૂલ્યાંકન સેટ બનાવો અને ફાઇન-ટ્યુનિંગ પહેલાં અને પછી આઉટપુટની તુલના કરો. જો તમારું મોડેલ ઝડપથી, વધુ સચોટ રીતે જવાબ આપે છે અને તમારી કંપનીની વેકેશન નીતિને આડેધડ જણાવતું નથી, તો તમે યોગ્ય માર્ગ પર છો.