አንድ ትልቅ የቋንቋ ሞዴል (large language model) ማዛባቱን እንዲያቆም እና የእርስዎን በጣም ልዩ እና በቂ ያልሆነ ክፍያ የሚከፈል ረዳት እንዲመስል ለማሳመን ሞክረው ያውቃሉ? ያ በ2025 ጥሩ ማስተካከያ (fine-tuning) ምን እንደሚመስል ነው፡ ልክ እንደ ወላጅነት ነገር ግን ከ YAML ጋር። መልካሙ ዜና፡ LLaMA-Factory መላውን ሂደቱን በሚገርም ሁኔታ… አስፈሪ እንዳይሆን ያደርገዋል። የተሻለው ዜና፡ ምርጥ የ LLaMA-Factory መማሪያዎችን ለማግኘት አስማሚዎችን እና ቶክኖችን በመጠቀም አንድ ሳምንት አሳልፌያለሁ ስለዚህ እርስዎ ማድረግ የለብዎትም።
ምርጥ ምንጮች፣ እያንዳንዳቸውን መቼ መጠቀም እንዳለቦት እና ሶስቱን በጣም የተለመዱ የፊት መዳፍ አፍታዎች እንዴት ማስወገድ እንደሚችሉ ላይ ይህ ያለምንም ድብቅነት የቀረበ የጆአና አይነት መመሪያ ነው (ማሳሰቢያ፡ VRAM ጥቆማ ሳይሆን በጀት ነው)።
ለምን እዚህ እንዳሉ (እና ምን እንደሚፈልጉ)
- ስለተሰራጨ ስልጠና (distributed training) ጥልቅ ምርምር ሳይጽፉ Llama 2 ወይም Llama 3 ሞዴሎችን በጥሩ ሁኔታ ማስተካከል ይፈልጋሉ።
- LLaMA-Factory የWebUI እና CLI እንዲሁም Google Colab አስማት እንዳለው ሰምተዋል።
- በክላውድ GPU እርሻ ውስጥ እንደሚኖሩ የማይገምቱ መማሪያዎችን ይፈልጋሉ።
ይህ በተግባራዊ ምክሮች የታገዘ ምርጥ/ከፍተኛ ዝርዝር ነው። መማሪያዎችን በግልጽነታቸው፣ በዘመናዊነታቸው (Llama 3, QLoRA, 4-bit, WebUI workflows) እና ከዜሮ ተነስተው “ሞዴሌ በትክክል ይሰራል” ደረጃ ላይ ያደርሱዎት እንደሆነ እመድባቸዋለሁ። እንሂድ።
አጭር ዝርዝር፡ በአሁኑ ጊዜ ምርጥ የ LLaMA-Factory መማሪያዎች
- ለተመልካች ተማሪዎች (እና ትዕግስት ለሌላቸው ሰዎች) የYouTube ፈጣን ትምህርት
- በYouTube ላይ “ማንኛውም ሰው LLaMA Factoryን በመጠቀም ኤልኤልኤምዎችን በጥሩ ሁኔታ ማስተካከል ይችላል፡ ከጫፍ እስከ ጫፍ”። የትኩረት ጊዜዎ TikTok ከሆነ እና የ GPU በጀትዎ ቡና ከሆነ፣ ይህ የእርስዎ መማሪያ ነው። LLaMA-Factory ፍሰት ውስጥ ማዋቀርን፣ የውሂብ ዝግጅትን እና ከጫፍ እስከ ጫፍ ያለውን አሰራር ይመራል። ለጀማሪዎች ተስማሚ ነው፣ WebUIን ያሳያል፣ እና የትኞቹን ቁልፎች መጫን እንዳለቦት እና ለምን እንደሆነ ይሸፍናል። ሂደቱን በቀጥታ ለማየት እና ትዕዛዝ ለመቅዳት በየ 12 ሰከንድ ለማቆም በጣም ጥሩ ነው።
ለሚከተሉት ምርጥ ነው፡ ምስላዊ ተማሪዎች፣ የሳምንት መጨረሻ ፕሮጀክቶች፣ “ነገሩ ሲሰራ አሳየኝ።”
ይጠንቀቁ፡ ትክክለኛዎቹ ስሪቶች እና ባንዲራዎች ሊለወጡ ይችላሉ—ስህተት ካጋጠመዎት የሪፖውን ነባሪዎች እንደገና ያረጋግጡ።
- ለመጀመሪያ ጊዜ ጥሩ ማስተካከያ ለሚያደርጉ የደረጃ-በደረጃ የWebUI መመሪያ
- ከ DataCamp የቀረበው “LLaMA-Factory WebUI ለጀማሪዎች መመሪያ፡ LLMዎችን በጥሩ ሁኔታ ማስተካከል።” ይህ ንጹህ፣ የተጻፈ የእግር ጉዞ ነው፡ መጫን፣ Llama 3 8B መጫን፣ LoRA ወይም QLoRA መምረጥ፣ የውሂብ ስብስብን መመገብ፣ ማሰልጠን፣ መገምገም፣ ወደ ውጭ መላክ። ቅጽበታዊ ገጽ እይታዎች፣ አወቃቀሮች እና አውድ ያገኛሉ። በ CLI ከተጮሁብዎት፣ ይህ የድምፅ መሰረዣ የጆሮ ማዳመጫዎችን እንደ ማድረግ ነው።
ለሚከተሉት ምርጥ ነው፡ ጀማሪዎች፣ አወቃቀር ለሚፈልጉ ሰዎች፣ ማንኛውም ሰው ለዶከር-ኮምፖዝ ኮንፈቲ አለርጂ የሆነ።
ይጠንቀቁ፡ የክላውድ ማዋቀር እና የVRAM ፍላጎቶች ለአንድ አይነት መጠን የሚስማሙ አይደሉም—ተመሳሳይ ሃርድዌር ላይ ካልሆኑ ማስተካከያዎችን ይጠብቁ።
- Colabን መሰረት ያደረገ፣ ፈጣን ጅምር አሰራር
- በመካከለኛ ላይ “ቀላል የሆነ ጥሩ ማስተካከያ፡ ለ LLaMA Factory የእርስዎ መመሪያ።” ከ Llama 3 ጋር LoRA የሚጠቀም ተግባራዊ የColab-ተኮር መማሪያ ነው። የአካባቢ ጭነቶችን ማስወገድ ከፈለጉ እና በነጻ/በአነስተኛ የጂፒዩ ጊዜ መሞከር ከፈለጉ ጥሩ ነው። ማስታወሻ ደብተሩን ይቅዱ፣ የውሂብ ስብስብን ዱካ ይቀይሩ እና ወዲያውኑ፡ የመጀመሪያው የሞዴል ልጅዎ ይወለዳል። በጥሩ መንገድ አስተያየት ሰጪ ነው፡ LoRA, Colab እና አነስተኛ ጫጫታ።
ለሚከተሉት ምርጥ ነው፡ የColab ተጠቃሚዎች፣ አነስተኛ በጀት ያላቸው የጂፒዩ አሳሾች፣ “በአንድ ሰዓት ውስጥ የሆነ ነገር እንዲሰራ እፈልጋለሁ።”
ይጠንቀቁ፡ ነፃ የColab ገደቦች አሉ። ስልጠና ጊዜው ሊያልቅበት ወይም ሊታፈን ይችላል። የመፈተሻ ነጥቦችን ቀድመው እና ብዙ ጊዜ ያስቀምጡ።
እሺ፣ ግን LLaMA-Factory በእውነቱ ምን እያደረገልኝ ነው?
LLaMA-Factoryን እንደ ጥሩ ማስተካከያ IKEA አድርገው ያስቡት፡ ሁሉንም ክፍሎች ይሰጥዎታል፣ አብዛኛዎቹን ይሰይማል፣ እና የራስዎን በትህትና የተዋቀረ LLM መሰብሰብ እንዲችሉ አንድ ትንሽ የአለን ቁልፍ (WebUI) ይሰጥዎታል። አስፈሪ የሆኑትን ክፍሎች—QLoRA quantization, adapters, tokenizers—ቅድመ-ቅምጦች እና አስተዋይ ነባሪዎች ጀርባ ያደርጋቸዋል። አሁንም የውሂብ ስብስብ እና ጨዋነት ያለው ጂፒዩ ማምጣት ያስፈልግዎታል፣ ነገር ግን ሶፋውን ከጥሬ እንጨት መገንባት አያስፈልግዎትም።
ለአጠቃቀም ጉዳይዎ ትክክለኛውን መማሪያ እንዴት እንደሚመርጡ
- በሕይወቴ ውስጥ ምንም ነገር በጥሩ ሁኔታ አስተካክዬ አላውቅም፡ በ DataCamp WebUI መመሪያ ይጀምሩ፣ ከዚያ የYouTube የእግር ጉዞውን ይመልከቱ። አንደኛው ምን መጫን እንዳለቦት ያሳየዎታል፣ ሌላኛው ደግሞ በትክክል ሲሰራ (እና በጸጋ የት እንደሚወድቅ) ምን እንደሚመስል ያሳየዎታል።
- በበጀት ላይ ፈጣን POC ብቻ ነው የሚያስፈልገኝ፡ የColab መማሪያን ይጠቀሙ። የውሂብ ስብስብዎን ትንሽ እና የሚጠብቁትን ነገሮች ትንሽ ያድርጉ። ከዚያ አስማሚውን ወደ ውጭ ይላኩ እና በአካባቢዎ ማሽን ወይም ርካሽ ክላውድ ላይ ይሞክሩ።
- ይህን በስራ ቦታ ወይም በክላውድ ጂፒዩ ላይ “በትክክል” ማድረግ እፈልጋለሁ፡ ጽንሰ-ሀሳቦችን ለመማር በWebUI መማሪያ ይጀምሩ፣ ከዚያ ሙከራዎችን ለመስራት እና ልክ እንደ ባለሙያ ሩጫዎችን ለመከታተል ወደ CLI ይሂዱ። የእርስዎ VRAM የማይለዋወጥ ከሆነ ለ4-ቢት ቅልጥፍና QLoRAን ይቀላቅሉ።
የአምስት ደቂቃ ፈጣን ትምህርት፡ የLLaMA-Factory አስፈላጊ ነገሮች
- WebUI ከ CLI ጋር፡ WebUI ለመማር ፈጣን ነው፣ ለመጀመሪያ ሩጫዎች እና የአእምሮ ጤንነት ምርመራዎች በጣም ጥሩ ነው። CLI ማለት የእርስዎን ትራክፓድ ሳያስለቅሱ ሙከራዎችን እንዴት መደርደር፣ በራስ-ሰር ማድረግ እና ስሪት ማድረግ እንደሚችሉ ነው።
- LoRA ከ QLoRA ጋር፡ LoRA ቀልጣፋ አስማሚ ንብርብሮችን ይጨምራል—ፈጣን እና ቀልጣፋ። QLoRA በትናንሽ ጂፒዩዎች ላይ ትልልቅ ሞዴሎችን በጥሩ ሁኔታ ማስተካከል እንዲችሉ quantizationን ይጨምራል። የ IKEA ጥቅል-ጠፍጣፋ የስልጠና ስሪት ነው።
- የውሂብ ስብስቦች፡ ጥብቅ እና ንጹህ ያድርጉት። የእርስዎ የውሂብ ስብስብ የኮሌጅ ድርሰት ረቂቆች የሚመስል ከሆነ፣ የእርስዎ ሞዴልም እንዲሁ ይሆናል።
- የመፈተሻ ነጥቦች እና ግምገማ፡ ብዙ ጊዜ ያስቀምጡ። ቀድመው ይገምግሙ። አዎ፣ የእርስዎ ሞዴል “እየተማረ ነው፣” ግን እርስዎ የሚያስቡትን እየተማረ ነው? እንደ ማርከር የያዘ ሕፃን፣ ቁጥጥር ቁልፍ ነው።
ከማንኛውም መማሪያ ጋር ለመጠቀም የስተርን-ስታይል አነስተኛ የማዋቀር መመሪያ
- ሞዴልዎን ይምረጡ፡ Llama 3 8B ወዳጃዊ ጅምር ነው። ትንሽ ይፈልጋሉ? የስልጠናን ህመም ለመቀነስ በ7–8B ልዩነት ላይ የተስተካከለ መመሪያ ይሞክሩ።
- በጀትዎን ይወስኑ፡ ከ16 ጂቢ በታች የሆነ VRAM? QLoRAን ይምረጡ። ወደ 24 ጂቢ ገደማ? LoRA ምቹ ነው። 48 ጂቢ+? ድንቅ ነዎት፤ ምን እያደረጉ እንደሆነ ካወቁ ትልልቅ የአውድ መስኮቶችን ወይም ሙሉ ማስተካከያዎችን ያስቡ።
- ውሂቡን ያዘጋጁ፡ ግልጽ የሆኑ ጥያቄ/ምላሽ መስኮች ያሉት JSON ወይም CSV ይጠቀሙ። ከመለካትዎ በፊት በ2–10 ሺህ ከፍተኛ ጥራት ያላቸው ምሳሌዎች ይጀምሩ።
- መንገድዎን ይምረጡ፡ WebUI (ቀላል) ወይም CLI (በተሻለ ሁኔታ ይመዘናል)። ከላይ ያሉት መማሪያዎች ሁለቱንም ቅጦች ያሳያሉ፡ የYouTube እና DataCamp መመሪያዎች ወደ WebUI ያዘነብላሉ፤ የመካከለኛው ክፍል ደግሞ ወደ ማስታወሻ ደብተር/CLI ድብልቅ ያዘነብላል።
- በብልህነት ያሰልጥኑ፡ በትንሹ ይጀምሩ—ጥቂት ወቅቶች፣ ከፍተኛ የመማሪያ ፍጥነት፣ ትንሽ ንዑስ ስብስብ። በ10–20 ደቂቃዎች ውስጥ ካልተሻሻለ፣ የሆነ ነገር ይቀይሩ እና እንደገና ይሞክሩ። መደጋገም ከእምነት ይበልጣል።
- እንደ ተጠራጣሪ ይገምግሙ፡ እውነተኛ አጠቃቀምን የሚያንፀባርቅ ከ50–100 ምሳሌ የሙከራ ስብስብ ይገንቡ። ከባድ ጥያቄዎችን ይጠይቁ። እውነትን ይሸልሙ፣ ቃላትን አይደለም።
ምርጥ መማሪያዎችን ደረጃ መስጠት (እና ለምን)
- የ DataCamp የLLaMA-Factory WebUI መመሪያ — ምርጥ አጠቃላይ የተጻፈ የእግር ጉዞ
- ለምን በጣም ጥሩ ነው፡ የቅርብ ጊዜ ነው፣ Llama 3ን ይጠቀማል፣ እና በንድፈ ሃሳብ ውስጥ አይቀብርዎትም። በትክክል የሚፈልጉት “ይህን በአለን ቁልፍ ሰብስብ” ትምህርት ነው።
- ማን ሊጠቀምበት ይገባል፡ ጥሩ ማስተካከያ ወይም WebUI አዲስ የሆነ ማንኛውም ሰው። በእውነተኛ ውጤት በራስ መተማመንን የሚገነባ ነው።
- የYouTube ከጫፍ እስከ ጫፍ ቪዲዮ — ምርጥ ምስላዊ ፕሪመር እና የሞመንተም ማበረታቻ
- ለምን በጣም ጥሩ ነው፡ ፍሰቱን፣ ፍጥነትን እና ስህተቶችን ያያሉ። እርስዎ ከመጫንዎ በፊት በስክሪኑ ላይ ጓደኛ እንዳለዎት ያህል ነው።
- ማን ሊጠቀምበት ይገባል፡ ምስላዊ ተማሪዎች፣ ትዕግስት የሌላቸው ገንቢዎች፣ የሳምንት መጨረሻ አጫዋቾች።
- የመካከለኛው የColab መመሪያ — ለዜሮ ጭነት ሙከራዎች ምርጥ
- ለምን በጣም ጥሩ ነው፡ በላፕቶፕዎ ላይ የPyTorch መንኮራኩሮችን መዋጋት የለብዎትም። ያሂዱ፣ ይመልከቱ፣ ወደ ውጭ ይላኩ።
- ማን ሊጠቀምበት ይገባል፡ ውሀውን የሚፈትሹ ወይም የአካባቢ CUDA ድራማዎችን የሚያስወግዱ ሰዎች።
እነዚህ መማሪያዎች ያመለጡት ነገር (እና ክፍተቶቹን እንዴት እንደሚሞሉ)
- የስሪት ፒን ማድረግ፡ መሳሪያ በፍጥነት ይንቀሳቀሳል። ሩጫዎ ከተበላሸ፣ በመማሪያው ውስጥ ጥቅም ላይ የዋለውን የ LLaMA-Factory ስሪት እና የጫኑትን ያረጋግጡ። ያዛምዷቸው፣ ወይም የሪፖውን ለውጥ ሎግ እንደ ሴራ ጠመዝማዛ ያንብቡ።
- Tokenizer አለመዛመድ፡ ምላሾች እንደ ፊደል ሾርባ የሚመስሉ ከሆነ፣ ቶክኒዘሩ ከመሠረታዊው ሞዴል ጋር የሚዛመድ መሆኑን ያረጋግጡ። ትክክል ባልሆኑ የትርጉም ጽሑፎች የድምጽ መጽሐፍን ለማንበብ እንደ መሞከር ነው።
- VRAM በጀት ማውጣት፡ መማሪያዎች ብዙውን ጊዜ “እንዴት እንዳደረግኩት እነሆ” ያሳያሉ እንጂ “እንዴት እንደሚመዘኑት እነሆ” አይደለም። የ CUDA ከማስታወሻ ውጪ ስህተቶችን እያገኙ ከሆነ፣ የቡድን መጠኑን ይቀንሱ፣ የግራዲየንት ቼክ ፖይንትን ይጠቀሙ እና 4-ቢት QLoRAን ያብሩ። ጂፒዩዎ ያመሰግንዎታል።
የእርስዎ የመጀመሪያ ጥሩ ማስተካከያ፡ በትክክል ሊሰርቁት የሚችሉት የአብነት እቅድ
- ግብ፡ ለደንበኛ ድጋፍ አይነት ቻትቦት Llama 3 8Bን ከQLoRA ጋር በጥሩ ሁኔታ ማስተካከል።
- ሃርድዌር፡ 16 ጂቢ ጂፒዩ (አዎ፣ በእውነት) ወይም የበለጠ አቅም ካለዎት የክላውድ T4/A10G/A100።
- ውሂብ፡ ከጎራዎ የተገኙ 5,000 የተመረጡ የጥያቄ እና መልስ ጥንዶች። ንጹህ፣ ወጥ የሆነ ዘይቤ። ምንም ቅጂዎች የሉም። ለምርመራ 500 ይመድቡ።
- አካባቢውን እና UIን ለማስኬድ የDataCamp WebUI መማሪያን ይከተሉ።
- በስልጠና ቅንጅቶች ስር የሚከተለውን ይምረጡ፡ ቤዝ ሞዴል = Llama 3 8B አስተምሩ፤ ዘዴ = QLoRA፤ በ4-ቢት ውስጥ ጫን፤ ትንሽ የቡድን መጠን (1–2)፤ ትላልቅ ስብስቦችን ለመምሰል የግራዲየንት ክምችት፤ 1–2 ወቅቶች።
- በ10% የውሂብ ንዑስ ስብስብ ይጀምሩ። ኪሳራው ከቀነሰ እና ማረጋገጫው ትርጉም የሚሰጥ ከሆነ፣ ወደ ሙሉው ስብስብ ይቀይሩ።
- አስማሚውን ወደ ውጭ ይላኩ እና በማጣቀሻ ስክሪፕት ውስጥ ይሞክሩ። መልሶች በጣም ብዙ ቃላት ከሆኑ፣ የስርዓት ጥያቄዎችን ያስተካክሉ እና የሙቀት መጠኑን ይቀንሱ።
- ያጠቡ እና ይድገሙት፡ የመማሪያ ፍጥነትን፣ የዘመን ቆጠራን ይቀይሩ እና ጥራት የሌላቸውን ምሳሌዎች ይቀንሱ።
- የስኬት ማረጋገጫ፡ የእርስዎ ሞዴል የጎራ ጥያቄዎችን በአጭሩ ይመልሳል፣ ትክክለኛ ቃላትን ይጠቅሳል፣ እና ፖሊሲዎችን አይፈጥርም። እንደ ፈጠራ ጽሑፍ ተለማማጅዎ የሚጫወት ከሆነ፣ ከመጠን በላይ ተስተካክለዋል ወይም በበቂ ሁኔታ አላጸዱም።
ችግር መፍታት በጂፒዩ ውስጥ ይመታዎታል? እነዚህን ይሞክሩ
- “CUDA OOM”፡ የቡድን መጠኑን ይቀንሱ፣ የግራዲየንት ቼክ ፖይንትን ያንቁ ወይም 4-ቢት ይጠቀሙ። አሁንም ከተጣበቁ፣ ወደ ትንሽ ሞዴል ይቀይሩ ወይም ለመጨረሻው ዘመን ትልቅ ጂፒዩ ይከራዩ።
- “ኪሳራ አይንቀሳቀስም”፡ መጥፎ ውሂብ ወይም በጣም ትንሽ። የውሂብ ልዩነትን ይጨምሩ፣ የመማሪያ ፍጥነትን ይቀንሱ ወይም የLoRA ደረጃዎችዎ በጣም ትንሽ መሆናቸውን ያረጋግጡ።
- “ውጤቶቹ ጨዋነት የጎደላቸው/ያልተለመዱ ናቸው”፡ በአስተማሪ-የተስተካከሉ የመሠረት ሞዴሎች እና በውሂብ ስብስብዎ ውስጥ ወጥ የሆነ የምላሽ ቅርጸት በመጠቀም ዘይቤን ያስተካክሉ። ሞዴሎች የሚያዩትን ያስመስላሉ—እንደሚፈልጉት ያሰልጥኑ።
ተከላ፡ ከቤተ ሙከራ ወደ ላፕቶፕ (እና ከዚያም በላይ)
- የLoRA አስማሚዎችን ወደ ውጭ ይላኩ እና አስፈላጊ ከሆነ ያዋህዱ። ለጠርዝ መሣሪያዎች፣ ተንቀሳቃሽነትን ለማረጋገጥ አስማሚዎችን በተናጠል ያስቀምጡ። ለአገልጋዮች፣ ለቀላልነት እና ለፍጥነት ያዋህዱ።
- ለማጣቀሻ መጠናዊ ያድርጉ። በ4-ቢት ካሰለጠኑ፣ የመዘግየትን እና ታማኝነትን ለማመጣጠን 4-, 5- እና 8-ቢት ማጣቀሻን ይፈትሹ።
- የጥበቃ ሀዲዶችን ያክሉ። ምሳሌዎችን የያዘ ቀላል የጥያቄ መጠቅለያ አስደናቂ ነገሮችን ይሰራል። ወይም ተጠቃሚዎችዎን ከመምታቱ በፊት የማይረባ ነገርን የሚያጣራ ትንሽ የደንብ መፈተሻ ሞዴል ይጠቀሙ።
WebUI ወይስ CLI ለረጅም ጊዜ መምረጥ አለቦት?
- WebUI የእርስዎ ተወዳጅ የቡና ሱቅ ነው፡ ምቹ፣ ፈጣን፣ ዝቅተኛ ግጭት።
- CLI የእርስዎ የቤት ኩሽና ነው፡ ተጨማሪ ቁልፎች፣ ተጨማሪ ውጥንቅጥ፣ ተጨማሪ ቁጥጥር። በየሳምንቱ ጥሩ ማስተካከያ የሚያደርጉ ከሆነ፣ በመጨረሻ ስክሪፕቶች፣ የሙከራ መከታተያዎች እና ሊባዙ የሚችሉ አወቃቀሮችን ይፈልጋሉ። በ WebUI ይጀምሩ፣ ወደ CLI ይቀይሩ።
ልብ ሊባል የሚገባው፡ Sider.AI “ይህን በሦስተኛው ኤስፕሬሶ ላይ እንዳለሁ አስረዱልኝ” በሚሉት አፍታዎች ላይ ሊረዳ ይችላል። የእርስዎን ውቅር ወይም ምዝግቦች ወደ Sider.AI ቻት ከለጠፉ፣ ለማስተካከል መለኪያዎችን፣ የትኛውን የመማሪያ ደረጃ ሊያመልጥዎት እንደሚችል እና በተሳሳተ የመማሪያ ፍጥነት ሁለት ሰዓታት ከመጥለቅዎ በፊት የአእምሮ ጤንነት ማረጋገጫ ፈጣን ጥቆማዎችን ማግኘት ይችላሉ። እርስዎን እየመረመረ ሳይሆን እርስዎን እያፋጠነ ያለ ወዳጃዊ TA (ረዳት አስተማሪ) እንዳለዎት ነው። ፈጣን ንጽጽር፡ የትኛው መማሪያ ለየትኛው ሥራ ያሸንፋል
- ለአጠቃላይ ጀማሪዎች ምርጥ፡ የDataCamp WebUI መመሪያ (ግልጽ እርምጃዎች፣ ዘመናዊ ሞዴሎች)።
- “አሁን አሳየኝ” ለሚሉ ምርጥ፡ የYouTube ከጫፍ እስከ ጫፍ (ምስላዊ ፍሰት፣ ጠቅታዎቹን ይቅዱ)።
- ምንም ጭነት ለሌላቸው ሙከራዎች ምርጥ፡ የመካከለኛው የColab መመሪያ (በፍጥነት ያሂዱ፣ ትንሽ ያሳልፉ)።
የላቁ ተጨማሪዎች (ለማሳደግ ሲዘጋጁ)
- ከLoRA ያለፉ PEFT አስማሚዎች፡ የተለያዩ ደረጃዎችን እና አልፋዎችን ይሞክሩ። ትናንሽ ለውጦች፣ ትልቅ ተጽእኖዎች።
- የስርዓተ-ትምህርት ጥሩ ማስተካከያ፡ በመጀመሪያ በአጠቃላይ የመመሪያ ውሂብ ይጀምሩ፣ ከዚያ ወደ ጠባብ የጎራ ውሂብ ይሂዱ።
- የተቀላቀለ ትክክለኛነት እና የማስታወሻ ዘዴዎች፡ bf16 የሚደገፍ ከሆነ፤ ፍላሽ ትኩረት፤ ጂፒዩዎን እንዲያጉረመርም ያድርጉ።
- የግምገማ ስብስቦች፡ ብጁ የኢቫል ስብስብ እና ጥቂት የህዝብ ስራዎችን ይገንቡ። በቫል ስብስብዎ እና ትንሽ ከጎራ ውጪ ስብስብ መካከል ያለውን ልዩነት በመከታተል ከመጠን በላይ መስተካከልን ይከታተሉ።
እየነቀነቁ እንዳላስመሰሉ ትንሽ መዝገበ ቃላት
- LoRA፡ መላውን ግዙፍ ሞዴል ሳይሆን የሚያሠለጥኑዋቸው ቀልጣፋ አስማሚ ንብርብሮች። ጊዜን እና VRAM ይቆጥባል።
- QLoRA፡ ልክ እንደ LoRA፣ ነገር ግን መሰረታዊ ክብደቶች በስልጠና ወቅት ይጨመቃሉ (quantized)። ሄሎ፣ 4-ቢት።
- አስማሚ ማዋሃድ፡ ቀለል ያለ ተከላ ለማድረግ የአስማሚ ክብደቶችን ከመሠረታዊ ሞዴል ጋር ያዋህዱ።
- Tokenizer፡ ዓረፍተ ነገሮችን ወደ ቶከኖች የሚቆርጥ ነገር። የተሳሳተ ቶክኒዘር = የተመሰቃቀለ እንቁላል።
የእኔ አስተያየት፡ በየትኛው መማሪያ መጀመር አለብዎት?
የእርስዎ ግብ ወደ መጀመሪያው ስኬት መድረስ ከሆነ፣ በ DataCamp ይጀምሩ። ከዩቲዩብ የእግር ጉዞ ጋር ያጣምሩት—ይመልከቱ፣ ይጫኑ፣ ያሸንፉ። ከዚያ፣ ለሁለተኛው ሩጫዎ ሌላ መንገድ ለማየት የColab መመሪያን ያሽከርክሩ። አንድ ግዙፍ ርዕስ ከማንበብ ይልቅ ሁለት ትናንሽ ሩጫዎችን በማድረግ የበለጠ ይማራሉ። እና ጂፒዩዎ ከ HR ጋር ቅሬታ አያቀርብም።
የስተርን ማጠቃለያ፡ ጥሩ ማስተካከያ አሁን ሙሉ በሙሉ ሊሠራ የሚችል ነው። LLaMA-Factory “ተስፋ መቁረጥ ገደልን” የእጅ መውጫዎች ወዳለው ደረጃ ቀይሮታል። መማሪያ ይምረጡ፣ በትንሹ ይጀምሩ እና ይድገሙት። የእርስዎ የወደፊት ጥሩ ማስተካከያ ሞዴል የመመለሻ ፖሊሲዎን በማዛባት ላለማሳሳት ያመሰግንዎታል።
በእርግጥ የሚጠቀሙባቸው አገናኞች
- YouTube፡ ከጫፍ እስከ ጫፍ LLaMA-Factory ጥሩ የማስተካከል የእግር ጉዞ።
- DataCamp፡ LLaMA-Factory WebUI ለጀማሪዎች መመሪያ።
- መካከለኛ፡ Colab-ተኮር LLaMA-Factory ፈጣን ጅምር።
በ90 ሰከንዶች ውስጥ የድርጊት መርሃ ግብር
- የDataCamp መመሪያን ይምረጡ እና WebUIን ያዋቅሩ።
- ትንሽ የውሂብ ስብስብ ያዘጋጁ (500–1,000 ጥንዶች)። ንጹህ ያድርጉት።
- በQLoRA፣ 4-ቢት፣ ትናንሽ ስብስቦች ያሠለጥኑ።
- በ100 በእጅ በተመረጡ ጥያቄዎች ላይ ይገምግሙ።
- ሁለት ወይም ሶስት ጊዜ ይድገሙት። ከዚያ ወደ ረዘሙ ሩጫዎች እና ትላልቅ መረጃዎች ይቀይሩ።
አሁን ጠቃሚ የሆነ ነገር በጥሩ ሁኔታ ያስተካክሉ። እና ያስታውሱ፡ ጂፒዩዎ ቢጮህ፣ የሚለው “የቡድኑን መጠን ይቀንሱ” እያለ ብቻ ነው።
FAQ
Q1:እውነተኛ ጀማሪዎች ለመሆን ምርጡ የLLaMA-Factory መማሪያ የትኛው ነው?
ከ DataCamp የቀረበውን የ LLaMA-Factory WebUI መመሪያ ይጀምሩ—ግልጽ፣ ወቅታዊ እና Llama 3 ይጠቀማል። ስልጠና ከመጫንዎ በፊት የስኬት ምን እንደሚመስል እንዲያውቁ ከዩቲዩብ ከጫፍ እስከ ጫፍ የእግር ጉዞ ጋር ያጣምሩት።
Q2:በ Google Colab ላይ የLLaMA-Factory ሞዴሎችን በጥሩ ሁኔታ ማስተካከል እችላለሁ?
አዎ፣ የColab-ተኮር መማሪያ የ LLaMA-Factory ጥሩ ማስተካከያን በሚያስደንቅ ሁኔታ ህመም የሌለው ያደርገዋል። የክፍለ ጊዜዎን ጊዜ እና የ VRAM ገደቦችን ብቻ ይመልከቱ፣ የመፈተሻ ነጥቦችን ብዙ ጊዜ ያስቀምጡ እና ለመጀመሪያው ሩጫ የውሂብ ስብስቦችን ትንሽ ያድርጉ።
Q3:ከLLaMA-Factory ጋር LoRA ወይም QLoRA መጠቀም አለብኝ?
VRAM ላይ ገደብ ካለብዎ፣ QLoRA ጓደኛዎ ነው—4-ቢት ስልጠና፣ አነስተኛ የማስታወሻ አሻራ። ተጨማሪ የጂፒዩ የራስጌ ቦታ ካለዎት፣ መደበኛው LoRA ቀላል እና አሁንም ጥሩ ማስተካከያ ለማድረግ በጣም ቀልጣፋ ነው።
Q4:በስልጠና ወቅት የ CUDA ከማስታወሻ ውጪ ስህተቶችን እንዴት ማስተካከል እችላለሁ?
የቡድንዎን መጠን ይቀንሱ፣ የግራዲየንት ቼክ ፖይንትን ያብሩ እና 4-ቢት QLoRA ይጠቀሙ። ያ አሁንም ካልተሳካ፣ ትንሽ የመሠረት ሞዴል ይሞክሩ ወይም ለከባዱ እርምጃ ተጨማሪ VRAM ያለው ጂፒዩ ይከራዩ።
Q5:የእኔ የLLaMA-Factory ጥሩ ማስተካከያ በትክክል እንደሰራ እንዴት አውቃለሁ?
ትንሽ፣ ተጨባጭ የግምገማ ስብስብ ይገንቡ እና ከጥሩ ማስተካከያ በፊት እና በኋላ ውጤቶችን ያወዳድሩ። የእርስዎ ሞዴል በፍጥነት፣ በትክክል ከመለሰ እና የኩባንያዎን የእረፍት ጊዜ ፖሊሲ ካላሳሳተ፣ በትክክለኛው መንገድ ላይ ነዎት።