ಪರಿಚಯ: “ಮಾತಿನಲ್ಲಿ ಉಚಿತ, ಮ್ಯಾಜಿಕ್ನಲ್ಲಿ ಅಲ್ಲ” ಸಮಸ್ಯೆ
ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳ ವಿಷಯವೇನೆಂದರೆ, ಪ್ರತಿಯೊಬ್ಬರೂ ಅಡಿಟಿಪ್ಪಣಿಗಳಿಲ್ಲದೆ ಹೊಳಪು ಪ್ರದರ್ಶನಗಳಿಂದ ಫಲಿತಾಂಶಗಳನ್ನು ಬಯಸುತ್ತಾರೆ. ನೀವು TikTok ಗಳನ್ನು ನೋಡಿರಬಹುದು: ಒಂದು ಗುಂಡಿಯನ್ನು ಕ್ಲಿಕ್ ಮಾಡಿ, ಸೆಲ್ಲೋ ನುಡಿಸುವ ಫೋಟೊರಿಯಲಿಸ್ಟಿಕ್ ಡ್ರ್ಯಾಗನ್ ಹೊರಬರುತ್ತದೆ, ಮತ್ತು ಸ್ಪಷ್ಟವಾಗಿ ಅದು "ಉಚಿತ". ಒಂದು ನಾಯಿಯ ಮರಿಯಂತೆ ಉಚಿತ. ಅಥವಾ Home Depot ಕಾರ್ಟ್ ತುಂಬ ಮರದ ದಿಮ್ಮಿಗಳಂತೆ ಉಚಿತ—ನೀವು ಇನ್ನೂ ಮನೆಯನ್ನು ನಿರ್ಮಿಸಬೇಕಾಗಿದೆ.
ನೀವು ಸೃಷ್ಟಿಕರ್ತರಾಗಿದ್ದರೆ, ಪಿಚ್ ಅಪ್ರತಿಮವಾಗಿದೆ: ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು, ಸ್ಥಳೀಯ ನಿಯಂತ್ರಣ, ಭಯಾನಕ ನಿಯಮಗಳು ಮತ್ತು ಸೇವಾ ಅಡಿಟಿಪ್ಪಣಿಗಳಿಲ್ಲ, ಮತ್ತು ಮುಚ್ಚಿದ ಪ್ಲಾಟ್ಫಾರ್ಮ್ಗಳು ರುಚಿಕರವಾದ ಟಾಗಲ್ಗಳ ಗುಂಪಿನ ಹಿಂದೆ ವಿನಯದಿಂದ ಮರೆಮಾಡುವಂತಹ ಟ್ವೀಕಬಿಲಿಟಿ. ಆದರೆ ಒಂದು ಸುಕ್ಕು ಇದೆ. ದುಬಾರಿ, ಮೂರ್ಖತನದ ಕೆಲಸಗಳನ್ನು ಮಾಡದಂತೆ ನಿಮ್ಮನ್ನು ತಡೆಯಲು ಓಪನ್-ಸೋರ್ಸ್ ಪರಿಕರಗಳು ಉತ್ಪನ್ನ ವ್ಯವಸ್ಥಾಪಕರೊಂದಿಗೆ ಬರುವುದಿಲ್ಲ. ಅವು 2 a.m ಗೆ ಎಸ್ಪ್ರೆಸೊ ಕುಡಿಯುವ ಮತ್ತು ನೀವು ಸಹ PyTorch ಅನ್ನು ಮೂಲದಿಂದ ಕಂಪೈಲ್ ಮಾಡಲು ಬಯಸುತ್ತೀರಿ ಎಂದು ನಿಜವಾಗಿಯೂ ನಂಬುವ ಜನರು ಬರೆದ Readme ಗಳೊಂದಿಗೆ ಬರುತ್ತವೆ.
ಆದ್ದರಿಂದ ಇದನ್ನು ಸರಿಯಾಗಿ ತೂಕ ಮಾಡೋಣ. ಚೀರ್ಲೀಡಿಂಗ್ನಿಂದ ಅಲ್ಲ, ಸೋಲುವಾದದಿಂದಲೂ ಅಲ್ಲ. ಇಲ್ಲಿ ಸೃಷ್ಟಿಕರ್ತರಿಗೆ ನಿಜವಾಗಿಯೂ ಯಾವುದು ಉತ್ತಮ ಎಂಬುದನ್ನು GitHub ನಕ್ಷತ್ರಗಳ ರಾತ್ರಿಯಲ್ಲಿ ರೋಮಾಂಚನಕಾರಿಯಾಗಿ ಕಾಣುವುದರಿಂದ ಬೇರ್ಪಡಿಸುವುದು ಗುರಿಯಾಗಿದೆ.
“ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು” ಎಂಬುದು ತಪ್ಪು ಪ್ರಶ್ನೆ (ಆದರೆ ಇನ್ನೂ ಉಪಯುಕ್ತವಾಗಿದೆ)
ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ನೀವು ಏನು ಮಾಡುತ್ತಿದ್ದೀರಿ ಎಂಬುದರ ಮೇಲೆ ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ: ವಿವರಣೆ, ಫೋಟೋ ಸಂಪಾದನೆ, 3D, ಪರಿಕಲ್ಪನೆಯ ಕಲೆ, ಅನಿಮೇಷನ್ ಫ್ರೇಮ್ಗಳು, ವಿನ್ಯಾಸ ಮಾಕ್ಅಪ್ಗಳು ಅಥವಾ ಪೂರ್ಣ ಪ್ರಮಾಣದ ಆಸ್ತಿ ಪೈಪ್ಲೈನ್ಗಳು. ಒಂದೇ "ಅತ್ಯುತ್ತಮ" ವನ್ನು ಕೇಳುವುದು ಅತ್ಯುತ್ತಮ ಚಾಕುವನ್ನು ಕೇಳಿದಂತಿದೆ: ಬಾಣಸಿಗನ ಚಾಕು, ಪೇರಿಂಗ್ ಚಾಕು ಅಥವಾ ಟೊಮೆಟೊವನ್ನು ಅದರತ್ತ ನೋಡುವ ಮೂಲಕ ಕತ್ತರಿಸುವ ಜಪಾನೀಸ್ ಗ್ಯುಟೊ? ಪ್ರಾಮಾಣಿಕ ಉತ್ತರವೆಂದರೆ "ಅದು ಅವಲಂಬಿಸಿರುತ್ತದೆ", ನಂತರ ನಿಜವಾದ ವಿನಿಮಯಗಳ ವಿವರಣೆ.
ಉಪಯುಕ್ತ ಪ್ರಶ್ನೆಯೆಂದರೆ: ಸೃಷ್ಟಿಕರ್ತರು ನಿಜವಾಗಿ ಎದುರಿಸುವ ಪ್ರಮುಖ ಕಾರ್ಯಗಳನ್ನು ಯಾವ ಓಪನ್-ಸೋರ್ಸ್ ಪರಿಕರಗಳು ಒಳಗೊಳ್ಳುತ್ತವೆ? ಮತ್ತು ಯಾವುದು ನಿಮ್ಮನ್ನು ಅವಲಂಬನೆಯ ನರಕಕ್ಕೆ ಎಳೆಯುವ ಬದಲು ದಾರಿಯಿಂದ ಹೊರಬರುತ್ತವೆ?
ಮುಖ್ಯವಾದ ಕೆಲಸಗಳು, Buzzwords ಅಲ್ಲ
- ವೇಗದ ಕಲ್ಪನೆ: ಚಿತ್ರಕ್ಕೆ ಸ್ಕೆಚ್, ಸಂಯೋಜನೆಗೆ ಪ್ರಾಂಪ್ಟ್ ಮತ್ತು ನಕಲಿನ ನಕಲಿಯಂತೆ ಕಾಣದ ವ್ಯತ್ಯಾಸಗಳು.
- ವಿವರ ನಿಯಂತ್ರಣ: ಮರೆಮಾಚುವಿಕೆ, ಇನ್ಪೇಂಟಿಂಗ್, ಸ್ಥಿರವಾದ ಪಾತ್ರ ಮತ್ತು ಶೈಲಿ, ನಿಯಂತ್ರಿಸಬಹುದಾದ ಆಳ ಮತ್ತು ಭಂಗಿ.
- ಫೋಟೊರಿಯಲಿಸಂ vs. ಶೈಲೀಕರಣ: ನೀವು ಒಂದೇ ಸೌಂದರ್ಯವನ್ನು ಆರಿಸಿಕೊಂಡು ಅದರೊಂದಿಗೆ ಬದುಕಬೇಕಾಗಿಲ್ಲ—ನೀವು ಬಯಸಿದರೆ ಹೊರತು.
- ಸ್ಥಳೀಯ ಗೌಪ್ಯತೆ ಮತ್ತು ವೆಚ್ಚ: ನಿಮ್ಮ GPU ನಲ್ಲಿ ರನ್ ಮಾಡಿ, ನಿಮ್ಮ ಕ್ರೆಡಿಟ್ ಕಾರ್ಡ್ನಲ್ಲಿ ಅಲ್ಲ.
- ಪೈಪ್ಲೈನ್ ಸ್ನೇಹಪರತೆ: ಸ್ಕ್ರಿಪ್ಟಬಲ್, ಸ್ವಯಂಚಾಲಿತ, ಮತ್ತು ನೀವು CUDA ಹತ್ತಿರ ಸೀನಿದಾಗ ಮುರಿಯುವುದಿಲ್ಲ.
ಅದನ್ನು ಗಮನದಲ್ಲಿಟ್ಟುಕೊಂಡು, ಸೃಷ್ಟಿಕರ್ತರಿಗೆ ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಎಲ್ಲಿ ನಿಜವಾಗಿಯೂ ಹೊಳೆಯುತ್ತವೆ—ಮತ್ತು ಅವು ಎಲ್ಲಿ ಮಾಡುವುದಿಲ್ಲ.
Stable Diffusion (SD 1.5, SDXL): ಅಭಿಪ್ರಾಯಗಳನ್ನು ಹೊಂದಿರುವ ವರ್ಕ್ಹಾರ್ಸ್
ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಉತ್ಪಾದನೆಯು ಮ್ಯಾಸ್ಕಾಟ್ ಹೊಂದಿದ್ದರೆ, ಅದು Stable Diffusion ಆಗಿದೆ. ಪ್ರತಿ ಮಾನದಂಡದಲ್ಲೂ ಹಾಟೆಸ್ಟ್ ಮಾದರಿಯಲ್ಲ, ಆದರೆ ಕೆಲಸಕ್ಕೆ ಹಾಜರಾಗುವ ಮತ್ತು ವೆಚ್ಚ ವರದಿಯನ್ನು ಸಲ್ಲಿಸದ ಒಂದು. SD 1.5 ಶೈಲೀಕೃತ ವಿವರಣೆ ಮತ್ತು ಪರಿಕಲ್ಪನೆಗೆ ಇನ್ನೂ ಹಾಸ್ಯಾಸ್ಪದವಾಗಿ ಉಪಯುಕ್ತವಾಗಿದೆ; SDXL ಡೇಟಾಸೆಂಟರ್ ಅಗತ್ಯವಿಲ್ಲದೇ ಸಂಯೋಜನೆ ಮತ್ತು ವಿವರಗಳಿಗಾಗಿ ಸೀಲಿಂಗ್ ಅನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.
ಸೃಷ್ಟಿಕರ್ತರು ಅದನ್ನು ಏಕೆ ಇಟ್ಟುಕೊಳ್ಳುತ್ತಾರೆ:
- ದೋಷಕ್ಕೆ ಟ್ವೀಕಬಲ್: ಮಾದರಿ ರೂಪಾಂತರಗಳು, LoRA ಫೈನ್-ಟ್ಯೂನ್ಗಳು, ಭಂಗಿ, ಆಳ, ಅಂಚುಗಳಿಗಾಗಿ ControlNet ಮಾಡ್ಯೂಲ್ಗಳು—ಮೂಲಭೂತವಾಗಿ ಸಂಯೋಜನೆಗೆ ಚೀಟ್ ಕೋಡ್ಗಳು.
- ಸ್ಥಳೀಯ-ಮೊದಲು: ನೀವು ಅದನ್ನು ಮಧ್ಯಮ ಶ್ರೇಣಿಯ GPU ನಲ್ಲಿ ರನ್ ಮಾಡಬಹುದು. 8–12GB VRAM ನಿಮ್ಮನ್ನು ಎಲ್ಲೋ ಕರೆದೊಯ್ಯುತ್ತದೆ; 24GB ಅದನ್ನು ಆಹ್ಲಾದಕರವಾಗಿಸುತ್ತದೆ.
- ಪರಿಸರ ವ್ಯವಸ್ಥೆಯ ಗುರುತ್ವಾಕರ್ಷಣೆ: ಪ್ರತಿಯೊಂದು ಸಾಧನವು Stable Diffusion ನೊಂದಿಗೆ ಸಂಯೋಜನೆಗೊಳ್ಳುತ್ತದೆ. ಅದು ಪರಿಪೂರ್ಣವಾಗಿರುವುದರಿಂದಲ್ಲ, ಆದರೆ ಅದು ಎಲ್ಲೆಡೆ ಇರುವುದರಿಂದ.
ಅದು ಎಲ್ಲಿ ಎಡವುತ್ತದೆ:
- ಫೋಟೊರಿಯಲಿಸಂ ವ್ಯತ್ಯಾಸಗಳು: ಕೈಗಳು ಉತ್ತಮಗೊಂಡವು, ನಂತರ ಚೆಕ್ಪಾಯಿಂಟ್ಗಳನ್ನು ಅವಲಂಬಿಸಿ ಮತ್ತೆ ವಿಚಿತ್ರವಾದವು.
- ಪ್ರೇರೇಪಿಸುವ ವೂಡೂ: “ಅತ್ಯುತ್ತಮ ಗುಣಮಟ್ಟ, ಮೇರುಕೃತಿ” ಕೆಲಸ ಮಾಡಬಾರದು ಆದರೆ ಕೆಲವೊಮ್ಮೆ ಅದು ಮಾಡುತ್ತದೆ. ಅದು ವೈಶಿಷ್ಟ್ಯವಲ್ಲ, ಅದು ಒಂದು ಮೂಢನಂಬಿಕೆ.
- ಸೆಟಪ್ ಓವರ್ಹೆಡ್: “ಒಂದು-ಕ್ಲಿಕ್” ಸ್ಥಾಪಕವು ಯಾವಾಗಲೂ ಒಂದು ಕ್ಲಿಕ್ ಜೊತೆಗೆ 14 ಡ್ರೈವರ್ ನವೀಕರಣಗಳು.
ಅದನ್ನು ಬಳಸಲು ಉತ್ತಮ ಮಾರ್ಗ:
- ವ್ಯಾಪಕ, ಶ್ರೀಮಂತ ಸಂಯೋಜನೆಗಳು ಮತ್ತು ಮುದ್ರಣ-ಸ್ನೇಹಿ ವಿವರಗಳಿಗಾಗಿ SDXL.
- ಶೈಲೀಕೃತ ಕೆಲಸ, ಅನಿಮೆ ಮತ್ತು ವೇಗಕ್ಕಾಗಿ SD 1.5.
- ಭಂಗಿ/ಆಳಕ್ಕಾಗಿ ControlNet ಅನ್ನು ಸೇರಿಸಿ. ಸ್ಥಿರವಾದ ಪಾತ್ರಗಳು ಅಥವಾ ಉತ್ಪನ್ನ ಶೈಲಿಗಳಿಗಾಗಿ LoRA ಗಳನ್ನು ಬಳಸಿ. ನಿಮ್ಮ ಮಾದರಿ ಮೃಗಾಲಯವನ್ನು ಚಿಕ್ಕದಾಗಿ ಇರಿಸಿ—ಸಂಗ್ರಹಣೆಗಿಂತ ಕ್ಯುರೇಶನ್ ಉತ್ತಮ.
ComfyUI ಮತ್ತು Automatic1111: ಒಂದೇ ಪರ್ವತಕ್ಕೆ ಎರಡು ಮಾರ್ಗಗಳು
ಸರಳವಾಗಿ ಹೇಳೋಣ: ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಕೇವಲ ಮಾದರಿಗಳಲ್ಲ. ಅವು ನಿಮ್ಮ ಮನಸ್ಸನ್ನು ಕಳೆದುಕೊಳ್ಳದಂತೆ ನಿಮ್ಮನ್ನು ತಡೆಯುವ ಇಂಟರ್ಫೇಸ್ಗಳಾಗಿವೆ. ಬೆಟ್ಟದ ಇಬ್ಬರು ರಾಜರು: ComfyUI ಮತ್ತು Automatic1111.
Automatic1111 (A1111):
- ಪರ: ದೊಡ್ಡ ಸ್ನೇಹಪರ ಗುಂಡಿಗಳು, ಟನ್ಗಳಷ್ಟು ವಿಸ್ತರಣೆಗಳು, ಸುಲಭವಾದ ಪ್ರಾಂಪ್ಟ್ ಫಿಡ್ಲಿಂಗ್.
- ಕಾನ್ಸ್: ಸರಳವಾಗಿ ಪ್ರಾರಂಭವಾಗುತ್ತದೆ, ನೀವು ಎಲ್ಲವನ್ನೂ ಸಕ್ರಿಯಗೊಳಿಸಿದರೆ ಸ್ವೀಸ್ ಆರ್ಮಿ ಚೈನ್ಸಾಗುತ್ತದೆ.
- ಯಾರಿಗೆ ಉತ್ತಮ: ಸಿಸ್ಟಮ್ಸ್ ಎಂಜಿನಿಯರಿಂಗ್ ಪದವಿ ಅಗತ್ಯವಿಲ್ಲದ GUI ನೊಂದಿಗೆ ತ್ವರಿತ ಪುನರಾವರ್ತನೆ ಬಯಸುವ ಸೃಷ್ಟಿಕರ್ತರಿಗೆ.
ComfyUI:
- ಪರ: ನೋಡ್-ಗ್ರಾಫ್ ನಿಯಂತ್ರಣ, ಪುನರಾವರ್ತಿಸಬಹುದಾದ ಪೈಪ್ಲೈನ್ಗಳು, ಮಾಡ್ಯುಲರ್, ವೇಗ. ಸೆಟ್ಟಿಂಗ್ಗಳ ಮೂಲದ ಬಗ್ಗೆ ನೀವು ಕಾಳಜಿ ವಹಿಸಿದರೆ ಸುಂದರವಾಗಿರುತ್ತದೆ.
- ಕಾನ್ಸ್: ನಿಮ್ಮ ಮೊದಲ ಗ್ರಾಫ್ ಪಿತೂರಿ ಮಂಡಳಿಯಂತೆ ಕಾಣುತ್ತದೆ. ನಿಮ್ಮ ಎರಡನೇ ಗ್ರಾಫ್ ಸಹ ಕಾಣುತ್ತದೆ.
- ಯಾರಿಗೆ ಉತ್ತಮ: ಪುನರುತ್ಪಾದನೆ, ಬ್ಯಾಚ್ ಮಾಡಬಹುದಾದ ವರ್ಕ್ಫ್ಲೋಗಳು ಮತ್ತು ಗಂಭೀರ ControlNet ನೃತ್ಯ ಸಂಯೋಜನೆ ಬಯಸುವ ಪವರ್ ಬಳಕೆದಾರರು ಮತ್ತು ತಂಡಗಳಿಗೆ.
ತೀರ್ಪು: ನೀವು ಹೊಸಬರಾಗಿದ್ದರೆ, Automatic1111 ನಲ್ಲಿ ಪ್ರಾರಂಭಿಸಿ. ನೀವು ಪೈಪ್ಲೈನ್ ಅನ್ನು ನಿರ್ಮಿಸುತ್ತಿದ್ದರೆ ಅಥವಾ ಸಹಕರಿಸುತ್ತಿದ್ದರೆ, ComfyUI ಗೆ ಪದವಿ ಪಡೆಯಿರಿ. ನಿಮ್ಮ ಸೂಚನೆಗಳ ಪಟ್ಟಿಯನ್ನು ಸೆಳೆಯುವುದನ್ನು ನೀವು ಆನಂದಿಸುತ್ತೀರಾ ಎಂಬುದರ ಮೇಲೆ "ಅತ್ಯುತ್ತಮ" ಅವಲಂಬಿತವಾಗಿರುತ್ತದೆ.
Krita + Stable Diffusion ಪ್ಲಗಿನ್ಗಳು: ನಿಜವಾದ ಕಲಾವಿದನ ಕಾರ್ಯವಿಧಾನ
Krita ಹೊಸತೇನಲ್ಲ, ಆದರೆ ಇದು AI ಅನ್ನು ವರ್ಣಚಿತ್ರಕಾರನ ಕಾರ್ಯವಿಧಾನಕ್ಕೆ ಹೊಂದಿಸುವ ವಿಧಾನವು ಹೆಚ್ಚಿನದಕ್ಕಿಂತ ಉತ್ತಮವಾಗಿದೆ. ಇನ್ಪೇಂಟಿಂಗ್ ನೈಸರ್ಗಿಕವಾಗಿ ಭಾಸವಾಗುತ್ತದೆ. ಮರೆಮಾಚುವಿಕೆ ನಂತರದ ಆಲೋಚನೆಯಲ್ಲ. ಇದು ಲೇಯರ್ಗಳು, ಬ್ರಷ್ಗಳು ಮತ್ತು ಕೈ ನಿಯಂತ್ರಣವನ್ನು ಗೌರವಿಸುತ್ತದೆ.
- ಹೊಂದಾಣಿಕೆ: ಇದು "ನಿಜವಾದ ಕಲಾ ಅಪ್ಲಿಕೇಶನ್ನಲ್ಲಿ AI", "ವೆಬ್ ಡೆಮೊಗೆ ಜೋಡಿಸಲಾದ ಕಲೆ" ಅಲ್ಲ.
- ತೊಂದರೆ: ನಿಮ್ಮ ಸ್ಥಳೀಯ SD ಸ್ಟಾಕ್ ಸುಗಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಅಗತ್ಯವಿದೆ. ಆದರೆ ಒಮ್ಮೆ ಅದು ಕಾರ್ಯರೂಪಕ್ಕೆ ಬಂದರೆ, Krita ಜೊತೆಗೆ ಇನ್ಪೇಂಟಿಂಗ್ ನೀವು ನಿಲ್ಲಿಸುತ್ತಿರುವ ಕಾರಿನಲ್ಲಿ ಕ್ಲಚ್ ಪೆಡಲ್ ಅನ್ನು ಹುಡುಕಿದಂತೆ ಭಾಸವಾಗುತ್ತದೆ.
InvokeAI: ಸೂಕ್ಷ್ಮ ಮಧ್ಯ
InvokeAI ದೊಡ್ಡದಾಗಿರಲು ಪ್ರಯತ್ನಿಸುವುದಿಲ್ಲ; ಅದು ಶಾಂತವಾಗಿರಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ. ಕ್ಲೀನ್ UI, ಉತ್ತಮ ಡೀಫಾಲ್ಟ್ಗಳು, ಘನ ಇನ್ಪೇಂಟಿಂಗ್/ಔಟ್ಪೇಂಟಿಂಗ್ ಮತ್ತು "models/Stable-diffusion" ಎಂಬ ಹೆಸರಿನ ಫೋಲ್ಡರ್ Stable Diffusion ಗಾಗಿ ಉದ್ದೇಶಿಸಲಾಗಿದೆಯೇ ಅಥವಾ ಸ್ಥಿರತೆಗಾಗಿ ಉದ್ದೇಶಿಸಲಾಗಿದೆಯೇ ಎಂದು ನಿಮ್ಮನ್ನು ಆಶ್ಚರ್ಯಪಡಿಸದ ಮಾದರಿ ವ್ಯವಸ್ಥಾಪಕ. Automatic1111 ಬೀದಿ ಮಾರುಕಟ್ಟೆಯಾಗಿದ್ದರೆ ಮತ್ತು ComfyUI ಪ್ರಯೋಗಾಲಯವಾಗಿದ್ದರೆ, InvokeAI ಸ್ಟುಡಿಯೋ ಆಗಿದೆ.
- ಯಾರಿಗೆ ಉತ್ತಮ: ಕಡಿಮೆ ಒರಟು ಅಂಚುಗಳು ಮತ್ತು ಉತ್ತಮ ದಾಖಲಾತಿಗಳನ್ನು ಹೊಂದಿರುವ ಸ್ಥಿರ, ಬೆಂಬಲಿತ ಓಪನ್-ಸೋರ್ಸ್ ಪರಿಕರವನ್ನು ಬಯಸುವ ಸೃಷ್ಟಿಕರ್ತರಿಗೆ.
- ದೌರ್ಬಲ್ಯ: ಸಣ್ಣ ಪ್ಲಗಿನ್ ಬ್ರಹ್ಮಾಂಡ. ಅದು ವೈಶಿಷ್ಟ್ಯವಾಗಿರಬಹುದು.
ControlNet: ನಿಯಂತ್ರಣ ಹುಚ್ಚರಿಗಾಗಿ ರಹಸ್ಯ ಸಾಸ್ (ಅಂದರೆ, ಕಲಾವಿದರು)
"AI ತನಗೆ ಬೇಕಾದುದನ್ನು ಮಾಡುತ್ತದೆ" ಎಂಬುದು ಒಂದು ನೆಪವಾಗಿ ನಿಲ್ಲಲು ControlNet ಕಾರಣವಾಗಿದೆ. ಅಂಚಿನ ನಕ್ಷೆ, ಆಳ ನಕ್ಷೆ, ಭಂಗಿಯ ಅಸ್ಥಿಪಂಜರ ಅಥವಾ ಸಾಮಾನ್ಯ ನಕ್ಷೆಯಲ್ಲಿ ಉತ್ಪಾದನೆಯನ್ನು ಕಂಡೀಷನ್ ಮಾಡಿ ಮತ್ತು ಇದ್ದಕ್ಕಿದ್ದಂತೆ ನಿಮ್ಮ ಪರಿಕಲ್ಪನೆಯ ಕಲೆ ವೈಬ್ಗಳ ಬದಲು ರಚನೆಯನ್ನು ಹೊಂದಿರುತ್ತದೆ.
- ನಿಜವಾಗಿ ಮುಖ್ಯವಾದ ಬಳಕೆಯ ನಿದರ್ಶನಗಳು:
- ಸ್ಥಿರವಾದ ಪಾತ್ರಗಳಿಗಾಗಿ ಭಂಗಿಯಿಂದ ಚಿತ್ರಕ್ಕೆ.
- ಸಂಯೋಜನೆಯನ್ನು ಹಾಗೇ ಉಳಿಸಿಕೊಳ್ಳಲು ಆಳದಿಂದ ಚಿತ್ರಕ್ಕೆ.
- ನಿಮ್ಮ ಸ್ಕೆಚ್ ಮಾದರಿಯಿಂದ ನಿರ್ಲಕ್ಷಿಸುವುದನ್ನು ನಿಲ್ಲಿಸಲು Canny/Lineart.
- ಎಚ್ಚರಿಕೆ: ಹೆಚ್ಚಿನ ControlNet ಗಳು ಯಾವಾಗಲೂ ಉತ್ತಮವಾಗಿರುವುದಿಲ್ಲ. ಒಂದು ಅಥವಾ ಎರಡು ಬಲವಾದ ಸಂಕೇತಗಳು ಐದು ಸೌಮ್ಯ ಸಲಹೆಗಳನ್ನು ಸೋಲಿಸುತ್ತವೆ.
LoRA ಮತ್ತು Textual Inversion: ಮೊಕದ್ದಮೆಯಿಲ್ಲದ ಶೈಲಿ
ಪೂರ್ಣ ಉತ್ತಮಗೊಳಿಸುವಿಕೆಗಳು ಭಾರವಾಗಿರುತ್ತದೆ. ಸಂಪೂರ್ಣ ಮಾದರಿಯ ಮೆದುಳನ್ನು ಪುನಃ ಬರೆಯದೆ ಶೈಲಿ, ಪಾತ್ರ ಅಥವಾ ಉತ್ಪನ್ನದ ಸನ್ನಿವೇಶದಲ್ಲಿ ಸ್ಲಾಟ್ ಮಾಡಲು LoRA ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ. Textual inversion ಪಾಕೆಟ್ನೈಫ್ ಆವೃತ್ತಿಯಾಗಿದೆ—ನಿಮ್ಮ ನೋಟದ ಕಡೆಗೆ ಮಾದರಿಯನ್ನು ತಳ್ಳುವ ಸಣ್ಣ ಕಲಿತ ಟೋಕನ್ಗಳು.
- ಸಣ್ಣದಾಗಿ ತರಬೇತಿ ನೀಡಿ; ಪ್ರತಿ ಚಿತ್ರವು ಒಂದೇ ಪೋಸ್ಟರ್ ಆಗುವವರೆಗೆ ಅತಿಯಾದ ಹೊಂದಾಣಿಕೆ ಉತ್ತಮವಾಗಿ ಕಾಣುತ್ತದೆ.
- ನೀವು ಪದೇ ಪದೇ ಅಗತ್ಯವಿರುವ ಪಾತ್ರಗಳು ಮತ್ತು ಬ್ರ್ಯಾಂಡ್ಗಳಿಗಾಗಿ ಲೈಬ್ರರಿಯನ್ನು ಇರಿಸಿ.
- ನಿಮ್ಮ ಕಲಿಕೆಯ ದರಗಳು ಮತ್ತು ಹಂತಗಳನ್ನು ಡಾಕ್ಯುಮೆಂಟ್ ಮಾಡಿ, ಅಥವಾ ನೀವು ಪ್ರತಿ ತಿಂಗಳು ನಿಮ್ಮ ತಪ್ಪುಗಳನ್ನು ಪುನಃ ಕಂಡುಹಿಡಿಯುತ್ತೀರಿ.
ಅಪ್ಸ್ಕೇಲರ್ಗಳು: ESRGAN, 4x-UltraSharp ಮತ್ತು "ಸಾಕಷ್ಟು ನೈಜವಾಗಿ ಕಾಣುತ್ತದೆ" ಪರೀಕ್ಷೆ
AI ಅಪ್ಸ್ಕೇಲಿಂಗ್ ಹಾಡದ ಹೀರೋ. ಉತ್ತಮ 2x ಅಥವಾ 4x ಪಾಸ್ ಉತ್ಪಾದಿತ ಚಿತ್ರವನ್ನು ನೀಡುವ ವಿಚಿತ್ರವಾದ ಮಂಜನ್ನು ಸರಿಪಡಿಸಬಹುದು.
- ESRGAN ಮತ್ತು Real-ESRGAN ರೂಪಾಂತರಗಳು: ಘನ, ವೇಗ, ಲೈನ್ ಆರ್ಟ್ ಮತ್ತು ಟೆಕಶ್ಚರ್ಗಳಲ್ಲಿ ಉತ್ತಮ.
- SDXL ಒಳಗೆ ಸುಪ್ತ ಅಪ್ಸ್ಕೇಲರ್ಗಳು: ಛಾಯಾಚಿತ್ರದ ನೋಟಗಳಿಗೆ ಹೆಚ್ಚಾಗಿ ಕ್ಲೀನರ್.
- ಹೆಬ್ಬೆರಳಿನ ನಿಯಮ: ಜಂಕ್ ಅನ್ನು ಅಪ್ಸ್ಕೇಲ್ ಮಾಡಬೇಡಿ. ಮೊದಲು ಮೂಲ ಚಿತ್ರವನ್ನು ಸುಧಾರಿಸಿ (ಪ್ರಾಂಪ್ಟ್, ಹಂತಗಳು, CFG, ಉತ್ತಮ ಚೆಕ್ಪಾಯಿಂಟ್), ನಂತರ ಅಪ್ಸ್ಕೇಲ್ ಮಾಡಿ.
Deforum ಮತ್ತು Animatediff: ಯಾವಾಗ ನಿಶ್ಚಲತೆ ಸಾಕಾಗುವುದಿಲ್ಲ
ನೀವು ಚಲನೆಗೆ ಧುಮುಕುತ್ತಿದ್ದರೆ, Deforum (ಸುಪ್ತ ಜಾಗದ ಮೂಲಕ ಕ್ಯಾಮೆರಾ ಮಾರ್ಗಗಳು) ಮತ್ತು Animatediff (Stable Diffusion ಗಾಗಿ ತಾತ್ಕಾಲಿಕ ಸುಸಂಬದ್ಧತೆ) ಓಪನ್-ಸೋರ್ಸ್ ಗೇಟ್ವೇಗಳಾಗಿವೆ. ಕಲಿಕೆಯ ವಕ್ರರೇಖೆಯು ಮೆಟ್ಟಿಲುಗಳಾಗಿ ಬದಲಾಗುವ ಹೈಕಿಂಗ್ ಟ್ರಯಲ್ ಅನ್ನು ಹೋಲುತ್ತದೆ, ಆದರೆ ಲಾಭಾಂಶ—ಲೂಪಿಂಗ್ ಅನಿಮೇಟೆಡ್ ಟೆಕಶ್ಚರ್ಗಳು, ಪರಿಕಲ್ಪನೆಯ ರೀಲ್ಗಳು, ಚಲನೆಯ ಪ್ರಯೋಗಗಳು—ನಿಜವಾಗಿದೆ.
- ಸಣ್ಣ ಲೂಪ್ಗಳೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ. ಚಲನೆಯು ತಪ್ಪುಗಳನ್ನು ಗುಣಿಸುತ್ತದೆ.
- ನೀವು ಸ್ಥಿರತೆಯನ್ನು ಬಯಸಿದಾಗ ಬೀಜಗಳನ್ನು ಲಾಕ್ ಮಾಡಿ.
- ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಬಿಗಿಯಾಗಿ ಇರಿಸಿ; ಡ್ರಿಫ್ಟಿಂಗ್ ಭಾಷೆ ಡ್ರಿಫ್ಟಿಂಗ್ ಫ್ರೇಮ್ಗಳಿಗೆ ಸಮನಾಗಿರುತ್ತದೆ.
ಫೋಟೊರಿಯಲಿಸಂ: SDXL ಫೋಟೊರಿಯಲ್, ಲೈಟಿಂಗ್ LoRA ಗಳು ಮತ್ತು ರಿಯಾಲಿಟಿ ಚೆಕ್ಗಳು
ಉತ್ಪನ್ನದ ಶಾಟ್ಗಳು ಮತ್ತು ಜನರಿಗೆ, ನಿಮಗೆ ವಿಭಿನ್ನ ಮನಸ್ಥಿತಿ ಬೇಕು. ಮ್ಯಾಜಿಕ್ ಪದಗಳಿಗಿಂತ ಲೈಟಿಂಗ್ LoRA ಗಳು ಹೆಚ್ಚು ಮುಖ್ಯ. ಉಲ್ಲೇಖ ಚಿತ್ರಗಳು (ಕಡಿಮೆ ಡಿನಾಯ್ಸ್ನೊಂದಿಗೆ ಚಿತ್ರದಿಂದ ಚಿತ್ರಕ್ಕೆ) ಇನ್ನೂ ಮುಖ್ಯವಾಗಿದೆ.
- ನಿಯಂತ್ರಿತ ಬೆಳಕಿಗಾಗಿ ಗುರಿ ಮಾಡಿ: ಸಾಫ್ಟ್ಬಾಕ್ಸ್ ನೋಟ, ಬ್ಯಾಕ್ಲೈಟ್ ಬೇರ್ಪಡಿಕೆ, ನೀವು ವಿವರಿಸಬಹುದಾದ ಪ್ರತಿಫಲನಗಳು.
- ControlNet ಮೂಲಕ ಉಲ್ಲೇಖ ಭಂಗಿಗಳನ್ನು ಬಳಸಿ. ಫೋಟೊರಿಯಲ್ ಸಂಯೋಜನೆಯು 90% ಜ್ಯಾಮಿತಿ ಮತ್ತು ಬೆಳಕು, ಮಂತ್ರಗಳಲ್ಲ.
- ಮುಖಗಳನ್ನು ಎಚ್ಚರಿಕೆಯಿಂದ ಪರಿಗಣಿಸಿ: ಮುಖದ ಪುನಃಸ್ಥಾಪನೆಯನ್ನು ಮಿತವಾಗಿ ಸೇರಿಸಿ. ತುಂಬಾ ಜಾಸ್ತಿಯಾದರೆ ಪ್ರತಿಯೊಬ್ಬರೂ 1987 ರಿಂದ ಸೋಪ್ ಒಪೆರಾದಂತೆ ಕಾಣುತ್ತಾರೆ.
AI ಜ್ಯೂಸ್ನೊಂದಿಗೆ ಓಪನ್-ಸೋರ್ಸ್ ಚಿತ್ರ ಸಂಪಾದಕರು: GIMP, Krita ಮತ್ತು ಸ್ನೇಹಿತರು
- AI ಪ್ಲಗಿನ್ಗಳೊಂದಿಗೆ GIMP: ಸ್ವಲ್ಪ ಒರಟು, ಆದರೆ ಬ್ಯಾಚ್ ಸಂಪಾದನೆಗಳು ಮತ್ತು ಮುಖವಾಡಗಳಿಗೆ ಸಮರ್ಥವಾಗಿದೆ.
- Krita (ಮತ್ತೆ): ನೈಸರ್ಗಿಕ ವರ್ಣಚಿತ್ರ, ಆರಾಮದಾಯಕ ಇನ್ಪೇಂಟಿಂಗ್.
- Blender (ಹೌದು, Blender): ಸ್ವತಃ ಒಂದು ಚಿತ್ರ ಸಾಧನವಲ್ಲ, ಆದರೆ ನೀವು ಟೆಕಶ್ಚರ್ಗಳು, ಲೈಟಿಂಗ್ ಉಲ್ಲೇಖಗಳು ಅಥವಾ ಹಿನ್ನೆಲೆ ಪ್ಲೇಟ್ಗಳನ್ನು ಉತ್ಪಾದಿಸುತ್ತಿದ್ದರೆ, Blender ಜೊತೆಗೆ AI ಟೆಕಶ್ಚರ್ ಅಪ್ಸ್ಕೇಲಿಂಗ್ ಒಂದು ಪವರ್ ಕಾಂಬೊ ಆಗಿದೆ.
ಹಾರ್ಡ್ವೇರ್: ಯಾರೂ ಓದಲು ಬಯಸದ ಭಾಗ (ಆದರೆ ಪ್ರತಿಯೊಬ್ಬರೂ ಪಾವತಿಸುತ್ತಾರೆ)
- VRAM ನಿಮ್ಮ ಜೀವನವನ್ನು ನಿಯಂತ್ರಿಸುತ್ತದೆ. 8GB ನೆಲವಾಗಿದೆ; 12GB ಕಾರ್ಯಸಾಧ್ಯವಾಗಿದೆ; 24GB ನಲ್ಲಿ ನೀವು ಬ್ಯಾಚ್ ಗಾತ್ರಗಳಿಗೆ ಕ್ಷಮೆಯಾಚಿಸುವುದನ್ನು ನಿಲ್ಲಿಸುತ್ತೀರಿ.
- ಓಪನ್-ಸೋರ್ಸ್ AI ಪರಿಸರ ವ್ಯವಸ್ಥೆಯಲ್ಲಿ NVIDIA ಇನ್ನೂ ಉತ್ತಮ ಬೆಂಬಲವನ್ನು ಹೊಂದಿದೆ. AMD ಸುಧಾರಿಸುತ್ತಿದೆ, Apple Silicon SDXL ನೊಂದಿಗೆ ಆಘಾತಕಾರಿಯಾಗಿ ಯೋಗ್ಯವಾಗಿದೆ—ಆದರೆ ನಿಮಗೆ ಕಡಿಮೆ ತಲೆನೋವು ಬೇಕಾದರೆ, CUDA ಕನಿಷ್ಠ ಪ್ರತಿರೋಧದ ಮಾರ್ಗವಾಗಿದೆ.
- ಡಿಸ್ಕ್ ಸ್ಥಳ: ಮಾದರಿಗಳು ದೊಡ್ಡದಾಗಿವೆ. ಕ್ಯುರೇಟೆಡ್ ಲೈಬ್ರರಿಯನ್ನು ಇರಿಸಿ ಮತ್ತು ನೀವು ಬಳಸದ ವಸ್ತುಗಳನ್ನು ಆರ್ಕೈವ್ ಮಾಡಿ. ಸಂಗ್ರಹಣೆ ಒಂದು ತಂತ್ರವಲ್ಲ.
ಗೌಪ್ಯತೆ ಮತ್ತು ನಿಯಮಗಳು: ಓಪನ್-ಸೋರ್ಸ್ ಇಲ್ಲಿ ಅಸ್ತಿತ್ವದಲ್ಲಿರಲು ಕಾರಣ
ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಕೇವಲ ವೆಚ್ಚದ ಬಗ್ಗೆ ಅಲ್ಲ. ಅವು ನಿಯಂತ್ರಣದ ಬಗ್ಗೆ. ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಮಾಡುವುದರಿಂದ ನಿಮ್ಮ ಕೆಲಸ-ಪ್ರಗತಿಯಲ್ಲಿರುವ, ನಿಮ್ಮ ಕ್ಲೈಂಟ್ ಸ್ವತ್ತುಗಳು, ನಿಮ್ಮ ಉತ್ಪನ್ನ ರೆಂಡರ್ಗಳು ಮತ್ತು ನಿಮ್ಮ ಘೋಷಿಸದ ವಿನ್ಯಾಸಗಳು ನಿಮ್ಮ ಯಂತ್ರದಲ್ಲಿಯೇ ಇರುತ್ತವೆ. "ನಮ್ಮ ಸೇವೆಯನ್ನು ಸುಧಾರಿಸಲು ನಾವು ನಿಮ್ಮ ಡೇಟಾವನ್ನು ಬಳಸಬಹುದು" ಎಂಬ ಅಡಿಟಿಪ್ಪಣಿಗಳಿಲ್ಲ, ಕಾನೂನಿನಿಂದ ನಿದ್ರೆಯ ಮಧ್ಯರಾತ್ರಿಯ ಇಮೇಲ್ಗಳಿಲ್ಲ.
ಅದು ನಿಜವಾದ ಡ್ರಾ. ಕೇವಲ "ಉಚಿತ" ಅಲ್ಲ, ಆದರೆ "ನಿಮ್ಮದು".
ಸಣ್ಣಪಟ್ಟಿ: ಸೃಷ್ಟಿಕರ್ತರಿಗೆ ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು
- Stable Diffusion SDXL ಮತ್ತು SD 1.5: ನೀವು ನಿಜವಾಗಿ ಬಳಸುವ ಪ್ರಮುಖ ಜನರೇಟರ್ಗಳು.
- ComfyUI: ಪೈಪ್ಲೈನ್-ದರ್ಜೆಯ ವರ್ಕ್ಫ್ಲೋಗಳು ಮತ್ತು ಪುನರುತ್ಪಾದನೆಗಾಗಿ.
- Automatic1111: ವೇಗದ ಪುನರಾವರ್ತನೆ ಮತ್ತು ದೊಡ್ಡ ಪ್ಲಗಿನ್ ಪರಿಸರ ವ್ಯವಸ್ಥೆಗಾಗಿ.
- InvokeAI: ಶಾಂತವಾದ, ಸ್ಟುಡಿಯೋ ತರಹದ ಪರಿಸರಕ್ಕಾಗಿ.
- ControlNet: ಔಟ್ಪುಟ್ ಪಾಲಿಸುವಂತೆ ಮಾಡಲು ಭಂಗಿ, ಆಳ ಮತ್ತು ರೇಖಾ ನಿಯಂತ್ರಣಕ್ಕಾಗಿ.
- LoRA/Textual Inversion: ಸಣ್ಣ ಫೈಲ್ಗಳೊಂದಿಗೆ ಶೈಲಿ ಮತ್ತು ಪಾತ್ರದ ಸ್ಥಿರತೆಗಾಗಿ.
- ESRGAN/Real-ESRGAN: ನಿಮ್ಮ ಚಿತ್ರದಿಂದ ಆತ್ಮವನ್ನು ಹೊರತೆಗೆಯದ ಅಪ್ಸ್ಕೇಲಿಂಗ್ಗಾಗಿ.
- Krita (SD ಪ್ಲಗಿನ್ಗಳೊಂದಿಗೆ): ನಿಜವಾದ ಕಲಾ ಅಪ್ಲಿಕೇಶನ್ನಲ್ಲಿ ವರ್ಣಚಿತ್ರದ ನಿಯಂತ್ರಣಕ್ಕಾಗಿ.
- Deforum/Animatediff: ಚಲನಚಿತ್ರ ಶಾಲೆಯ ಅಗತ್ಯವಿಲ್ಲದ ಚಲನೆಯ ಪ್ರಯೋಗಗಳಿಗಾಗಿ.
ತೊಂದರೆಗಳು ಮತ್ತು ಪ್ರಾಯೋಗಿಕ ಪರಿಹಾರಗಳು
- ಅತಿಯಾದ ಪ್ರಾಂಪ್ಟಿಂಗ್: ನಿಮ್ಮ ಪ್ರಾಂಪ್ಟ್ ಸುಲಿಗೆ ಪತ್ರದಂತೆ ಓದಿದರೆ, ನಿಮ್ಮ ಚಿತ್ರವೂ ಹಾಗೆಯೇ ಕಾಣುತ್ತದೆ. ಕಡಿಮೆ ಪದಗಳು, ಬಲವಾದ ಸಂಕೇತಗಳು.
- ತುಂಬಾ ಆಡ್-ಆನ್ಗಳು: ControlNet ಸ್ಟಾಕಿಂಗ್ ಹಗ್ಗಜಗ್ಗಾಟವಾಗಿ ಬದಲಾಗಬಹುದು. ಮುಖ್ಯವಾದ ಎರಡನ್ನು ಆರಿಸಿ.
- ಮಾದರಿ ರೂಲೆಟ್: ಪ್ರತಿ ಐದು ನಿಮಿಷಕ್ಕೆ ಮಾದರಿಗಳನ್ನು ಬದಲಾಯಿಸುವುದು ನಿಮ್ಮ ಶೈಲಿಯ ಸ್ಥಿರತೆಯನ್ನು ನಾಶಪಡಿಸುತ್ತದೆ. ಸಣ್ಣ ಗುಂಪಿಗೆ ಬದ್ಧರಾಗಿರಿ.
- ಬೀಜಗಳನ್ನು ನಿರ್ಲಕ್ಷಿಸುವುದು: ಪುನರಾವರ್ತನೆಗಾಗಿ ಬೀಜಗಳನ್ನು ಇರಿಸಿ. ಸಂಘಟಿತರಾಗಿದ್ದಕ್ಕಾಗಿ ಭವಿಷ್ಯದ-ನೀವು ಗತಕಾಲದ-ನಿಮಗೆ ಧನ್ಯವಾದ ಹೇಳುತ್ತಾರೆ.
"ಅತ್ಯುತ್ತಮ" ನಿಮ್ಮ ಗಡುವನ್ನು ಅವಲಂಬಿಸಿರುತ್ತದೆ
- ಕಟ್ಟುನಿಟ್ಟಾದ ಗಡುವು, ಪರಿಕಲ್ಪನೆಯ ಕಲೆ: SD 1.5 + ControlNet Lineart + A1111. ವೇಗವಾಗಿ, ಕ್ಷಮಿಸುವ, ಸಾಕಷ್ಟು ಒಳ್ಳೆಯದು.
- ಪೋರ್ಟ್ಫೋಲಿಯೊ ತುಣುಕು, ಶೈಲೀಕೃತ: SDXL + ComfyUI + ಕೈಯಿಂದ-ಟ್ಯೂನ್ ಮಾಡಿದ LoRA ಗಳು. ನಿಧಾನವು ಮೃದುವಾಗಿರುತ್ತದೆ, ಮೃದುವು ವೇಗವಾಗಿರುತ್ತದೆ.
- ಉತ್ಪನ್ನದ ಮಾಕ್ಅಪ್ಗಳು, ಫೋಟೊರಿಯಲ್: SDXL + ಲೈಟಿಂಗ್ LoRA ಗಳು + ಉಲ್ಲೇಖ ಫೋಟೋಗಳು + ESRGAN. ಅದನ್ನು ನೀರಸವಾಗಿ ಇರಿಸಿ; ನೀರಸವು ನಿಜವಾಗಿ ಕಾಣುತ್ತದೆ.
- ಅನಿಮೇಷನ್ ಪ್ರಯೋಗ: Animatediff + ಕಟ್ಟುನಿಟ್ಟಾದ ಪ್ರಾಂಪ್ಟ್ಗಳು + ಸಣ್ಣ ಲೂಪ್ಗಳು. ಸಣ್ಣ ಗೆಲುವುಗಳನ್ನು ಸಾಗಿಸಿ.
Sider.AI ಎಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ (ಮತ್ತು ಎಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳುವುದಿಲ್ಲ) ನೀವು ಸಾಧನಗಳಾದ್ಯಂತ ಪ್ರಾಂಪ್ಟ್ಗಳು, ಶೈಲಿಯ ಟಿಪ್ಪಣಿಗಳು ಮತ್ತು ಪುನರುತ್ಪಾದಿಸಬಹುದಾದ ವರ್ಕ್ಫ್ಲೋಗಳನ್ನು ಜಗ್ಲಿಂಗ್ ಮಾಡುವಾಗ Sider.AI ನಿಜವಾಗಿಯೂ ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ಮತ್ತೊಂದು "ಮ್ಯಾಜಿಕ್ ಮಾದರಿ" ಅಲ್ಲ—ಇದು ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಸಂಗ್ರಹಿಸಲು, ರೂಪಾಂತರಗಳನ್ನು ಹೋಲಿಸಲು ಮತ್ತು ಓಪನ್-ಸೋರ್ಸ್ UI ಗಳು ಗಾಳಿಗೆ ಚೆಲ್ಲುವ ಕಾಗದದ ಜಾಡನ್ನು ಇರಿಸಿಕೊಳ್ಳಲು ಒಂದು ವಿವೇಕಯುತ ಸ್ಥಳವಾಗಿದೆ. ನಿಮ್ಮ ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳ ಸ್ಟಾಕ್ ಅನ್ನು ಡಾಕ್ಯುಮೆಂಟ್ ಮಾಡಲು, ಬೀಜಗಳು ಮತ್ತು LoRA ಗಳನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಲು ಮತ್ತು ComfyUI ಅಥವಾ A1111 ಗೆ ಅಂಟಿಸಬಹುದಾದ ಸ್ಥಿರವಾದ ಸಂಕ್ಷಿಪ್ತಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಇದನ್ನು ಬಳಸಿ. ಬೇರೆ ರೀತಿಯಲ್ಲಿ ಹೇಳುವುದಾದರೆ, ಕಡಿಮೆ ಯಾಕ್-ಶೇವಿಂಗ್, ಹೆಚ್ಚು ಸಾಗಣೆ. ಇದು Stable Diffusion ಅಥವಾ Krita ಅನ್ನು ಬದಲಿಸುವುದಿಲ್ಲ. ಇದು ಅವುಗಳ ಬಳಕೆಯನ್ನು ಕಡಿಮೆ ಅವ್ಯವಸ್ಥಿತವಾಗಿಸುತ್ತದೆ. ಎರಡು ವಾರಗಳ ಹಿಂದೆ ನೋಟವನ್ನು ಮರುಸೃಷ್ಟಿಸಲು ಮಧ್ಯಾಹ್ನವನ್ನು ಕಳೆದಿದ್ದರೆ, ಇದು ಮತ್ತೊಂದು "ಮೊದಲಿಗಿಂತ ತೀಕ್ಷ್ಣವಾದ" ಚೆಕ್ಪಾಯಿಂಟ್ಗಿಂತ ಹೆಚ್ಚು ಮೌಲ್ಯಯುತವಾಗಿದೆ.
ಸೃಷ್ಟಿಕರ್ತರ ಕಾರ್ಯವಿಧಾನಗಳು ಚೆನ್ನಾಗಿ ವಯಸ್ಸಾಗುತ್ತವೆ
- ಲೈಬ್ರರಿ ಮನಸ್ಥಿತಿ: ನಿಮ್ಮ ಚೆಕ್ಪಾಯಿಂಟ್ಗಳು, LoRA ಗಳು ಮತ್ತು ControlNet ತೂಕವನ್ನು ಕ್ಯುರೇಟ್ ಮಾಡಿ. ಬೇರೆಯವರು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬೇಕಾದ ಹೆಸರನ್ನು ಇರಿಸಿ.
- ಟೆೆಂಪ್ಲೇಟ್ಗಳನ್ನು ಸ್ಕ್ಯಾಫೋಲ್ಡಿಂಗ್ನಂತೆ ಬಳಸಿ: ಸಾಮಾನ್ಯ ಉದ್ಯೋಗಗಳಿಗಾಗಿ ComfyUI ಗ್ರಾಫ್ಗಳು ಮತ್ತು A1111 ಪ್ರಾಂಪ್ಟ್ ಪ್ರಿಸೆಟ್ಗಳನ್ನು ಉಳಿಸಿ. ಟೆೆಂಪ್ಲೇಟ್ಗಳು ಗಾರ್ಡ್ರೈಲ್ಗಳು, ಕೈಕೋಳಗಳಲ್ಲ.
- ಉಲ್ಲೇಖ-ಮೊದಲು: ಮಾದರಿಗೆ ಉತ್ತಮ ಇನ್ಪುಟ್ಗಳನ್ನು ನೀಡಿ: ಭಂಗಿಯ ಉಲ್ಲೇಖಗಳು, ಲೈಟಿಂಗ್ ಉಲ್ಲೇಖಗಳು, ಬಣ್ಣದ ಪ್ಯಾಲೆಟ್ಗಳು. AI ರುಚಿಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ; ಅದನ್ನು ರಚಿಸುವುದಿಲ್ಲ.
- ಚಿತ್ರಗಳಿಗಾಗಿ ಆವೃತ್ತಿ ನಿಯಂತ್ರಣ: ಚಿತ್ರಗಳ ಪಕ್ಕದಲ್ಲಿ ಬೀಜಗಳು, ಪ್ರಾಂಪ್ಟ್ಗಳು ಮತ್ತು ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು ಇರಿಸಿ. ಔಟ್ಪುಟ್ಗಳನ್ನು ಕೋಡ್ ಬಿಲ್ಡ್ಗಳಂತೆ ಪರಿಗಣಿಸಿ.
ಡಯಲೆಕ್ಟಿಕ್: ಓಪನ್-ಸೋರ್ಸ್ ಸ್ವಾತಂತ್ರ್ಯ vs. ಸಮಯ ತೆರಿಗೆ
ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಕೆಲಸ ಮಾಡಲು ಅತ್ಯಂತ ವಿಮೋಚಕ ಮತ್ತು ಅತ್ಯಂತ ಬೇಡಿಕೆಯ ಮಾರ್ಗವಾಗಿದೆ. ನೀವು ಸೆಟಪ್ಗಾಗಿ ಚಂದಾದಾರಿಕೆಗಳನ್ನು, ನಮ್ಯತೆಗಾಗಿ ಗಾರ್ಡ್ರೈಲ್ಗಳನ್ನು, ನಿಯಂತ್ರಣಕ್ಕಾಗಿ ಸ್ಥಿರತೆಯನ್ನು ವ್ಯಾಪಾರ ಮಾಡುತ್ತೀರಿ. ಕೆಲವು ದಿನಗಳಲ್ಲಿ ಇದು ಯುನಿಕ್ಸ್ ಡೆಸ್ಕ್ಟಾಪ್ ಯುಗದಂತೆ ಭಾಸವಾಗುತ್ತದೆ—ನೀವು ಕೈಪಿಡಿಯನ್ನು ಓದಿದರೆ ಅಂತ್ಯವಿಲ್ಲದ ಶಕ್ತಿ. ಇತರ ದಿನಗಳಲ್ಲಿ ಇದು ಸಾಧ್ಯವಾದಷ್ಟು ಉತ್ತಮ ರೀತಿಯಲ್ಲಿ ಮೋಸ ಮಾಡಿದಂತೆ ಭಾಸವಾಗುತ್ತದೆ.
ಉದ್ಯಮದ ಸಾಲು "ಪ್ರಜಾಪ್ರಭುತ್ವೀಕರಣ" ಎಂದು ಹೇಳುತ್ತದೆ. ವಾಸ್ತವವೆಂದರೆ ಕರಕುಶಲತೆ. ಯಾವುದೇ ಸಾಧನವು ರುಚಿಯನ್ನು ತೆಗೆದುಹಾಕುವುದಿಲ್ಲ ಮತ್ತು ಯಾವುದೇ ಮಾದರಿಯು ನಿಮ್ಮನ್ನು ಆಯ್ಕೆ ಮಾಡುವುದರಿಂದ ಬಿಡುಗಡೆ ಮಾಡುವುದಿಲ್ಲ. ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಉತ್ತಮ ಕೆಲಸವನ್ನು ರಚಿಸುವುದಿಲ್ಲ; ಅವು ನಿಮ್ಮನ್ನು ವೇಗವಾಗಿ ಆಕಾರಗೊಳಿಸಲು, ಮತ್ತಷ್ಟು ಪುನರಾವರ್ತಿಸಲು ಮತ್ತು ಪ್ರಕ್ರಿಯೆಯನ್ನು ನಿಮ್ಮದಾಗಿಸಿಕೊಳ್ಳಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತವೆ.
ಅದು ನಿಜವಾದ ಸ್ವಾತಂತ್ರ್ಯದಂತೆ ಭಾಸವಾದರೆ—ಮತ್ತು ಮಾರ್ಕೆಟಿಂಗ್ ರೀತಿಯಲ್ಲ—ನೀವು ಈ ಪರಿಕರಗಳನ್ನು ನಿರ್ಮಿಸಿದ ಪ್ರೇಕ್ಷಕರಾಗಿದ್ದೀರಿ. ನೆನಪಿಡಿ: ನಾಯಿಯ ಮರಿ ಉಚಿತ. ಆಹಾರ, ತರಬೇತಿ ಮತ್ತು ಸಮಯ ಉಚಿತವಲ್ಲ.
FAQ ಗಳು
ಪ್ರಶ್ನೆ: ವೇಗದ ಕಲ್ಪನೆಗಾಗಿ ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಯಾವುವು?
ಉ: Automatic1111 ನೊಂದಿಗೆ Stable Diffusion SD 1.5 ಇನ್ನೂ ಪ್ರಾಂಪ್ಟ್ನಿಂದ ಚಿತ್ರಕ್ಕೆ ತ್ವರಿತ ಮಾರ್ಗವಾಗಿದೆ. ರಚನೆಗಾಗಿ ControlNet ಲೈನ್ಆರ್ಟ್ ಅಥವಾ ಭಂಗಿಯನ್ನು ಸೇರಿಸಿ ಮತ್ತು ನೀವು ಗಂಟೆಗಳ ಬದಲು ನಿಮಿಷಗಳಲ್ಲಿ ಬಳಸಬಹುದಾದ ಪರಿಕಲ್ಪನೆಯ ಕಲೆ ಪಡೆಯುತ್ತೀರಿ.
ಪ್ರಶ್ನೆ: ಫೋಟೊರಿಯಲಿಸಂಗೆ ಯಾವ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಉತ್ತಮವಾಗಿವೆ?
ಉ: ಕ್ಲೀನ್ ಚೆಕ್ಪಾಯಿಂಟ್ ಮತ್ತು ಲೈಟಿಂಗ್ LoRA ಗಳೊಂದಿಗೆ SDXL ಸಾಮಾನ್ಯವಾಗಿ ಗೆಲ್ಲುತ್ತದೆ. ControlNet ಮೂಲಕ ಉಲ್ಲೇಖ ಫೋಟೋಗಳನ್ನು ಬಳಸಿ ಮತ್ತು ಎಚ್ಚರಿಕೆಯಿಂದ ESRGAN ಅಪ್ಸ್ಕೇಲ್ನೊಂದಿಗೆ ಮುಗಿಸಿ—ಫೋಟೊರಿಯಲಿಸಂ ಹೆಚ್ಚಾಗಿ ಜ್ಯಾಮಿತಿ ಮತ್ತು ಬೆಳಕು, "ಮೇರುಕೃತಿ" ಸ್ಪ್ಯಾಮ್ ಅಲ್ಲ.
ಪ್ರಶ್ನೆ: ನಾನು ComfyUI ಅಥವಾ Automatic1111 ಅನ್ನು ಬಳಸಬೇಕೇ?
ಉ: ನಿಮಗೆ ವೇಗ ಮತ್ತು ದೊಡ್ಡ ಪ್ಲಗಿನ್ ಪರಿಸರ ವ್ಯವಸ್ಥೆ ಬೇಕಾದರೆ, Automatic1111 ಅನ್ನು ಆಯ್ಕೆ ಮಾಡಿ. ನೀವು ಪುನರುತ್ಪಾದನೆ ಮತ್ತು ಪೈಪ್ಲೈನ್ ನಿಯಂತ್ರಣದ ಬಗ್ಗೆ ಕಾಳಜಿ ವಹಿಸಿದರೆ, ComfyUI ಉತ್ತಮವಾಗಿದೆ—ನೋಡ್ ಗ್ರಾಫ್ ಕಲಿಕೆಯ ವಕ್ರರೇಖೆಯನ್ನು ಸ್ವೀಕರಿಸಿ.
ಪ್ರಶ್ನೆ: ಓಪನ್-ಸೋರ್ಸ್ ಪರಿಕರಗಳೊಂದಿಗೆ ಚಿತ್ರಗಳಾದ್ಯಂತ ನಾನು ಶೈಲಿಯನ್ನು ಹೇಗೆ ಸ್ಥಿರವಾಗಿರಿಸುವುದು?
ಉ: ಸಣ್ಣ LoRA ಗಳ ಗುಂಪಿಗೆ ತರಬೇತಿ ನೀಡಿ ಅಥವಾ ಅಳವಡಿಸಿಕೊಳ್ಳಿ ಮತ್ತು ಬೀಜಗಳು, ಪ್ರಾಂಪ್ಟ್ಗಳು ಮತ್ತು ಸೆಟ್ಟಿಂಗ್ಗಳನ್ನು ಆವೃತ್ತಿ ಮಾಡಿ. ಸ್ಥಿರತೆ ಮ್ಯಾಜಿಕ್ ಅಲ್ಲ; ಇದು ದಸ್ತಾವೇಜನ್ನು ಜೊತೆಗೆ ಮಾದರಿ ಸ್ವಿಚಿಂಗ್ನಲ್ಲಿ ಸಂಯಮವಾಗಿದೆ.
ಪ್ರಶ್ನೆ: ಓಪನ್-ಸೋರ್ಸ್ ಚಿತ್ರ ಕಾರ್ಯವಿಧಾನದಲ್ಲಿ Sider.AI ಎಲ್ಲಿ ಸಹಾಯ ಮಾಡುತ್ತದೆ?
ಉ: Sider.AI ನಿಮ್ಮ ಪ್ರಾಂಪ್ಟ್ಗಳು, ಬೀಜಗಳು ಮತ್ತು ವ್ಯತ್ಯಾಸಗಳನ್ನು ಸಂಘಟಿತವಾಗಿ ಇರಿಸುತ್ತದೆ ಆದ್ದರಿಂದ ನೀವು ಊಹಿಸುವ ಬದಲು ಫಲಿತಾಂಶಗಳನ್ನು ಮರುಸೃಷ್ಟಿಸಬಹುದು. ಶಕ್ತಿಯುತ ಆದರೆ ವಿನ್ಯಾಸದಿಂದ ಮರೆತುಹೋಗುವ ಓಪನ್-ಸೋರ್ಸ್ ಸ್ಟಾಕ್ಗಾಗಿ ಕಾಣೆಯಾದ ಸ್ಮರಣೆಯಂತೆ ಯೋಚಿಸಿ. FAQ
Q1:ವೇಗದ ಕಲ್ಪನೆಗಾಗಿ ಅತ್ಯುತ್ತಮ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಯಾವುವು?
Automatic1111 ನೊಂದಿಗೆ Stable Diffusion 1.5 ನಿಮ್ಮನ್ನು ಪ್ರಾಂಪ್ಟ್ನಿಂದ ಚಿತ್ರಕ್ಕೆ ತ್ವರಿತವಾಗಿ ಕರೆದೊಯ್ಯುತ್ತದೆ. ಭಂಗಿ ಅಥವಾ ಅಂಚುಗಳಿಗಾಗಿ ControlNet ಅನ್ನು ಸೇರಿಸಿ ಮತ್ತು ನೀವು ಐದು ವಿಭಿನ್ನ ಅಪ್ಲಿಕೇಶನ್ಗಳನ್ನು ಡಕ್ಟ್-ಟೇಪಿಂಗ್ ಮಾಡದೆಯೇ ಬಳಸಬಹುದಾದ ಪರಿಕಲ್ಪನೆಯ ಕಲೆ ಪಡೆಯುತ್ತೀರಿ.
Q2:ಫೋಟೊರಿಯಲಿಸಂಗೆ ಯಾವ ಓಪನ್-ಸೋರ್ಸ್ AI ಚಿತ್ರ ಪರಿಕರಗಳು ಉತ್ತಮವಾಗಿವೆ?
ಘನ ಚೆಕ್ಪಾಯಿಂಟ್ಗಳು ಮತ್ತು ಲೈಟಿಂಗ್ LoRA ಗಳೊಂದಿಗಿನ SDXL ಪ್ರಾಯೋಗಿಕ ಆಯ್ಕೆಯಾಗಿದೆ. ಉಲ್ಲೇಖ ಫೋಟೋಗಳೊಂದಿಗೆ ControlNet ಅನ್ನು ಬಳಸಿ ಮತ್ತು ಗರಿಗರಿಯಾದ, ನಂಬಲರ್ಹವಾದ ವಿವರಗಳಿಗಾಗಿ ESRGAN ಅಪ್ಸ್ಕೇಲಿಂಗ್ನೊಂದಿಗೆ ಮುಗಿಸಿ.
Q3:ComfyUI ಸೃಷ್ಟಿಕರ್ತರಿಗೆ Automatic1111 ಗಿಂತ ಉತ್ತಮವಾಗಿದೆಯೇ?
ComfyUI ಪುನರುತ್ಪಾದಿಸಬಹುದಾದ ಪೈಪ್ಲೈನ್ಗಳು ಮತ್ತು ತಂಡದ ವರ್ಕ್ಫ್ಲೋಗಳಿಗೆ ಉತ್ತಮವಾಗಿದೆ; Automatic1111 ತ್ವರಿತ ಪುನರಾವರ್ತನೆ ಮತ್ತು ಪ್ಲಗಿನ್ಗಳಿಗೆ ಉತ್ತಮವಾಗಿದೆ. ನೀವು ವೇಗ ಅಥವಾ ನಿಯಂತ್ರಣವನ್ನು ಹೆಚ್ಚು ಮೌಲ್ಯೀಕರಿಸುತ್ತೀರಾ ಎಂಬುದರ ಆಧಾರದ ಮೇಲೆ ಆಯ್ಕೆಮಾಡಿ.
Q4:ಓಪನ್-ಸೋರ್ಸ್ AI ಪರಿಕರಗಳನ್ನು ಬಳಸಿಕೊಂಡು ನಾನು ಶೈಲಿಯನ್ನು ಹೇಗೆ ಸ್ಥಿರವಾಗಿರಿಸುವುದು?
ಸಣ್ಣ LoRA ಗಳು ಮತ್ತು ಚೆಕ್ಪಾಯಿಂಟ್ಗಳ ಗುಂಪಿಗೆ ಅಂಟಿಕೊಳ್ಳಿ ಮತ್ತು ಪ್ರತಿ ರಫ್ತುಗಳೊಂದಿಗೆ ಬೀಜಗಳನ್ನು ಉಳಿಸಿ. ಸ್ಥಿರತೆಯು ದಸ್ತಾವೇಜನ್ನು ಮತ್ತು ಸಂಯಮದಿಂದ ಬರುತ್ತದೆ, ದೀರ್ಘವಾದ ಪ್ರಾಂಪ್ಟ್ಗಳಿಂದ ಅಲ್ಲ.
Q5: ತೆರೆದ ಮೂಲದ ಚಿತ್ರ ಕಾರ್ಯವಿಧಾನದಲ್ಲಿ Sider.AI ಎಲ್ಲಿ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ?
Sider.AI ಪ್ರಾಂಪ್ಟ್ಗಳು, ಸೀಡ್ಗಳು ಮತ್ತು ಆವೃತ್ತಿಗಳನ್ನು ಆಯೋಜಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಇದರಿಂದ ನೀವು ಬೇಡಿಕೆಯ ಮೇರೆಗೆ ನೋಟಗಳನ್ನು ಮರುಸೃಷ್ಟಿಸಬಹುದು. ಇದು ಸ್ಟೇಬಲ್ ಡಿಫ್ಯೂಷನ್ ಅನ್ನು ಬದಲಾಯಿಸುವುದಿಲ್ಲ; ಇದು ನಿಮ್ಮ ಸ್ಟಾಕ್ ಅನ್ನು ಕಡಿಮೆ ಗೊಂದಲಮಯವಾಗಿಸುತ್ತದೆ ಮತ್ತು ಹೆಚ್ಚು ಪುನರಾವರ್ತಿತವಾಗಿಸುತ್ತದೆ.