Meta MobileLLM‑R1 ವಿಮರ್ಶೆ: ತೂಕಕ್ಕಿಂತ ಹೆಚ್ಚು ಪಂಚ್ ಮಾಡುವ ಪಾಕೆಟ್-ಗಾತ್ರದ ರೀಸನರ್
2023 ಕ್ಲೌಡ್ LLM ಗಳ ವರ್ಷವಾಗಿದ್ದರೆ, 2025 ಆನ್-ಡಿವೈಸ್ ಇಂಟೆಲಿಜೆನ್ಸ್ನ ವರ್ಷವಾಗುವತ್ತಾ ಸಾಗುತ್ತಿದೆ. Meta ದ MobileLLM‑R1 ಇದುವರೆಗಿನ ಸ್ಪಷ್ಟ ಸಂಕೇತವಾಗಿದೆ: ನಿಮ್ಮ ಡೇಟಾ ಇರುವಲ್ಲಿಯೇ ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಆಗಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಕಾಂಪ್ಯಾಕ್ಟ್, ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ಮಾದರಿ. ಈ ವಿಮರ್ಶೆಯಲ್ಲಿ, MobileLLM‑R1 ಎಂದರೇನು, ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ಎಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ (ಮತ್ತು ಎಡವುತ್ತದೆ), ಮತ್ತು ನಿಮ್ಮ ಫೋನ್, ಲ್ಯಾಪ್ಟಾಪ್ ಅಥವಾ ಎಡ್ಜ್ ಡಿವೈಸ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಲು ಅದು ಸಿದ್ಧವಾಗಿದೆಯೇ ಎಂಬುದನ್ನು ನಾವು ಪರಿಶೀಲಿಸುತ್ತೇವೆ.
ವಿಷಯಗಳನ್ನು ವಾಸ್ತವವಾಗಿ ಇರಿಸಿಕೊಳ್ಳಲು, ನಾವು ಸಾರ್ವಜನಿಕ ಮಾದರಿ ಕಾರ್ಡ್, ಸಮುದಾಯದಿಂದ ಆರಂಭಿಕ ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಪರೀಕ್ಷೆಗಳು ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಗುರಿ ಬಳಕೆಯ ಪ್ರಕರಣಗಳನ್ನು ಸಾರಾಂಶಿಸುವ ತಾಂತ್ರಿಕ ಬರಹಗಳನ್ನು ನೋಡಿದ್ದೇವೆ.
- MobileLLM‑R1 ಎಂಬುದು CPU ಗಳು/ಎಡ್ಜ್ ಡಿವೈಸ್ಗಳಿಗಾಗಿ ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲಾದ Meta ದ ಕಾಂಪ್ಯಾಕ್ಟ್ ರೀಸನಿಂಗ್ ಮಾದರಿಯಾಗಿದೆ.
- 950M-ಪ್ಯಾರಾಮೀಟರ್ ರೂಪಾಂತರವು ಮೆಮೊರಿ ಅಥವಾ ಬ್ಯಾಟರಿ ಬಜೆಟ್ಗಳನ್ನು ಹೆಚ್ಚಿಸದೆಯೇ ಚೈನ್-ಆಫ್-ಥಾಟ್-ಶೈಲಿಯ ರೀಸನಿಂಗ್ ಅನ್ನು ತಲುಪಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ.
- ಆರಂಭಿಕ ಪರೀಕ್ಷೆಗಳು ಇದು ಗ್ರಾಹಕ CPU ಗಳಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಆಗುತ್ತದೆ ಮತ್ತು ಅಂತಹುದೇ ಗಾತ್ರದ ಮಾದರಿಗಳಿಗಿಂತ ಗಣಿತ ಮತ್ತು ತರ್ಕ ಕಾರ್ಯಗಳನ್ನು ಉತ್ತಮವಾಗಿ ನಿಭಾಯಿಸಬಲ್ಲದು ಎಂದು ತೋರಿಸುತ್ತದೆ, ಸಾಂದರ್ಭಿಕವಾಗಿ ಕಿರಿದಾದ ಕಾರ್ಯಗಳಲ್ಲಿ ದೊಡ್ಡ ಬೇಸ್ಲೈನ್ಗಳಿಗೆ ಸವಾಲು ಹಾಕುತ್ತದೆ.
- ಸಾಮರ್ಥ್ಯಗಳು: ಗೌಪ್ಯತೆ, ಆಫ್ಲೈನ್ ವಿಶ್ವಾಸಾರ್ಹತೆ, ಸಣ್ಣ ಪ್ರಾಂಪ್ಟ್ಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಾತ್ಮಕತೆ ಮತ್ತು ದಕ್ಷತೆ.
- ದೌರ್ಬಲ್ಯಗಳು: ಸಣ್ಣ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳು, ಸಾಂದರ್ಭಿಕ ರೀಸನಿಂಗ್ ದುರ್ಬಲತೆ ಮತ್ತು ದೊಡ್ಡ ಕ್ಲೌಡ್ LLM ಗಳಿಗಿಂತ ನಿಧಾನವಾದ ಮಲ್ಟಿ-ಸ್ಟೆಪ್ ಚೈನ್ಗಳು.
ನಾವು ಇಲ್ಲಿ ಪ್ರಾಯೋಗಿಕ ಮತ್ತು ಪರಿಹಾರ-ಆಧಾರಿತ ವಿಧಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದ್ದೇವೆ: ನೈಜ ಸಾಮರ್ಥ್ಯಗಳು, ಸ್ಪಷ್ಟ ಟ್ರೇಡ್-ಆಫ್ಗಳು ಮತ್ತು ನೀವು ಈಗ ಅದನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳಬೇಕೆ ಎಂಬುದರ ಕುರಿತು ಮಾರ್ಗದರ್ಶನ.
MobileLLM‑R1 ನಿಖರವಾಗಿ ಏನು?
MobileLLM‑R1 ಭಾಗ ಮಾದರಿ ಕುಟುಂಬ, ಭಾಗ ಭರವಸೆ: ಸೀಮಿತ ಕಂಪ್ಯೂಟ್ನೊಂದಿಗೆ ಸಾಧನಗಳಲ್ಲಿ ಉಪಯುಕ್ತ ರೀಸನಿಂಗ್ ಅನ್ನು ತಲುಪಿಸಲು ತರಬೇತಿ ಪಡೆದ ಮತ್ತು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿದ ಕಾಂಪ್ಯಾಕ್ಟ್ LLM. “R1” ಬ್ರ್ಯಾಂಡಿಂಗ್ ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ರೆಸಿಪಿಗೆ ಸೂಚಿಸುತ್ತದೆ— ಯೋಚಿಸಿ: ರಚನಾತ್ಮಕ ಹಂತ-ಹಂತದ ಚಿಂತನೆ, ಗಣಿತ ಸಾಮರ್ಥ್ಯ ಮತ್ತು ಉದ್ದೇಶಪೂರ್ವಕ ಮಧ್ಯಂತರ ರೀಸನಿಂಗ್ ಟ್ರೇಸ್ಗಳು.
- ಪ್ಯಾರಾಮೀಟರ್ ಗಾತ್ರ: ವ್ಯಾಪಕವಾಗಿ ಚರ್ಚಿಸಲಾದ ಚೆಕ್ಪಾಯಿಂಟ್ ~950M ಪ್ಯಾರಾಮೀಟರ್ಗಳು (MobileLLM‑R1‑950M).
- ನಿಯೋಜನೆ ಗುರಿ: ಗ್ರಾಹಕ CPU ಗಳು/NPU ಗಳು ಮತ್ತು ಸುಪ್ತತೆ, ಮೆಮೊರಿ ಮತ್ತು ಪವರ್ ಮುಖ್ಯವಾಗಿರುವ ಎಡ್ಜ್ ಡಿವೈಸ್ಗಳು.
- ಬಳಕೆಯ ಪ್ರಕರಣಗಳು: ಆನ್-ಡಿವೈಸ್ ಅಸಿಸ್ಟೆಂಟ್ಗಳು, ಗಣಿತ/ತರ್ಕ ಸಹಾಯಕರು, ಹಗುರವಾದ ಕೋಡಿಂಗ್ ಸಲಹೆಗಳು, ಸಾರಾಂಶ ಮತ್ತು ಖಾಸಗಿ ಡಾಕ್ಯುಮೆಂಟ್ ಪ್ರಶ್ನೋತ್ತರ.
ಪ್ರಸ್ತಾಪ: ಕ್ಲೌಡ್ ಡಿಪೆಂಡೆನ್ಸಿ ಇಲ್ಲದೆ “ಸಾಕಷ್ಟು ಉತ್ತಮ” ಚೈನ್-ಆಫ್-ಥಾಟ್-ರೀತಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪಡೆಯಿರಿ—ಗೌಪ್ಯತೆಗೆ ಸೂಕ್ಷ್ಮವಾದ ಅಥವಾ ಆಫ್ಲೈನ್-ಫಸ್ಟ್ ವರ್ಕ್ಫ್ಲೋಗಳಿಗೆ ಉಪಯುಕ್ತವಾಗಿದೆ.
ವಿಶೇಷಣಗಳು ಮತ್ತು ಸೆಟಪ್: ಅದನ್ನು ರನ್ ಮಾಡಲು ನಿಮಗೆ ಏನು ಬೇಕು
Meta ಹೊಳಪುಳ್ಳ ಡೇಟಾಶೀಟ್ ಅನ್ನು ಪ್ರಕಟಿಸದಿದ್ದರೂ, ಮಾದರಿ ಕಾರ್ಡ್ ಮತ್ತು ಸಮುದಾಯ ಡೆಮೊಗಳು ಕಾರ್ಯಸಾಧ್ಯವಾದ ಚಿತ್ರವನ್ನು ಒದಗಿಸುತ್ತವೆ:
- ಚೆಕ್ಪಾಯಿಂಟ್:
facebook/MobileLLM-R1-950M ಹಗ್ಗಿಂಗ್ ಫೇಸ್ ಹಬ್ ಮೂಲಕ.
- ಹಾರ್ಡ್ವೇರ್: ಆಧುನಿಕ ಗ್ರಾಹಕ CPU ಗಳಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ; AVX/AMX ಮತ್ತು NPU ಗಳೊಂದಿಗೆ ವೇಗವರ್ಧನೆ ಸುಧಾರಿಸುತ್ತದೆ. ಸ್ಥಳೀಯ CPU ಇನ್ಫರೆನ್ಸ್ ಕಾರ್ಯಸಾಧ್ಯವೆಂದು ಸಮುದಾಯ ಡೆಮೊಗಳು ತೋರಿಸುತ್ತವೆ.
- ಮೆಮೊರಿ ಹೆಜ್ಜೆಗುರುತು: ಸಬ್-2B ಮಾದರಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಕ್ವಾಂಟೈಜ್ ಮಾಡಿದಾಗ ಕೆಲವು GB ಒಳಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತವೆ. ಆರಾಮದಾಯಕ ಡೆವ್ ಪ್ರಯೋಗಕ್ಕಾಗಿ 8-16 GB RAM ಅನ್ನು ನಿರೀಕ್ಷಿಸಿ; ಆಕ್ರಮಣಕಾರಿ ಕ್ವಾಂಟೈಸೇಶನ್ನೊಂದಿಗೆ ಬಿಗಿಯಾದ ಸೆಟಪ್ಗಳಿಗೆ 4-8 GB ಸಾಧ್ಯ.
- ಕ್ವಾಂಟೈಸೇಶನ್: INT8/INT4 ಕ್ವಾಂಟೈಸೇಶನ್ CPU ನಲ್ಲಿ ಸುಪ್ತತೆಯನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ ಮತ್ತು ಮೊಬೈಲ್/ಎಡ್ಜ್ನಲ್ಲಿ ಬ್ಯಾಟರಿ ಅವಧಿಯನ್ನು ವಿಸ್ತರಿಸುತ್ತದೆ.
ಪ್ರಾಯೋಗಿಕ ಸಲಹೆ: INT8 ನೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ. ನೀವು ಬಾಟಲ್ನೆಕ್ ಆಗಿದ್ದರೆ, INT4 ಅನ್ನು ಪರೀಕ್ಷಿಸಿ—ಮತ್ತು ದೀರ್ಘ ಚೈನ್ಗಳಲ್ಲಿ ರೀಸನಿಂಗ್ ಡಿಗ್ರೇಡೇಶನ್ ಅನ್ನು ಗಮನಿಸಿ.
ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಬೆಂಚ್ಮಾರ್ಕ್ಗಳು: ಅದು ಎಲ್ಲಿ ಆಶ್ಚರ್ಯಗೊಳಿಸುತ್ತದೆ
MobileLLM‑R1 ತನ್ನ ಗಾತ್ರಕ್ಕೆ ಗಣಿತ ಮತ್ತು ರಚನಾತ್ಮಕ ರೀಸನಿಂಗ್ನಲ್ಲಿ ಅಸಾಧಾರಣವಾಗಿ ಪ್ರಬಲವಾಗಿದೆ ಎಂದು ಆರಂಭಿಕ ವ್ಯಾಖ್ಯಾನವು ಒತ್ತಿಹೇಳುತ್ತದೆ, ಕೆಲವೊಮ್ಮೆ ವಿಶೇಷ ಕಾರ್ಯಗಳಲ್ಲಿ ದೊಡ್ಡ ಮಾದರಿಗಳ ಹಿಮ್ಮಡಿಯ ಮೇಲೆ ಹೆಜ್ಜೆ ಹಾಕುತ್ತದೆ. ಸಮುದಾಯ ಪರೀಕ್ಷೆಗಳು ತೋರಿಸುತ್ತವೆ:
- ರೀಸನಿಂಗ್ ಫಿಡೆಲಿಟಿ: ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ತರಬೇತಿಯಿಂದ ಸಕ್ರಿಯಗೊಳಿಸಲಾದ ಮಧ್ಯಂತರ ಹಂತಗಳೊಂದಿಗೆ ರಚನಾತ್ಮಕ ಮಲ್ಟಿ-ಸ್ಟೆಪ್ ಉತ್ತರಗಳು.
- ಸುಪ್ತತೆ: ಸಣ್ಣ ಮತ್ತು ಮಧ್ಯಮ ಪ್ರಾಂಪ್ಟ್ಗಳಿಗೆ CPU ನಲ್ಲಿ ಸ್ವೀಕಾರಾರ್ಹ; ಕ್ವಾಂಟೈಸೇಶನ್ ಮತ್ತು ಸಣ್ಣ ಕಾಂಟೆಕ್ಸ್ಟ್ನೊಂದಿಗೆ ಗ್ರಹಿಸಬಹುದಾದಷ್ಟು ವೇಗವಾಗಿರುತ್ತದೆ.
- ಸ್ಥಿರತೆ: ಅಮೂರ್ತ, ಮುಕ್ತ ಉತ್ಪಾದನೆಗಿಂತ ನಿರ್ಣಾಯಕ ಗಣಿತ/ತರ್ಕದಲ್ಲಿ ಪ್ರಬಲವಾಗಿದೆ (ಇಲ್ಲಿ ದೊಡ್ಡ ಮಾದರಿಗಳು ಇನ್ನೂ ಪ್ರಾಬಲ್ಯ ಹೊಂದಿವೆ).
ಅದು ಎಲ್ಲಿ ಹಿಂದೆ ಬೀಳುತ್ತದೆ: ಬಹಳ ಉದ್ದವಾದ ಚೈನ್ಗಳು, ಸೂಕ್ಷ್ಮವಾದ ಪ್ರಪಂಚದ ಜ್ಞಾನ ಮತ್ತು ವ್ಯಾಪಕ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳು ಅಥವಾ ಶ್ರೀಮಂತ ಸಾಮಾನ್ಯ ಜ್ಞಾನದ ಅಗತ್ಯವಿರುವ ಕಾರ್ಯಗಳು.
R1 ಮತ್ತು ಚೈನ್-ಆಫ್-ಥಾಟ್: ಟ್ರೇಡ್-ಆಫ್ ಏನು?
R1-ಶೈಲಿಯ ಮಾದರಿಗಳು ಹಂತ ಹಂತದ ರೀಸನಿಂಗ್ಗೆ ಒಲವು ತೋರುತ್ತವೆ. ಅದು ಪ್ರಬಲವಾಗಿದೆ—ಆದರೆ ಅದು ಪರಿಗಣನೆಗಳೊಂದಿಗೆ ಬರುತ್ತದೆ:
- ಪಾರದರ್ಶಕತೆ vs. ವರ್ಬೋಸಿಟಿ: ನೀವು ಅರ್ಥೈಸಿಕೊಳ್ಳಬಹುದಾದ ಹಂತಗಳನ್ನು ಪಡೆಯುತ್ತೀರಿ, ಆದರೆ ದೀರ್ಘವಾದ ಔಟ್ಪುಟ್ಗಳು ಸುಪ್ತತೆ ಮತ್ತು ಟೋಕನ್ ವೆಚ್ಚಗಳನ್ನು ಹೆಚ್ಚಿಸಬಹುದು.
- ಗಾರ್ಡ್ರೈಲ್ಸ್: ರೀಸನಿಂಗ್ ಟ್ರೇಸ್ಗಳು ಇನ್ನೂ ಅಲೆದಾಡಬಹುದು; ಉತ್ಪನ್ನಗಳಲ್ಲಿ ಎಂಬೆಡ್ ಮಾಡಿದಾಗ ನಿಮಗೆ ಔಟ್ಪುಟ್ ಉದ್ದದ ಕ್ಯಾಪ್ಗಳು ಅಥವಾ ರೀಸನಿಂಗ್ ನಿರ್ಬಂಧಗಳು ಬೇಕಾಗಬಹುದು.
- ಗೌಪ್ಯತೆಯ ಅಪ್ಸೈಡ್: ಆನ್-ಡಿವೈಸ್ ರೀಸನಿಂಗ್ ಎಂದರೆ ಮಧ್ಯಂತರ ಹಂತಗಳು ಸಾಧನವನ್ನು ಬಿಡುವುದಿಲ್ಲ—ಸೂಕ್ಷ್ಮ ವರ್ಕ್ಫ್ಲೋಗಳಿಗೆ ಒಂದು ಗೆಲುವು.
MobileLLM‑R1 vs. ಇತರ ಆನ್-ಡಿವೈಸ್ ಆಯ್ಕೆಗಳು
ನಿಯೋಜನೆ ನಿರ್ಬಂಧಗಳು ಮತ್ತು ಮಾಡಬೇಕಾದ ಕೆಲಸದ ಬಗ್ಗೆ ಯೋಚಿಸಿ. ಇಲ್ಲಿ ಒಂದು ಪ್ರಾಯೋಗಿಕ ಲೆನ್ಸ್ ಇದೆ:
- Google Gemini Nano ವಿರುದ್ಧ: Nano ಆಳವಾದ Android ಇಂಟಿಗ್ರೇಶನ್ ಮತ್ತು ಆಪ್ಟಿಮೈಸ್ಡ್ ಕರ್ನಲ್ಗಳಿಂದ ಪ್ರಯೋಜನ ಪಡೆಯುತ್ತದೆ, ಆದರೆ MobileLLM‑R1 ಮುಕ್ತ ಪ್ರಯೋಗ ಮತ್ತು CPU-ಫಸ್ಟ್ ಪೋರ್ಟಬಿಲಿಟಿಗಾಗಿ ಆಕರ್ಷಕವಾಗಿದೆ.
- Apple ಆನ್-ಡಿವೈಸ್ ಮಾದರಿಗಳ ವಿರುದ್ಧ (A-ಸರಣಿ/NPU ಗಳು): Apple ನ ಸ್ಟಾಕ್ iOS/macOS ನಲ್ಲಿ ಲಂಬ ಆಪ್ಟಿಮೈಸೇಶನ್ನಲ್ಲಿ ಗೆಲ್ಲುತ್ತದೆ. MobileLLM‑R1 ಡೆವಲಪರ್ಗಳಿಗೆ ಮುಕ್ತ, ಪೋರ್ಟಬಲ್, ಕ್ರಾಸ್-ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಆಯ್ಕೆಯಾಗಿ ಸ್ಪರ್ಧಿಸುತ್ತದೆ.
- Qualcomm/X Elite NPU ಗಳ ವಿರುದ್ಧ: ನೀವು NPU ಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾದರೆ, ದೊಡ್ಡ ಕ್ವಾಂಟೈಜ್ಡ್ ಮಾದರಿಗಳು ಹೊಂದಿಕೊಳ್ಳಬಹುದು. ನೀವು ಉತ್ತಮ CPU-ಮಾತ್ರ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಖಾತರಿಪಡಿಸಬೇಕಾದಾಗ MobileLLM‑R1 ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.
- ಇತರ ಸಣ್ಣ LLM ಗಳ ವಿರುದ್ಧ: ಅನೇಕ ಸಬ್-2B ಮಾದರಿಗಳು ಚೆನ್ನಾಗಿ ಬರೆಯುತ್ತವೆ ಆದರೆ ಕಳಪೆಯಾಗಿ ತರ್ಕಿಸುತ್ತವೆ. MobileLLM‑R1 ಅದನ್ನು ತಿರುಗಿಸುತ್ತದೆ: ಮೊದಲು ರೀಸನಿಂಗ್, ನಂತರ ಶೈಲಿ. ಅದಕ್ಕೆ ಅನುಗುಣವಾಗಿ ಆಯ್ಕೆಮಾಡಿ.
ಗಮನಿಸಿ: ಈ ಹೋಲಿಕೆಗಳು ಸಾಮಾನ್ಯ ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಗುಣಲಕ್ಷಣಗಳು ಮತ್ತು ಆರಂಭಿಕ ಸಮುದಾಯ ವೀಕ್ಷಣೆಗಳನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತವೆ ಮತ್ತು ಒಂದೇ ಹೆಡ್-ಟು-ಹೆಡ್ ಲೀಡರ್ಬೋರ್ಡ್ ಅಲ್ಲ.
ನೈಜ-ಪ್ರಪಂಚದ ಬಳಕೆಯ ಪ್ರಕರಣಗಳು (ಸೆಟಪ್ ಸಲಹೆಗಳೊಂದಿಗೆ)
- ಖಾಸಗಿ ಡಾಕ್ಯುಮೆಂಟ್ ಪ್ರಶ್ನೋತ್ತರ: ಸ್ಥಳೀಯ PDF ಗಳನ್ನು ಎಂಬೆಡ್ ಮಾಡಿ, ಸರಳ ರಿಟ್ರೈವರ್ನೊಂದಿಗೆ ಚಂಕ್ ಮಾಡಿ ಮತ್ತು MobileLLM‑R1 ಆಫ್ಲೈನ್ನಲ್ಲಿ ಸಣ್ಣ, ಹಂತ-ಹಂತದ ಉತ್ತರಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಬಿಡಿ.
- ಸಲಹೆ: ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳನ್ನು ಸಾಧಾರಣವಾಗಿ ಇರಿಸಿ; ಕೇಂದ್ರೀಕೃತ ಪ್ರಾಂಪ್ಟ್ಗಳು ಮತ್ತು ಸಂಕ್ಷಿಪ್ತ ಚಂಕ್ಗಳನ್ನು ಆದ್ಯತೆ ನೀಡಿ.
- ಗಣಿತ-ಕೇಂದ್ರಿತ ಬೋಧನೆ: “ಸಂಖ್ಯೆಯ ಹಂತಗಳಲ್ಲಿ ಯೋಚಿಸಿ” ನಂತಹ ಸೂಚನೆಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಉದ್ದೇಶಪೂರ್ವಕ ಹಂತಗಳನ್ನು ಪ್ರೋತ್ಸಾಹಿಸಿ ಮತ್ತು ಸುಪ್ತತೆಯನ್ನು ನಿಯಂತ್ರಿಸಲು ಗರಿಷ್ಠ ಟೋಕನ್ಗಳನ್ನು ಕ್ಯಾಪ್ ಮಾಡಿ.
- ಹಗುರವಾದ ಕೋಡಿಂಗ್ ಸಹಾಯಕ: ವಿವರಣೆ ಮತ್ತು ಸಣ್ಣ ತುಣುಕುಗಳಿಗಾಗಿ ಇದನ್ನು ಬಳಸಿ. ದೊಡ್ಡ ರಿಫ್ಯಾಕ್ಟರ್ಗಳನ್ನು ಕ್ಲೌಡ್ ಮಾದರಿಗೆ ಆಫ್ಲೋಡ್ ಮಾಡಿ.
- ಸ್ಮಾರ್ಟ್ ಟಿಪ್ಪಣಿಗಳು ಮತ್ತು ಇಮೇಲ್ ಟ್ರೈಯೇಜ್: ಥ್ರೆಡ್ಗಳನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಸಾರಾಂಶ ಮಾಡಿ, ಪ್ರತ್ಯುತ್ತರಗಳನ್ನು ಸೂಚಿಸಿ ಮತ್ತು ಸೂಕ್ಷ್ಮ ವಿಷಯವನ್ನು ಆನ್-ಡಿವೈಸ್ನಲ್ಲಿ ಇರಿಸಿ.
- ಎಡ್ಜ್ ಅನಾಲಿಟಿಕ್ಸ್: ಎಡ್ಜ್ನಲ್ಲಿ ಸ್ಟ್ರೀಮ್ಗಳಲ್ಲಿ ಸ್ಯಾನಿಟಿ ಚೆಕ್ಗಳು ಅಥವಾ ಅನೋಮಲಿ ವಿವರಣೆಗಳನ್ನು ರನ್ ಮಾಡಿ, ನಂತರ ಸಾರಾಂಶಗಳನ್ನು ಮಾತ್ರ ಕ್ಲೌಡ್ಗೆ ಕಳುಹಿಸಿ.
ಡೆವಲಪರ್ ಅನುಭವ: ಮೂಲಮಾದರಿಯಿಂದ ಉತ್ಪಾದನೆಯವರೆಗೆ
- ಪ್ರಾಂಪ್ಟಿಂಗ್: ಸ್ಪಷ್ಟವಾದ ಹಂತದ ಗಡಿಗಳನ್ನು ಹೊಂದಿರುವ ಕೆಲವು-ಶಾಟ್ ಎಕ್ಸೆಂಪ್ಲರ್ಗಳು (ಉದಾ., “ಹಂತ 1… ಹಂತ 2…”) ಔಟ್ಪುಟ್ಗಳನ್ನು ಸ್ಥಿರಗೊಳಿಸುವ ಪ್ರವೃತ್ತಿಯನ್ನು ಹೊಂದಿವೆ.
- ಟೂಲ್ ಬಳಕೆ: ಗಣಿತದ ವಿಶ್ವಾಸಾರ್ಹತೆಗಾಗಿ ರಿಟ್ರೈವರ್ ಅಥವಾ ಸರಳ ಕ್ಯಾಲ್ಕುಲೇಟರ್ ಕಾರ್ಯದೊಂದಿಗೆ ಜೋಡಿಸಿ. ಮೂಲ ಇವಾಲ್ ರೂಟೀನ್ ಸಹ ಭ್ರಮೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.
- ನಿರ್ಬಂಧಗಳು: ಸುಪ್ತತೆಯನ್ನು ಊಹಿಸಬಹುದಾಗಿಡಲು ಇನ್ಪುಟ್ ಮತ್ತು ಔಟ್ಪುಟ್ ಎರಡಕ್ಕೂ ಹಾರ್ಡ್-ಲಿಮಿಟ್ ಟೋಕನ್ಗಳು. “ರೀಸನಿಂಗ್ ಬಜೆಟ್” ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಪರಿಗಣಿಸಿ.
- ಮಾನಿಟರಿಂಗ್: ನಿಮ್ಮ ಉತ್ಪನ್ನ ಡೊಮೇನ್ ಅನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ ಕಾರ್ಯಗಳ ಗೋಲ್ಡನ್ ಸೆಟ್ನಲ್ಲಿ ಸರಿಯಾದುದನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಿ, ಕೇವಲ ಸಾಮಾನ್ಯ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲ.
ಗೌಪ್ಯತೆ, ಭದ್ರತೆ ಮತ್ತು ಅನುಸರಣೆ
ಆನ್-ಡಿವೈಸ್ ಇನ್ಫರೆನ್ಸ್ ಡೀಫಾಲ್ಟ್ ಆಗಿ ಕಚ್ಚಾ ಇನ್ಪುಟ್ಗಳನ್ನು ಸ್ಥಳೀಯವಾಗಿರಿಸುತ್ತದೆ—ನಿಯಂತ್ರಿತ ಕೈಗಾರಿಕೆಗಳು ಮತ್ತು ಆಂತರಿಕ ಅಪ್ಲಿಕೇಶನ್ಗಳಿಗೆ ಉತ್ತಮವಾಗಿದೆ. ಇನ್ನೂ:
- ಲಾಗ್ ನೀತಿಗಳು: ಲಾಗ್ಗಳು ಸೂಕ್ಷ್ಮ ಟ್ರೇಸ್ಗಳನ್ನು ಸೋರಿಕೆ ಮಾಡುವುದಿಲ್ಲ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
- ಮಾದರಿ ನವೀಕರಣಗಳು: ತೂಕಗಳನ್ನು ಸೈನ್ ಮಾಡಿ ಮತ್ತು ಪರಿಶೀಲಿಸಿ. ರೋಲ್ಬ್ಯಾಕ್ ಮಾರ್ಗಗಳನ್ನು ಒದಗಿಸಿ.
- ಇವಾಲ್ ನೈರ್ಮಲ್ಯ: ಆಫ್ಲೈನ್ನಲ್ಲಿಯೂ ಸಹ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ರೆಸಿಲಿಯೆನ್ಸ್ಗಾಗಿ ಪರೀಕ್ಷಿಸಿ; ಸ್ಥಳೀಯ ಎಂದರೆ ವಿನಾಯಿತಿ ಅಲ್ಲ.
ಯಾರು ಈಗ MobileLLM‑R1 ಅನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳಬೇಕು?
- ಉತ್ತಮ ಫಿಟ್: ಗೌಪ್ಯತೆಗೆ ಮೊದಲ ಆದ್ಯತೆ ನೀಡುವ ಅಸಿಸ್ಟೆಂಟ್ಗಳನ್ನು ನಿರ್ಮಿಸುವ ಸ್ಟಾರ್ಟ್ಅಪ್ಗಳು, ಆನ್-ಪ್ರೆಮ್ ನಿರ್ಬಂಧಗಳನ್ನು ಹೊಂದಿರುವ ಉದ್ಯಮಗಳು ಮತ್ತು ವೇಗದ ಸ್ಥಳೀಯ ಲೂಪ್ಗಳ ಅಗತ್ಯವಿರುವ ಡೆವಲಪರ್ಗಳು.
- ಬಹುಶಃ ನಿರೀಕ್ಷಿಸಿ: ದೊಡ್ಡ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳು, ಶ್ರೀಮಂತ ಪ್ರಪಂಚದ ಜ್ಞಾನ ಅಥವಾ ಉನ್ನತ ದರ್ಜೆಯ ಕ್ರಿಯೇಟಿವ್ ಬರವಣಿಗೆ ಅಗತ್ಯವಿರುವ ತಂಡಗಳು.
ನೀವು ಆಫ್ಲೈನ್ ವಿಶ್ವಾಸಾರ್ಹತೆ ಮತ್ತು ಗೌಪ್ಯತೆ ಮುಖ್ಯವಾಗಿರುವ ಗ್ರಾಹಕ ವೈಶಿಷ್ಟ್ಯವನ್ನು ಸಾಗಿಸುತ್ತಿದ್ದರೆ, MobileLLM‑R1 ಇಂದು ಬಲವಂತವಾಗಿದೆ.
ಬೆಲೆ ಮತ್ತು ಲಭ್ಯತೆ
facebook/MobileLLM-R1-950M ಚೆಕ್ಪಾಯಿಂಟ್ ಪ್ರಯೋಗ ಮತ್ತು ಇಂಟಿಗ್ರೇಶನ್ ವಿವರಗಳಿಗಾಗಿ ಹಗ್ಗಿಂಗ್ ಫೇಸ್ ಮೂಲಕ ಲಭ್ಯವಿದೆ. ಸಮುದಾಯ ವೀಡಿಯೊಗಳು CPU ಗಳಲ್ಲಿ ಅನುಸ್ಥಾಪನೆ ಮತ್ತು ಸ್ಥಳೀಯ ಪರೀಕ್ಷೆಯ ಮೂಲಕ ನಡೆಯುತ್ತವೆ, ಇದು ತ್ವರಿತ ಪ್ರಾರಂಭಗಳಿಗೆ ಉಪಯುಕ್ತವಾಗಿದೆ.
ಹ್ಯಾಂಡ್ಸ್-ಆನ್: ತ್ವರಿತ ಪ್ರಾರಂಭದ ಸ್ಕೆಚ್
ಕೆಳಗೆ ಒಂದು ಪರಿಕಲ್ಪನಾ ಹರಿವು ಇದೆ. ನಿಮ್ಮ ಸ್ಟಾಕ್ಗೆ ಹೊಂದಿಸಿ.
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
ckpt = "facebook/MobileLLM-R1-950M"
tok = AutoTokenizer.from_pretrained(ckpt)
model = AutoModelForCausalLM.from_pretrained(
ckpt,
torch_dtype=torch.float16, # or int8/int4 via bitsandbytes/AutoGPTQ
device_map="auto"
)
prompt = "Solve 48/6 + 7*3. Show steps briefly."
inputs = tok(prompt, return_tensors="pt").to(model.device)
with torch.inference_mode:
out = model.generate(
**inputs,
max_new_tokens=160,
temperature=0.2,
do_sample=False
)
print(tok.decode(out[0], skip_special_tokens=True))
ಪ್ರಾಯೋಗಿಕ ಡೀಫಾಲ್ಟ್ಗಳು:
- ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ರೀಸನಿಂಗ್ಗಾಗಿ
temperature=0.2.
- ಸುಪ್ತತೆಯನ್ನು ಮಿತಿಗೊಳಿಸಲು
max_new_tokens=128–256.
- ಮೊದಲು INT8 ಅನ್ನು ಪ್ರಯತ್ನಿಸಿ; ಅಗತ್ಯವಿದ್ದರೆ ಮಾತ್ರ INT4 ಅನ್ನು ಪರಿಗಣಿಸಿ.
ಮಿತಿಗಳು ಮತ್ತು ಗೊಚಾಗಳು
- ರೀಸನಿಂಗ್ ಡ್ರಿಫ್ಟ್: ಕ್ಯಾಲ್ಕುಲೇಟರ್ಗಳು/ಟೂಲ್ಗಳಿಲ್ಲದೆ, ಅಂಕಗಣಿತವು ಜಾರಿಕೊಳ್ಳಬಹುದು. ಟೂಲ್ ಹುಕ್ಗಳು ಅಥವಾ ಪರಿಶೀಲನಾ ಪಾಸ್ಗಳನ್ನು ಸೇರಿಸಿ.
- ಕಾಂಟೆಕ್ಸ್ಟ್ ಮಿತಿಗಳು: ಪ್ರಾಂಪ್ಟ್ಗಳನ್ನು ಬಿಗಿಯಾಗಿ ಇರಿಸಿ; ಸಣ್ಣ ಚಂಕ್ಗಳೊಂದಿಗೆ ರಿಟ್ರೈವಲ್ ಅನ್ನು ಆದ್ಯತೆ ನೀಡಿ.
- ಔಟ್ಪುಟ್ ವರ್ಬೋಸಿಟಿ: R1 ಚೈನ್ಗಳು ಉದ್ದವಾಗಿರಬಹುದು. “ಸಂಕ್ಷಿಪ್ತವಾಗಿರಿ” ನಂತಹ ಸೂಚನೆಗಳನ್ನು ಬಳಸಿ ಮತ್ತು ಟೋಕನ್ ಕ್ಯಾಪ್ಗಳನ್ನು ಜಾರಿಗೊಳಿಸಿ.
ಬಾಟಮ್ ಲೈನ್
MobileLLM‑R1 ಅಪರೂಪದ ಕಾಂಬೊವನ್ನು ನೀಡುತ್ತದೆ: ಸಬ್-2B ಪ್ಯಾಕೇಜ್ನಲ್ಲಿ ಅರ್ಥೈಸಿಕೊಳ್ಳಬಹುದಾದ ರೀಸನಿಂಗ್ ಮತ್ತು ಪೋರ್ಟಬಲ್ ಕಾರ್ಯಕ್ಷಮತೆ. ಇದು ಮುಕ್ತ ಕಾರ್ಯಗಳಲ್ಲಿ ಕ್ಲೌಡ್ ಟೈಟಾನ್ಗಳನ್ನು ಕೆಳಗಿಳಿಸುವುದಿಲ್ಲ, ಆದರೆ ಖಾಸಗಿ, ಆಫ್ಲೈನ್-ಮೊದಲ ಅನುಭವಗಳನ್ನು ಶಕ್ತಿಯುತಗೊಳಿಸಲು ಇದು ಈಗಾಗಲೇ ಸಾಕಷ್ಟು ಉತ್ತಮವಾಗಿದೆ—ಮತ್ತು ಅದು ಹೊಸ ಉತ್ಪನ್ನ ವಿಭಾಗಗಳನ್ನು ಅನ್ಲಾಕ್ ಮಾಡುತ್ತದೆ.
ಗಮನಿಸಬೇಕಾದ ಅಂಶ: ನೀವು ಅನೇಕ ಮಾದರಿಗಳಲ್ಲಿ AI ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಮೂಲಮಾದರಿ ಮಾಡುತ್ತಿದ್ದರೆ, Sider.AI ನ ಮಲ್ಟಿ-ಮಾದರಿ ವರ್ಕ್ಸ್ಪೇಸ್ ನಿಮಗೆ A/B ಪ್ರಾಂಪ್ಟ್ಗಳಿಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಸ್ಥಳೀಯವಾಗಿ vs. ಕ್ಲೌಡ್ನಲ್ಲಿ ಸುಪ್ತತೆಯನ್ನು ಹೋಲಿಕೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ತಂಡಗಳಿಗಾಗಿ ಫಲಿತಾಂಶಗಳನ್ನು ದಾಖಲಿಸುತ್ತದೆ. ದೊಡ್ಡ LLM ಗಳ ಜೊತೆಗೆ MobileLLM‑R1 ಅನ್ನು ಟ್ಯೂನ್ ಮಾಡುವಾಗ ಅದು ಉಪಯುಕ್ತವಾಗಿದೆ, ಯಾವುದು ಆನ್-ಡಿವೈಸ್ನಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ ಮತ್ತು ಯಾವುದು ಕ್ಲೌಡ್ನಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು.
ಪ್ರಮುಖ ಸಂಗತಿಗಳು
- ಅದರ ಗಾತ್ರಕ್ಕೆ ರಚನಾತ್ಮಕ ರೀಸನಿಂಗ್ನಲ್ಲಿ ಪ್ರಬಲವಾಗಿದೆ; ಖಾಸಗಿ, ಆಫ್ಲೈನ್ ಕಾರ್ಯಗಳಿಗೆ ಸೂಕ್ತವಾಗಿದೆ.
- ಹಗ್ಗಿಂಗ್ ಫೇಸ್ ಮೂಲಕ ಸುಲಭ ಸ್ಥಳೀಯ ಪರೀಕ್ಷೆ; ಸಮುದಾಯ ಡೆಮೊಗಳು CPU ಕಾರ್ಯಸಾಧ್ಯತೆಯನ್ನು ತೋರಿಸುತ್ತವೆ.
- ಗಣಿತದಲ್ಲಿ ನಿಖರತೆಗಾಗಿ ಟೋಕನ್ ಬಜೆಟ್ಗಳನ್ನು ಗಮನದಲ್ಲಿಡಿ ಮತ್ತು ಮೂಲಭೂತ ಟೂಲ್ಗಳೊಂದಿಗೆ ಜೋಡಿಸಿ.
- ಅಸಿಸ್ಟೆಂಟ್ಗಳು, ಬೋಧನೆ ಮತ್ತು ಟ್ರೈಯೇಜ್ಗೆ ಉತ್ತಮವಾಗಿದೆ; ದೀರ್ಘ-ರೂಪದ ಸೃಜನಶೀಲತೆಗೆ ಕಡಿಮೆ ಸೂಕ್ತವಾಗಿದೆ.
FAQ
Q1:Meta MobileLLM‑R1 ಎಂದರೇನು ಮತ್ತು ಅದು ಏಕೆ ಮುಖ್ಯವಾಗಿದೆ?
MobileLLM‑R1 ಒಂದು ಕಾಂಪ್ಯಾಕ್ಟ್, ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ಮಾದರಿಯಾಗಿದ್ದು, ಆನ್-ಡಿವೈಸ್ AI ಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಇದು ಮುಖ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಇದು CPU ಗಳು ಮತ್ತು ಎಡ್ಜ್ ಹಾರ್ಡ್ವೇರ್ಗೆ ಚೈನ್-ಆಫ್-ಥಾಟ್-ಶೈಲಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ತರುತ್ತದೆ, ಖಾಸಗಿ, ಆಫ್ಲೈನ್ ಅಸಿಸ್ಟೆಂಟ್ಗಳು ಮತ್ತು ಗಣಿತ-ಕೇಂದ್ರಿತ ಕಾರ್ಯಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.
Q2:MobileLLM‑R1 ನನ್ನ ಲ್ಯಾಪ್ಟಾಪ್ ಅಥವಾ ಫೋನ್ನಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆಯೇ?
ಹೌದು, ಆರಂಭಿಕ ಪರೀಕ್ಷೆಗಳು MobileLLM‑R1‑950M ಸುಪ್ತತೆಯನ್ನು ತಪಾಸಣೆಯಲ್ಲಿಡಲು ಕ್ವಾಂಟೈಸೇಶನ್ನೊಂದಿಗೆ ಗ್ರಾಹಕ CPU ಗಳಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಆಗಬಲ್ಲದು ಎಂದು ತೋರಿಸುತ್ತವೆ. NPU ಗಳು ಅಥವಾ ಆಪ್ಟಿಮೈಸ್ಡ್ ಕರ್ನಲ್ಗಳನ್ನು ಹೊಂದಿರುವ ಸಾಧನಗಳಲ್ಲಿ ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನಿರೀಕ್ಷಿಸಿ.
Q3:MobileLLM‑R1 Google Gemini Nano ಅಥವಾ Apple ನ ಆನ್-ಡಿವೈಸ್ ಮಾದರಿಗಳಿಗೆ ಹೇಗೆ ಹೋಲುತ್ತದೆ?
Gemini Nano ಮತ್ತು Apple ನ ಸ್ಟಾಕ್ಗಳು ಬಿಗಿಯಾದ OS/ಹಾರ್ಡ್ವೇರ್ ಇಂಟಿಗ್ರೇಶನ್ನಿಂದ ಪ್ರಯೋಜನ ಪಡೆಯುತ್ತವೆ. MobileLLM‑R1 ಪೋರ್ಟಬಿಲಿಟಿ ಮತ್ತು ಮುಕ್ತ ಪ್ರವೇಶಕ್ಕಾಗಿ ಎದ್ದು ಕಾಣುತ್ತದೆ, ಇದು ಕ್ರಾಸ್-ಪ್ಲಾಟ್ಫಾರ್ಮ್ ಡೆವಲಪರ್ಗಳು ಮತ್ತು CPU-ಫಸ್ಟ್ ನಿಯೋಜನೆಗಳಿಗೆ ಆಕರ್ಷಕವಾಗಿದೆ.
Q4:MobileLLM‑R1 ಕೋಡಿಂಗ್ ಅಥವಾ ಗಣಿತಕ್ಕೆ ಉತ್ತಮವಾಗಿದೆಯೇ?
ಇದು ಅದರ ಗಾತ್ರಕ್ಕೆ ಗಣಿತ ಮತ್ತು ರಚನಾತ್ಮಕ ರೀಸನಿಂಗ್ನಲ್ಲಿ ವಿಶೇಷವಾಗಿ ಪ್ರಬಲವಾಗಿದೆ ಮತ್ತು ಕೋಡ್ಗಾಗಿ ಹಗುರವಾದ ಎಕ್ಸ್ಪ್ಲೇನರ್ ಅಥವಾ ಸಹಾಯಕರಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ದೊಡ್ಡ ರಿಫ್ಯಾಕ್ಟರ್ಗಳು ಅಥವಾ ವ್ಯಾಪಕ ಕಾಂಟೆಕ್ಸ್ಟ್ ಕಾರ್ಯಗಳಿಗಾಗಿ, ಅದನ್ನು ದೊಡ್ಡ ಕ್ಲೌಡ್ ಮಾದರಿಯೊಂದಿಗೆ ಜೋಡಿಸಿ.
Q5:MobileLLM‑R1 ಅನ್ನು ನಾನು ಎಲ್ಲಿ ಡೌನ್ಲೋಡ್ ಮಾಡಬಹುದು ಮತ್ತು ಡೆಮೊಗಳನ್ನು ನೋಡಬಹುದು?
ನೀವು ಹಗ್ಗಿಂಗ್ ಫೇಸ್ನಲ್ಲಿ MobileLLM‑R1‑950M ಚೆಕ್ಪಾಯಿಂಟ್ ಅನ್ನು ಕಾಣಬಹುದು ಮತ್ತು ಸೆಟಪ್ ಮತ್ತು ಪರೀಕ್ಷಾ ಮಾರ್ಗದರ್ಶನಕ್ಕಾಗಿ ಸಮುದಾಯ CPU ಡೆಮೊಗಳನ್ನು ವೀಕ್ಷಿಸಬಹುದು.