What is Meta MobileLLM‑R1 and why does it matter?

MobileLLM‑R1 is a compact, reasoning‑tuned model designed for on‑device AI. It matters because it brings chain‑of‑thought‑style performance to CPUs and edge hardware, enabling private, offline assistants and math‑centric tasks.

Can MobileLLM‑R1 run on my laptop or phone?

Yes, early tests show MobileLLM‑R1‑950M can run locally on consumer CPUs with quantization to keep latency in check. Expect better performance on devices with NPUs or optimized kernels.

How does MobileLLM‑R1 compare to Google Gemini Nano or Apple’s on‑device models?

Gemini Nano and Apple’s stacks benefit from tight OS/hardware integration. MobileLLM‑R1 stands out for portability and open access, making it attractive for cross‑platform devs and CPU‑first deployments.

Is MobileLLM‑R1 good for coding or math?

It’s particularly strong at math and structured reasoning for its size, and works as a lightweight explainer or helper for code. For large refactors or wide context tasks, pair it with a bigger cloud model.

Where can I download MobileLLM‑R1 and see demos?

You can find the MobileLLM‑R1‑950M checkpoint on Hugging Face and watch community CPU demos for setup and testing guidance.

Meta MobileLLM‑R1 ವಿಮರ್ಶೆ: ತೂಕಕ್ಕಿಂತ ಹೆಚ್ಚು ಪಂಚ್ ಮಾಡುವ ಪಾಕೆಟ್-ಗಾತ್ರದ ರೀಸನರ್

2023 ಕ್ಲೌಡ್ LLM ಗಳ ವರ್ಷವಾಗಿದ್ದರೆ, 2025 ಆನ್-ಡಿವೈಸ್ ಇಂಟೆಲಿಜೆನ್ಸ್‌ನ ವರ್ಷವಾಗುವತ್ತಾ ಸಾಗುತ್ತಿದೆ. Meta ದ MobileLLM‑R1 ಇದುವರೆಗಿನ ಸ್ಪಷ್ಟ ಸಂಕೇತವಾಗಿದೆ: ನಿಮ್ಮ ಡೇಟಾ ಇರುವಲ್ಲಿಯೇ ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಆಗಲು ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಕಾಂಪ್ಯಾಕ್ಟ್, ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ಮಾದರಿ. ಈ ವಿಮರ್ಶೆಯಲ್ಲಿ, MobileLLM‑R1 ಎಂದರೇನು, ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ, ಎಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ (ಮತ್ತು ಎಡವುತ್ತದೆ), ಮತ್ತು ನಿಮ್ಮ ಫೋನ್, ಲ್ಯಾಪ್‌ಟಾಪ್ ಅಥವಾ ಎಡ್ಜ್ ಡಿವೈಸ್ ಅನ್ನು ಚಾಲನೆ ಮಾಡಲು ಅದು ಸಿದ್ಧವಾಗಿದೆಯೇ ಎಂಬುದನ್ನು ನಾವು ಪರಿಶೀಲಿಸುತ್ತೇವೆ.

ವಿಷಯಗಳನ್ನು ವಾಸ್ತವವಾಗಿ ಇರಿಸಿಕೊಳ್ಳಲು, ನಾವು ಸಾರ್ವಜನಿಕ ಮಾದರಿ ಕಾರ್ಡ್, ಸಮುದಾಯದಿಂದ ಆರಂಭಿಕ ಹ್ಯಾಂಡ್ಸ್-ಆನ್ ಪರೀಕ್ಷೆಗಳು ಮತ್ತು ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಗುರಿ ಬಳಕೆಯ ಪ್ರಕರಣಗಳನ್ನು ಸಾರಾಂಶಿಸುವ ತಾಂತ್ರಿಕ ಬರಹಗಳನ್ನು ನೋಡಿದ್ದೇವೆ.

MobileLLM‑R1 ಎಂಬುದು CPU ಗಳು/ಎಡ್ಜ್ ಡಿವೈಸ್‌ಗಳಿಗಾಗಿ ಆಪ್ಟಿಮೈಸ್ ಮಾಡಲಾದ Meta ದ ಕಾಂಪ್ಯಾಕ್ಟ್ ರೀಸನಿಂಗ್ ಮಾದರಿಯಾಗಿದೆ.

950M-ಪ್ಯಾರಾಮೀಟರ್ ರೂಪಾಂತರವು ಮೆಮೊರಿ ಅಥವಾ ಬ್ಯಾಟರಿ ಬಜೆಟ್‌ಗಳನ್ನು ಹೆಚ್ಚಿಸದೆಯೇ ಚೈನ್-ಆಫ್-ಥಾಟ್-ಶೈಲಿಯ ರೀಸನಿಂಗ್ ಅನ್ನು ತಲುಪಿಸುವ ಗುರಿಯನ್ನು ಹೊಂದಿದೆ.

ಆರಂಭಿಕ ಪರೀಕ್ಷೆಗಳು ಇದು ಗ್ರಾಹಕ CPU ಗಳಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಆಗುತ್ತದೆ ಮತ್ತು ಅಂತಹುದೇ ಗಾತ್ರದ ಮಾದರಿಗಳಿಗಿಂತ ಗಣಿತ ಮತ್ತು ತರ್ಕ ಕಾರ್ಯಗಳನ್ನು ಉತ್ತಮವಾಗಿ ನಿಭಾಯಿಸಬಲ್ಲದು ಎಂದು ತೋರಿಸುತ್ತದೆ, ಸಾಂದರ್ಭಿಕವಾಗಿ ಕಿರಿದಾದ ಕಾರ್ಯಗಳಲ್ಲಿ ದೊಡ್ಡ ಬೇಸ್‌ಲೈನ್‌ಗಳಿಗೆ ಸವಾಲು ಹಾಕುತ್ತದೆ.

ಸಾಮರ್ಥ್ಯಗಳು: ಗೌಪ್ಯತೆ, ಆಫ್‌ಲೈನ್ ವಿಶ್ವಾಸಾರ್ಹತೆ, ಸಣ್ಣ ಪ್ರಾಂಪ್ಟ್‌ಗಳಿಗೆ ಪ್ರತಿಕ್ರಿಯಾತ್ಮಕತೆ ಮತ್ತು ದಕ್ಷತೆ.

ದೌರ್ಬಲ್ಯಗಳು: ಸಣ್ಣ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳು, ಸಾಂದರ್ಭಿಕ ರೀಸನಿಂಗ್ ದುರ್ಬಲತೆ ಮತ್ತು ದೊಡ್ಡ ಕ್ಲೌಡ್ LLM ಗಳಿಗಿಂತ ನಿಧಾನವಾದ ಮಲ್ಟಿ-ಸ್ಟೆಪ್ ಚೈನ್‌ಗಳು.

ನಾವು ಇಲ್ಲಿ ಪ್ರಾಯೋಗಿಕ ಮತ್ತು ಪರಿಹಾರ-ಆಧಾರಿತ ವಿಧಾನವನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತಿದ್ದೇವೆ: ನೈಜ ಸಾಮರ್ಥ್ಯಗಳು, ಸ್ಪಷ್ಟ ಟ್ರೇಡ್-ಆಫ್‌ಗಳು ಮತ್ತು ನೀವು ಈಗ ಅದನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳಬೇಕೆ ಎಂಬುದರ ಕುರಿತು ಮಾರ್ಗದರ್ಶನ.

MobileLLM‑R1 ನಿಖರವಾಗಿ ಏನು?

MobileLLM‑R1 ಭಾಗ ಮಾದರಿ ಕುಟುಂಬ, ಭಾಗ ಭರವಸೆ: ಸೀಮಿತ ಕಂಪ್ಯೂಟ್‌ನೊಂದಿಗೆ ಸಾಧನಗಳಲ್ಲಿ ಉಪಯುಕ್ತ ರೀಸನಿಂಗ್ ಅನ್ನು ತಲುಪಿಸಲು ತರಬೇತಿ ಪಡೆದ ಮತ್ತು ಆಪ್ಟಿಮೈಸ್ ಮಾಡಿದ ಕಾಂಪ್ಯಾಕ್ಟ್ LLM. “R1” ಬ್ರ್ಯಾಂಡಿಂಗ್ ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ರೆಸಿಪಿಗೆ ಸೂಚಿಸುತ್ತದೆ— ಯೋಚಿಸಿ: ರಚನಾತ್ಮಕ ಹಂತ-ಹಂತದ ಚಿಂತನೆ, ಗಣಿತ ಸಾಮರ್ಥ್ಯ ಮತ್ತು ಉದ್ದೇಶಪೂರ್ವಕ ಮಧ್ಯಂತರ ರೀಸನಿಂಗ್ ಟ್ರೇಸ್‌ಗಳು.

ಪ್ಯಾರಾಮೀಟರ್ ಗಾತ್ರ: ವ್ಯಾಪಕವಾಗಿ ಚರ್ಚಿಸಲಾದ ಚೆಕ್‌ಪಾಯಿಂಟ್ ~950M ಪ್ಯಾರಾಮೀಟರ್‌ಗಳು (MobileLLM‑R1‑950M).

ನಿಯೋಜನೆ ಗುರಿ: ಗ್ರಾಹಕ CPU ಗಳು/NPU ಗಳು ಮತ್ತು ಸುಪ್ತತೆ, ಮೆಮೊರಿ ಮತ್ತು ಪವರ್ ಮುಖ್ಯವಾಗಿರುವ ಎಡ್ಜ್ ಡಿವೈಸ್‌ಗಳು.

ಬಳಕೆಯ ಪ್ರಕರಣಗಳು: ಆನ್-ಡಿವೈಸ್ ಅಸಿಸ್ಟೆಂಟ್‌ಗಳು, ಗಣಿತ/ತರ್ಕ ಸಹಾಯಕರು, ಹಗುರವಾದ ಕೋಡಿಂಗ್ ಸಲಹೆಗಳು, ಸಾರಾಂಶ ಮತ್ತು ಖಾಸಗಿ ಡಾಕ್ಯುಮೆಂಟ್ ಪ್ರಶ್ನೋತ್ತರ.

ಪ್ರಸ್ತಾಪ: ಕ್ಲೌಡ್ ಡಿಪೆಂಡೆನ್ಸಿ ಇಲ್ಲದೆ “ಸಾಕಷ್ಟು ಉತ್ತಮ” ಚೈನ್-ಆಫ್-ಥಾಟ್-ರೀತಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಪಡೆಯಿರಿ—ಗೌಪ್ಯತೆಗೆ ಸೂಕ್ಷ್ಮವಾದ ಅಥವಾ ಆಫ್‌ಲೈನ್-ಫಸ್ಟ್ ವರ್ಕ್‌ಫ್ಲೋಗಳಿಗೆ ಉಪಯುಕ್ತವಾಗಿದೆ.

ವಿಶೇಷಣಗಳು ಮತ್ತು ಸೆಟಪ್: ಅದನ್ನು ರನ್ ಮಾಡಲು ನಿಮಗೆ ಏನು ಬೇಕು

Meta ಹೊಳಪುಳ್ಳ ಡೇಟಾಶೀಟ್ ಅನ್ನು ಪ್ರಕಟಿಸದಿದ್ದರೂ, ಮಾದರಿ ಕಾರ್ಡ್ ಮತ್ತು ಸಮುದಾಯ ಡೆಮೊಗಳು ಕಾರ್ಯಸಾಧ್ಯವಾದ ಚಿತ್ರವನ್ನು ಒದಗಿಸುತ್ತವೆ:

ಚೆಕ್‌ಪಾಯಿಂಟ್: facebook/MobileLLM-R1-950M ಹಗ್ಗಿಂಗ್ ಫೇಸ್ ಹಬ್ ಮೂಲಕ.

ಹಾರ್ಡ್‌ವೇರ್: ಆಧುನಿಕ ಗ್ರಾಹಕ CPU ಗಳಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ; AVX/AMX ಮತ್ತು NPU ಗಳೊಂದಿಗೆ ವೇಗವರ್ಧನೆ ಸುಧಾರಿಸುತ್ತದೆ. ಸ್ಥಳೀಯ CPU ಇನ್‌ಫರೆನ್ಸ್ ಕಾರ್ಯಸಾಧ್ಯವೆಂದು ಸಮುದಾಯ ಡೆಮೊಗಳು ತೋರಿಸುತ್ತವೆ.

ಮೆಮೊರಿ ಹೆಜ್ಜೆಗುರುತು: ಸಬ್-2B ಮಾದರಿಗಳು ಸಾಮಾನ್ಯವಾಗಿ ಕ್ವಾಂಟೈಜ್ ಮಾಡಿದಾಗ ಕೆಲವು GB ಒಳಗೆ ಹೊಂದಿಕೊಳ್ಳುತ್ತವೆ. ಆರಾಮದಾಯಕ ಡೆವ್ ಪ್ರಯೋಗಕ್ಕಾಗಿ 8-16 GB RAM ಅನ್ನು ನಿರೀಕ್ಷಿಸಿ; ಆಕ್ರಮಣಕಾರಿ ಕ್ವಾಂಟೈಸೇಶನ್‌ನೊಂದಿಗೆ ಬಿಗಿಯಾದ ಸೆಟಪ್‌ಗಳಿಗೆ 4-8 GB ಸಾಧ್ಯ.

ಕ್ವಾಂಟೈಸೇಶನ್: INT8/INT4 ಕ್ವಾಂಟೈಸೇಶನ್ CPU ನಲ್ಲಿ ಸುಪ್ತತೆಯನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ ಮತ್ತು ಮೊಬೈಲ್/ಎಡ್ಜ್‌ನಲ್ಲಿ ಬ್ಯಾಟರಿ ಅವಧಿಯನ್ನು ವಿಸ್ತರಿಸುತ್ತದೆ.

ಪ್ರಾಯೋಗಿಕ ಸಲಹೆ: INT8 ನೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ. ನೀವು ಬಾಟಲ್‌ನೆಕ್ ಆಗಿದ್ದರೆ, INT4 ಅನ್ನು ಪರೀಕ್ಷಿಸಿ—ಮತ್ತು ದೀರ್ಘ ಚೈನ್‌ಗಳಲ್ಲಿ ರೀಸನಿಂಗ್ ಡಿಗ್ರೇಡೇಶನ್ ಅನ್ನು ಗಮನಿಸಿ.

ಕಾರ್ಯಕ್ಷಮತೆ ಮತ್ತು ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳು: ಅದು ಎಲ್ಲಿ ಆಶ್ಚರ್ಯಗೊಳಿಸುತ್ತದೆ

MobileLLM‑R1 ತನ್ನ ಗಾತ್ರಕ್ಕೆ ಗಣಿತ ಮತ್ತು ರಚನಾತ್ಮಕ ರೀಸನಿಂಗ್‌ನಲ್ಲಿ ಅಸಾಧಾರಣವಾಗಿ ಪ್ರಬಲವಾಗಿದೆ ಎಂದು ಆರಂಭಿಕ ವ್ಯಾಖ್ಯಾನವು ಒತ್ತಿಹೇಳುತ್ತದೆ, ಕೆಲವೊಮ್ಮೆ ವಿಶೇಷ ಕಾರ್ಯಗಳಲ್ಲಿ ದೊಡ್ಡ ಮಾದರಿಗಳ ಹಿಮ್ಮಡಿಯ ಮೇಲೆ ಹೆಜ್ಜೆ ಹಾಕುತ್ತದೆ. ಸಮುದಾಯ ಪರೀಕ್ಷೆಗಳು ತೋರಿಸುತ್ತವೆ:

ರೀಸನಿಂಗ್ ಫಿಡೆಲಿಟಿ: ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ತರಬೇತಿಯಿಂದ ಸಕ್ರಿಯಗೊಳಿಸಲಾದ ಮಧ್ಯಂತರ ಹಂತಗಳೊಂದಿಗೆ ರಚನಾತ್ಮಕ ಮಲ್ಟಿ-ಸ್ಟೆಪ್ ಉತ್ತರಗಳು.

ಸುಪ್ತತೆ: ಸಣ್ಣ ಮತ್ತು ಮಧ್ಯಮ ಪ್ರಾಂಪ್ಟ್‌ಗಳಿಗೆ CPU ನಲ್ಲಿ ಸ್ವೀಕಾರಾರ್ಹ; ಕ್ವಾಂಟೈಸೇಶನ್ ಮತ್ತು ಸಣ್ಣ ಕಾಂಟೆಕ್ಸ್ಟ್‌ನೊಂದಿಗೆ ಗ್ರಹಿಸಬಹುದಾದಷ್ಟು ವೇಗವಾಗಿರುತ್ತದೆ.

ಸ್ಥಿರತೆ: ಅಮೂರ್ತ, ಮುಕ್ತ ಉತ್ಪಾದನೆಗಿಂತ ನಿರ್ಣಾಯಕ ಗಣಿತ/ತರ್ಕದಲ್ಲಿ ಪ್ರಬಲವಾಗಿದೆ (ಇಲ್ಲಿ ದೊಡ್ಡ ಮಾದರಿಗಳು ಇನ್ನೂ ಪ್ರಾಬಲ್ಯ ಹೊಂದಿವೆ).

ಅದು ಎಲ್ಲಿ ಹಿಂದೆ ಬೀಳುತ್ತದೆ: ಬಹಳ ಉದ್ದವಾದ ಚೈನ್‌ಗಳು, ಸೂಕ್ಷ್ಮವಾದ ಪ್ರಪಂಚದ ಜ್ಞಾನ ಮತ್ತು ವ್ಯಾಪಕ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳು ಅಥವಾ ಶ್ರೀಮಂತ ಸಾಮಾನ್ಯ ಜ್ಞಾನದ ಅಗತ್ಯವಿರುವ ಕಾರ್ಯಗಳು.

R1 ಮತ್ತು ಚೈನ್-ಆಫ್-ಥಾಟ್: ಟ್ರೇಡ್-ಆಫ್ ಏನು?

R1-ಶೈಲಿಯ ಮಾದರಿಗಳು ಹಂತ ಹಂತದ ರೀಸನಿಂಗ್‌ಗೆ ಒಲವು ತೋರುತ್ತವೆ. ಅದು ಪ್ರಬಲವಾಗಿದೆ—ಆದರೆ ಅದು ಪರಿಗಣನೆಗಳೊಂದಿಗೆ ಬರುತ್ತದೆ:

ಪಾರದರ್ಶಕತೆ vs. ವರ್ಬೋಸಿಟಿ: ನೀವು ಅರ್ಥೈಸಿಕೊಳ್ಳಬಹುದಾದ ಹಂತಗಳನ್ನು ಪಡೆಯುತ್ತೀರಿ, ಆದರೆ ದೀರ್ಘವಾದ ಔಟ್‌ಪುಟ್‌ಗಳು ಸುಪ್ತತೆ ಮತ್ತು ಟೋಕನ್ ವೆಚ್ಚಗಳನ್ನು ಹೆಚ್ಚಿಸಬಹುದು.

ಗಾರ್ಡ್‌ರೈಲ್ಸ್: ರೀಸನಿಂಗ್ ಟ್ರೇಸ್‌ಗಳು ಇನ್ನೂ ಅಲೆದಾಡಬಹುದು; ಉತ್ಪನ್ನಗಳಲ್ಲಿ ಎಂಬೆಡ್ ಮಾಡಿದಾಗ ನಿಮಗೆ ಔಟ್‌ಪುಟ್ ಉದ್ದದ ಕ್ಯಾಪ್‌ಗಳು ಅಥವಾ ರೀಸನಿಂಗ್ ನಿರ್ಬಂಧಗಳು ಬೇಕಾಗಬಹುದು.

ಗೌಪ್ಯತೆಯ ಅಪ್‌ಸೈಡ್: ಆನ್-ಡಿವೈಸ್ ರೀಸನಿಂಗ್ ಎಂದರೆ ಮಧ್ಯಂತರ ಹಂತಗಳು ಸಾಧನವನ್ನು ಬಿಡುವುದಿಲ್ಲ—ಸೂಕ್ಷ್ಮ ವರ್ಕ್‌ಫ್ಲೋಗಳಿಗೆ ಒಂದು ಗೆಲುವು.

MobileLLM‑R1 vs. ಇತರ ಆನ್-ಡಿವೈಸ್ ಆಯ್ಕೆಗಳು

ನಿಯೋಜನೆ ನಿರ್ಬಂಧಗಳು ಮತ್ತು ಮಾಡಬೇಕಾದ ಕೆಲಸದ ಬಗ್ಗೆ ಯೋಚಿಸಿ. ಇಲ್ಲಿ ಒಂದು ಪ್ರಾಯೋಗಿಕ ಲೆನ್ಸ್ ಇದೆ:

Google Gemini Nano ವಿರುದ್ಧ: Nano ಆಳವಾದ Android ಇಂಟಿಗ್ರೇಶನ್ ಮತ್ತು ಆಪ್ಟಿಮೈಸ್ಡ್ ಕರ್ನಲ್‌ಗಳಿಂದ ಪ್ರಯೋಜನ ಪಡೆಯುತ್ತದೆ, ಆದರೆ MobileLLM‑R1 ಮುಕ್ತ ಪ್ರಯೋಗ ಮತ್ತು CPU-ಫಸ್ಟ್ ಪೋರ್ಟಬಿಲಿಟಿಗಾಗಿ ಆಕರ್ಷಕವಾಗಿದೆ.

Apple ಆನ್-ಡಿವೈಸ್ ಮಾದರಿಗಳ ವಿರುದ್ಧ (A-ಸರಣಿ/NPU ಗಳು): Apple ನ ಸ್ಟಾಕ್ iOS/macOS ನಲ್ಲಿ ಲಂಬ ಆಪ್ಟಿಮೈಸೇಶನ್‌ನಲ್ಲಿ ಗೆಲ್ಲುತ್ತದೆ. MobileLLM‑R1 ಡೆವಲಪರ್‌ಗಳಿಗೆ ಮುಕ್ತ, ಪೋರ್ಟಬಲ್, ಕ್ರಾಸ್-ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಆಯ್ಕೆಯಾಗಿ ಸ್ಪರ್ಧಿಸುತ್ತದೆ.

Qualcomm/X Elite NPU ಗಳ ವಿರುದ್ಧ: ನೀವು NPU ಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳಲು ಸಾಧ್ಯವಾದರೆ, ದೊಡ್ಡ ಕ್ವಾಂಟೈಜ್ಡ್ ಮಾದರಿಗಳು ಹೊಂದಿಕೊಳ್ಳಬಹುದು. ನೀವು ಉತ್ತಮ CPU-ಮಾತ್ರ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಖಾತರಿಪಡಿಸಬೇಕಾದಾಗ MobileLLM‑R1 ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.

ಇತರ ಸಣ್ಣ LLM ಗಳ ವಿರುದ್ಧ: ಅನೇಕ ಸಬ್-2B ಮಾದರಿಗಳು ಚೆನ್ನಾಗಿ ಬರೆಯುತ್ತವೆ ಆದರೆ ಕಳಪೆಯಾಗಿ ತರ್ಕಿಸುತ್ತವೆ. MobileLLM‑R1 ಅದನ್ನು ತಿರುಗಿಸುತ್ತದೆ: ಮೊದಲು ರೀಸನಿಂಗ್, ನಂತರ ಶೈಲಿ. ಅದಕ್ಕೆ ಅನುಗುಣವಾಗಿ ಆಯ್ಕೆಮಾಡಿ.

ಗಮನಿಸಿ: ಈ ಹೋಲಿಕೆಗಳು ಸಾಮಾನ್ಯ ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಗುಣಲಕ್ಷಣಗಳು ಮತ್ತು ಆರಂಭಿಕ ಸಮುದಾಯ ವೀಕ್ಷಣೆಗಳನ್ನು ಪ್ರತಿಬಿಂಬಿಸುತ್ತವೆ ಮತ್ತು ಒಂದೇ ಹೆಡ್-ಟು-ಹೆಡ್ ಲೀಡರ್‌ಬೋರ್ಡ್ ಅಲ್ಲ.

ನೈಜ-ಪ್ರಪಂಚದ ಬಳಕೆಯ ಪ್ರಕರಣಗಳು (ಸೆಟಪ್ ಸಲಹೆಗಳೊಂದಿಗೆ)

ಖಾಸಗಿ ಡಾಕ್ಯುಮೆಂಟ್ ಪ್ರಶ್ನೋತ್ತರ: ಸ್ಥಳೀಯ PDF ಗಳನ್ನು ಎಂಬೆಡ್ ಮಾಡಿ, ಸರಳ ರಿಟ್ರೈವರ್‌ನೊಂದಿಗೆ ಚಂಕ್ ಮಾಡಿ ಮತ್ತು MobileLLM‑R1 ಆಫ್‌ಲೈನ್‌ನಲ್ಲಿ ಸಣ್ಣ, ಹಂತ-ಹಂತದ ಉತ್ತರಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಬಿಡಿ.

ಸಲಹೆ: ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳನ್ನು ಸಾಧಾರಣವಾಗಿ ಇರಿಸಿ; ಕೇಂದ್ರೀಕೃತ ಪ್ರಾಂಪ್ಟ್‌ಗಳು ಮತ್ತು ಸಂಕ್ಷಿಪ್ತ ಚಂಕ್‌ಗಳನ್ನು ಆದ್ಯತೆ ನೀಡಿ.

ಗಣಿತ-ಕೇಂದ್ರಿತ ಬೋಧನೆ: “ಸಂಖ್ಯೆಯ ಹಂತಗಳಲ್ಲಿ ಯೋಚಿಸಿ” ನಂತಹ ಸೂಚನೆಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಉದ್ದೇಶಪೂರ್ವಕ ಹಂತಗಳನ್ನು ಪ್ರೋತ್ಸಾಹಿಸಿ ಮತ್ತು ಸುಪ್ತತೆಯನ್ನು ನಿಯಂತ್ರಿಸಲು ಗರಿಷ್ಠ ಟೋಕನ್‌ಗಳನ್ನು ಕ್ಯಾಪ್ ಮಾಡಿ.

ಹಗುರವಾದ ಕೋಡಿಂಗ್ ಸಹಾಯಕ: ವಿವರಣೆ ಮತ್ತು ಸಣ್ಣ ತುಣುಕುಗಳಿಗಾಗಿ ಇದನ್ನು ಬಳಸಿ. ದೊಡ್ಡ ರಿಫ್ಯಾಕ್ಟರ್‌ಗಳನ್ನು ಕ್ಲೌಡ್ ಮಾದರಿಗೆ ಆಫ್‌ಲೋಡ್ ಮಾಡಿ.

ಸ್ಮಾರ್ಟ್ ಟಿಪ್ಪಣಿಗಳು ಮತ್ತು ಇಮೇಲ್ ಟ್ರೈಯೇಜ್: ಥ್ರೆಡ್‌ಗಳನ್ನು ಸ್ಥಳೀಯವಾಗಿ ಸಾರಾಂಶ ಮಾಡಿ, ಪ್ರತ್ಯುತ್ತರಗಳನ್ನು ಸೂಚಿಸಿ ಮತ್ತು ಸೂಕ್ಷ್ಮ ವಿಷಯವನ್ನು ಆನ್-ಡಿವೈಸ್‌ನಲ್ಲಿ ಇರಿಸಿ.

ಎಡ್ಜ್ ಅನಾಲಿಟಿಕ್ಸ್: ಎಡ್ಜ್‌ನಲ್ಲಿ ಸ್ಟ್ರೀಮ್‌ಗಳಲ್ಲಿ ಸ್ಯಾನಿಟಿ ಚೆಕ್‌ಗಳು ಅಥವಾ ಅನೋಮಲಿ ವಿವರಣೆಗಳನ್ನು ರನ್ ಮಾಡಿ, ನಂತರ ಸಾರಾಂಶಗಳನ್ನು ಮಾತ್ರ ಕ್ಲೌಡ್‌ಗೆ ಕಳುಹಿಸಿ.

ಡೆವಲಪರ್ ಅನುಭವ: ಮೂಲಮಾದರಿಯಿಂದ ಉತ್ಪಾದನೆಯವರೆಗೆ

ಪ್ರಾಂಪ್ಟಿಂಗ್: ಸ್ಪಷ್ಟವಾದ ಹಂತದ ಗಡಿಗಳನ್ನು ಹೊಂದಿರುವ ಕೆಲವು-ಶಾಟ್ ಎಕ್ಸೆಂಪ್ಲರ್‌ಗಳು (ಉದಾ., “ಹಂತ 1… ಹಂತ 2…”) ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ಸ್ಥಿರಗೊಳಿಸುವ ಪ್ರವೃತ್ತಿಯನ್ನು ಹೊಂದಿವೆ.

ಟೂಲ್ ಬಳಕೆ: ಗಣಿತದ ವಿಶ್ವಾಸಾರ್ಹತೆಗಾಗಿ ರಿಟ್ರೈವರ್ ಅಥವಾ ಸರಳ ಕ್ಯಾಲ್ಕುಲೇಟರ್ ಕಾರ್ಯದೊಂದಿಗೆ ಜೋಡಿಸಿ. ಮೂಲ ಇವಾಲ್ ರೂಟೀನ್ ಸಹ ಭ್ರಮೆಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.

ನಿರ್ಬಂಧಗಳು: ಸುಪ್ತತೆಯನ್ನು ಊಹಿಸಬಹುದಾಗಿಡಲು ಇನ್‌ಪುಟ್ ಮತ್ತು ಔಟ್‌ಪುಟ್ ಎರಡಕ್ಕೂ ಹಾರ್ಡ್-ಲಿಮಿಟ್ ಟೋಕನ್‌ಗಳು. “ರೀಸನಿಂಗ್ ಬಜೆಟ್” ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಪರಿಗಣಿಸಿ.

ಮಾನಿಟರಿಂಗ್: ನಿಮ್ಮ ಉತ್ಪನ್ನ ಡೊಮೇನ್ ಅನ್ನು ಪ್ರತಿಬಿಂಬಿಸುವ ಕಾರ್ಯಗಳ ಗೋಲ್ಡನ್ ಸೆಟ್‌ನಲ್ಲಿ ಸರಿಯಾದುದನ್ನು ಟ್ರ್ಯಾಕ್ ಮಾಡಿ, ಕೇವಲ ಸಾಮಾನ್ಯ ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳಲ್ಲ.

ಗೌಪ್ಯತೆ, ಭದ್ರತೆ ಮತ್ತು ಅನುಸರಣೆ

ಆನ್-ಡಿವೈಸ್ ಇನ್‌ಫರೆನ್ಸ್ ಡೀಫಾಲ್ಟ್ ಆಗಿ ಕಚ್ಚಾ ಇನ್‌ಪುಟ್‌ಗಳನ್ನು ಸ್ಥಳೀಯವಾಗಿರಿಸುತ್ತದೆ—ನಿಯಂತ್ರಿತ ಕೈಗಾರಿಕೆಗಳು ಮತ್ತು ಆಂತರಿಕ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ಉತ್ತಮವಾಗಿದೆ. ಇನ್ನೂ:

ಲಾಗ್ ನೀತಿಗಳು: ಲಾಗ್‌ಗಳು ಸೂಕ್ಷ್ಮ ಟ್ರೇಸ್‌ಗಳನ್ನು ಸೋರಿಕೆ ಮಾಡುವುದಿಲ್ಲ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.

ಮಾದರಿ ನವೀಕರಣಗಳು: ತೂಕಗಳನ್ನು ಸೈನ್ ಮಾಡಿ ಮತ್ತು ಪರಿಶೀಲಿಸಿ. ರೋಲ್‌ಬ್ಯಾಕ್ ಮಾರ್ಗಗಳನ್ನು ಒದಗಿಸಿ.

ಇವಾಲ್ ನೈರ್ಮಲ್ಯ: ಆಫ್‌ಲೈನ್‌ನಲ್ಲಿಯೂ ಸಹ ಪ್ರಾಂಪ್ಟ್ ಇಂಜೆಕ್ಷನ್ ರೆಸಿಲಿಯೆನ್ಸ್‌ಗಾಗಿ ಪರೀಕ್ಷಿಸಿ; ಸ್ಥಳೀಯ ಎಂದರೆ ವಿನಾಯಿತಿ ಅಲ್ಲ.

ಯಾರು ಈಗ MobileLLM‑R1 ಅನ್ನು ಅಳವಡಿಸಿಕೊಳ್ಳಬೇಕು?

ಉತ್ತಮ ಫಿಟ್: ಗೌಪ್ಯತೆಗೆ ಮೊದಲ ಆದ್ಯತೆ ನೀಡುವ ಅಸಿಸ್ಟೆಂಟ್‌ಗಳನ್ನು ನಿರ್ಮಿಸುವ ಸ್ಟಾರ್ಟ್‌ಅಪ್‌ಗಳು, ಆನ್-ಪ್ರೆಮ್ ನಿರ್ಬಂಧಗಳನ್ನು ಹೊಂದಿರುವ ಉದ್ಯಮಗಳು ಮತ್ತು ವೇಗದ ಸ್ಥಳೀಯ ಲೂಪ್‌ಗಳ ಅಗತ್ಯವಿರುವ ಡೆವಲಪರ್‌ಗಳು.

ಬಹುಶಃ ನಿರೀಕ್ಷಿಸಿ: ದೊಡ್ಡ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋಗಳು, ಶ್ರೀಮಂತ ಪ್ರಪಂಚದ ಜ್ಞಾನ ಅಥವಾ ಉನ್ನತ ದರ್ಜೆಯ ಕ್ರಿಯೇಟಿವ್ ಬರವಣಿಗೆ ಅಗತ್ಯವಿರುವ ತಂಡಗಳು.

ನೀವು ಆಫ್‌ಲೈನ್ ವಿಶ್ವಾಸಾರ್ಹತೆ ಮತ್ತು ಗೌಪ್ಯತೆ ಮುಖ್ಯವಾಗಿರುವ ಗ್ರಾಹಕ ವೈಶಿಷ್ಟ್ಯವನ್ನು ಸಾಗಿಸುತ್ತಿದ್ದರೆ, MobileLLM‑R1 ಇಂದು ಬಲವಂತವಾಗಿದೆ.

ಬೆಲೆ ಮತ್ತು ಲಭ್ಯತೆ

facebook/MobileLLM-R1-950M ಚೆಕ್‌ಪಾಯಿಂಟ್ ಪ್ರಯೋಗ ಮತ್ತು ಇಂಟಿಗ್ರೇಶನ್ ವಿವರಗಳಿಗಾಗಿ ಹಗ್ಗಿಂಗ್ ಫೇಸ್ ಮೂಲಕ ಲಭ್ಯವಿದೆ. ಸಮುದಾಯ ವೀಡಿಯೊಗಳು CPU ಗಳಲ್ಲಿ ಅನುಸ್ಥಾಪನೆ ಮತ್ತು ಸ್ಥಳೀಯ ಪರೀಕ್ಷೆಯ ಮೂಲಕ ನಡೆಯುತ್ತವೆ, ಇದು ತ್ವರಿತ ಪ್ರಾರಂಭಗಳಿಗೆ ಉಪಯುಕ್ತವಾಗಿದೆ.

ಹ್ಯಾಂಡ್ಸ್-ಆನ್: ತ್ವರಿತ ಪ್ರಾರಂಭದ ಸ್ಕೆಚ್

ಕೆಳಗೆ ಒಂದು ಪರಿಕಲ್ಪನಾ ಹರಿವು ಇದೆ. ನಿಮ್ಮ ಸ್ಟಾಕ್‌ಗೆ ಹೊಂದಿಸಿ.

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
ckpt = "facebook/MobileLLM-R1-950M"
tok = AutoTokenizer.from_pretrained(ckpt)
model = AutoModelForCausalLM.from_pretrained(
 ckpt,
 torch_dtype=torch.float16, # or int8/int4 via bitsandbytes/AutoGPTQ
 device_map="auto"
)
prompt = "Solve 48/6 + 7*3. Show steps briefly."
inputs = tok(prompt, return_tensors="pt").to(model.device)
with torch.inference_mode:
 out = model.generate(
 **inputs,
 max_new_tokens=160,
 temperature=0.2,
 do_sample=False
 )
print(tok.decode(out[0], skip_special_tokens=True))

ಪ್ರಾಯೋಗಿಕ ಡೀಫಾಲ್ಟ್‌ಗಳು:

ಹೆಚ್ಚು ಸ್ಥಿರವಾದ ರೀಸನಿಂಗ್‌ಗಾಗಿ temperature=0.2.

ಸುಪ್ತತೆಯನ್ನು ಮಿತಿಗೊಳಿಸಲು max_new_tokens=128–256.

ಮೊದಲು INT8 ಅನ್ನು ಪ್ರಯತ್ನಿಸಿ; ಅಗತ್ಯವಿದ್ದರೆ ಮಾತ್ರ INT4 ಅನ್ನು ಪರಿಗಣಿಸಿ.

ಮಿತಿಗಳು ಮತ್ತು ಗೊಚಾಗಳು

ರೀಸನಿಂಗ್ ಡ್ರಿಫ್ಟ್: ಕ್ಯಾಲ್ಕುಲೇಟರ್‌ಗಳು/ಟೂಲ್‌ಗಳಿಲ್ಲದೆ, ಅಂಕಗಣಿತವು ಜಾರಿಕೊಳ್ಳಬಹುದು. ಟೂಲ್ ಹುಕ್‌ಗಳು ಅಥವಾ ಪರಿಶೀಲನಾ ಪಾಸ್‌ಗಳನ್ನು ಸೇರಿಸಿ.

ಕಾಂಟೆಕ್ಸ್ಟ್ ಮಿತಿಗಳು: ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಬಿಗಿಯಾಗಿ ಇರಿಸಿ; ಸಣ್ಣ ಚಂಕ್‌ಗಳೊಂದಿಗೆ ರಿಟ್ರೈವಲ್ ಅನ್ನು ಆದ್ಯತೆ ನೀಡಿ.

ಔಟ್‌ಪುಟ್ ವರ್ಬೋಸಿಟಿ: R1 ಚೈನ್‌ಗಳು ಉದ್ದವಾಗಿರಬಹುದು. “ಸಂಕ್ಷಿಪ್ತವಾಗಿರಿ” ನಂತಹ ಸೂಚನೆಗಳನ್ನು ಬಳಸಿ ಮತ್ತು ಟೋಕನ್ ಕ್ಯಾಪ್‌ಗಳನ್ನು ಜಾರಿಗೊಳಿಸಿ.

ಬಾಟಮ್ ಲೈನ್

MobileLLM‑R1 ಅಪರೂಪದ ಕಾಂಬೊವನ್ನು ನೀಡುತ್ತದೆ: ಸಬ್-2B ಪ್ಯಾಕೇಜ್‌ನಲ್ಲಿ ಅರ್ಥೈಸಿಕೊಳ್ಳಬಹುದಾದ ರೀಸನಿಂಗ್ ಮತ್ತು ಪೋರ್ಟಬಲ್ ಕಾರ್ಯಕ್ಷಮತೆ. ಇದು ಮುಕ್ತ ಕಾರ್ಯಗಳಲ್ಲಿ ಕ್ಲೌಡ್ ಟೈಟಾನ್‌ಗಳನ್ನು ಕೆಳಗಿಳಿಸುವುದಿಲ್ಲ, ಆದರೆ ಖಾಸಗಿ, ಆಫ್‌ಲೈನ್-ಮೊದಲ ಅನುಭವಗಳನ್ನು ಶಕ್ತಿಯುತಗೊಳಿಸಲು ಇದು ಈಗಾಗಲೇ ಸಾಕಷ್ಟು ಉತ್ತಮವಾಗಿದೆ—ಮತ್ತು ಅದು ಹೊಸ ಉತ್ಪನ್ನ ವಿಭಾಗಗಳನ್ನು ಅನ್ಲಾಕ್ ಮಾಡುತ್ತದೆ.

ಗಮನಿಸಬೇಕಾದ ಅಂಶ: ನೀವು ಅನೇಕ ಮಾದರಿಗಳಲ್ಲಿ AI ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಮೂಲಮಾದರಿ ಮಾಡುತ್ತಿದ್ದರೆ, Sider.AI ನ ಮಲ್ಟಿ-ಮಾದರಿ ವರ್ಕ್‌ಸ್ಪೇಸ್ ನಿಮಗೆ A/B ಪ್ರಾಂಪ್ಟ್‌ಗಳಿಗೆ ಸಹಾಯ ಮಾಡುತ್ತದೆ, ಸ್ಥಳೀಯವಾಗಿ vs. ಕ್ಲೌಡ್‌ನಲ್ಲಿ ಸುಪ್ತತೆಯನ್ನು ಹೋಲಿಕೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ತಂಡಗಳಿಗಾಗಿ ಫಲಿತಾಂಶಗಳನ್ನು ದಾಖಲಿಸುತ್ತದೆ. ದೊಡ್ಡ LLM ಗಳ ಜೊತೆಗೆ MobileLLM‑R1 ಅನ್ನು ಟ್ಯೂನ್ ಮಾಡುವಾಗ ಅದು ಉಪಯುಕ್ತವಾಗಿದೆ, ಯಾವುದು ಆನ್-ಡಿವೈಸ್‌ನಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ ಮತ್ತು ಯಾವುದು ಕ್ಲೌಡ್‌ನಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆ ಎಂಬುದನ್ನು ನಿರ್ಧರಿಸಲು.

ಪ್ರಮುಖ ಸಂಗತಿಗಳು

ಅದರ ಗಾತ್ರಕ್ಕೆ ರಚನಾತ್ಮಕ ರೀಸನಿಂಗ್‌ನಲ್ಲಿ ಪ್ರಬಲವಾಗಿದೆ; ಖಾಸಗಿ, ಆಫ್‌ಲೈನ್ ಕಾರ್ಯಗಳಿಗೆ ಸೂಕ್ತವಾಗಿದೆ.

ಹಗ್ಗಿಂಗ್ ಫೇಸ್ ಮೂಲಕ ಸುಲಭ ಸ್ಥಳೀಯ ಪರೀಕ್ಷೆ; ಸಮುದಾಯ ಡೆಮೊಗಳು CPU ಕಾರ್ಯಸಾಧ್ಯತೆಯನ್ನು ತೋರಿಸುತ್ತವೆ.

ಗಣಿತದಲ್ಲಿ ನಿಖರತೆಗಾಗಿ ಟೋಕನ್ ಬಜೆಟ್‌ಗಳನ್ನು ಗಮನದಲ್ಲಿಡಿ ಮತ್ತು ಮೂಲಭೂತ ಟೂಲ್‌ಗಳೊಂದಿಗೆ ಜೋಡಿಸಿ.

ಅಸಿಸ್ಟೆಂಟ್‌ಗಳು, ಬೋಧನೆ ಮತ್ತು ಟ್ರೈಯೇಜ್‌ಗೆ ಉತ್ತಮವಾಗಿದೆ; ದೀರ್ಘ-ರೂಪದ ಸೃಜನಶೀಲತೆಗೆ ಕಡಿಮೆ ಸೂಕ್ತವಾಗಿದೆ.

FAQ

Q1:Meta MobileLLM‑R1 ಎಂದರೇನು ಮತ್ತು ಅದು ಏಕೆ ಮುಖ್ಯವಾಗಿದೆ? MobileLLM‑R1 ಒಂದು ಕಾಂಪ್ಯಾಕ್ಟ್, ರೀಸನಿಂಗ್-ಟ್ಯೂನ್ಡ್ ಮಾದರಿಯಾಗಿದ್ದು, ಆನ್-ಡಿವೈಸ್ AI ಗಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ. ಇದು ಮುಖ್ಯವಾಗಿದೆ ಏಕೆಂದರೆ ಇದು CPU ಗಳು ಮತ್ತು ಎಡ್ಜ್ ಹಾರ್ಡ್‌ವೇರ್‌ಗೆ ಚೈನ್-ಆಫ್-ಥಾಟ್-ಶೈಲಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ತರುತ್ತದೆ, ಖಾಸಗಿ, ಆಫ್‌ಲೈನ್ ಅಸಿಸ್ಟೆಂಟ್‌ಗಳು ಮತ್ತು ಗಣಿತ-ಕೇಂದ್ರಿತ ಕಾರ್ಯಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.

Q2:MobileLLM‑R1 ನನ್ನ ಲ್ಯಾಪ್‌ಟಾಪ್ ಅಥವಾ ಫೋನ್‌ನಲ್ಲಿ ರನ್ ಆಗುತ್ತದೆಯೇ? ಹೌದು, ಆರಂಭಿಕ ಪರೀಕ್ಷೆಗಳು MobileLLM‑R1‑950M ಸುಪ್ತತೆಯನ್ನು ತಪಾಸಣೆಯಲ್ಲಿಡಲು ಕ್ವಾಂಟೈಸೇಶನ್‌ನೊಂದಿಗೆ ಗ್ರಾಹಕ CPU ಗಳಲ್ಲಿ ಸ್ಥಳೀಯವಾಗಿ ರನ್ ಆಗಬಲ್ಲದು ಎಂದು ತೋರಿಸುತ್ತವೆ. NPU ಗಳು ಅಥವಾ ಆಪ್ಟಿಮೈಸ್ಡ್ ಕರ್ನಲ್‌ಗಳನ್ನು ಹೊಂದಿರುವ ಸಾಧನಗಳಲ್ಲಿ ಉತ್ತಮ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ನಿರೀಕ್ಷಿಸಿ.

Q3:MobileLLM‑R1 Google Gemini Nano ಅಥವಾ Apple ನ ಆನ್-ಡಿವೈಸ್ ಮಾದರಿಗಳಿಗೆ ಹೇಗೆ ಹೋಲುತ್ತದೆ? Gemini Nano ಮತ್ತು Apple ನ ಸ್ಟಾಕ್‌ಗಳು ಬಿಗಿಯಾದ OS/ಹಾರ್ಡ್‌ವೇರ್ ಇಂಟಿಗ್ರೇಶನ್‌ನಿಂದ ಪ್ರಯೋಜನ ಪಡೆಯುತ್ತವೆ. MobileLLM‑R1 ಪೋರ್ಟಬಿಲಿಟಿ ಮತ್ತು ಮುಕ್ತ ಪ್ರವೇಶಕ್ಕಾಗಿ ಎದ್ದು ಕಾಣುತ್ತದೆ, ಇದು ಕ್ರಾಸ್-ಪ್ಲಾಟ್‌ಫಾರ್ಮ್ ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು CPU-ಫಸ್ಟ್ ನಿಯೋಜನೆಗಳಿಗೆ ಆಕರ್ಷಕವಾಗಿದೆ.

Q4:MobileLLM‑R1 ಕೋಡಿಂಗ್ ಅಥವಾ ಗಣಿತಕ್ಕೆ ಉತ್ತಮವಾಗಿದೆಯೇ? ಇದು ಅದರ ಗಾತ್ರಕ್ಕೆ ಗಣಿತ ಮತ್ತು ರಚನಾತ್ಮಕ ರೀಸನಿಂಗ್‌ನಲ್ಲಿ ವಿಶೇಷವಾಗಿ ಪ್ರಬಲವಾಗಿದೆ ಮತ್ತು ಕೋಡ್‌ಗಾಗಿ ಹಗುರವಾದ ಎಕ್ಸ್‌ಪ್ಲೇನರ್ ಅಥವಾ ಸಹಾಯಕರಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ದೊಡ್ಡ ರಿಫ್ಯಾಕ್ಟರ್‌ಗಳು ಅಥವಾ ವ್ಯಾಪಕ ಕಾಂಟೆಕ್ಸ್ಟ್ ಕಾರ್ಯಗಳಿಗಾಗಿ, ಅದನ್ನು ದೊಡ್ಡ ಕ್ಲೌಡ್ ಮಾದರಿಯೊಂದಿಗೆ ಜೋಡಿಸಿ.

Q5:MobileLLM‑R1 ಅನ್ನು ನಾನು ಎಲ್ಲಿ ಡೌನ್‌ಲೋಡ್ ಮಾಡಬಹುದು ಮತ್ತು ಡೆಮೊಗಳನ್ನು ನೋಡಬಹುದು? ನೀವು ಹಗ್ಗಿಂಗ್ ಫೇಸ್‌ನಲ್ಲಿ MobileLLM‑R1‑950M ಚೆಕ್‌ಪಾಯಿಂಟ್ ಅನ್ನು ಕಾಣಬಹುದು ಮತ್ತು ಸೆಟಪ್ ಮತ್ತು ಪರೀಕ್ಷಾ ಮಾರ್ಗದರ್ಶನಕ್ಕಾಗಿ ಸಮುದಾಯ CPU ಡೆಮೊಗಳನ್ನು ವೀಕ್ಷಿಸಬಹುದು.