What’s the easiest way to get started with Ollama?

Install it, pull a friendly model like llama3:8b-instruct, and run a few real tasks—summaries, outlines, or email drafts. Keep the temperature low for clear, predictable answers and save any prompts that work well.

Which model should I use in Ollama for writing and coding?

For writing, start with llama3 or mistral for balanced quality and speed. For coding, try codellama or a code-optimized model; keep temperature around 0.2–0.4 for fewer hallucinations.

Can I use my own documents with Ollama (RAG)?

Yes—index your files with an embedding tool, retrieve the top chunks on each query, and include those chunks as context in your prompt to Ollama. It’s like open-book mode for your AI, and it drastically improves factual accuracy.

Why is Ollama slow on my laptop and how do I speed it up?

Use a smaller quantized model (e.g., Q4), reduce max tokens, and lower temperature if needed. If you have Apple Silicon or a modern NVIDIA GPU, enable hardware acceleration for a noticeable boost.

How does [Sider.AI](https://sider.ai) fit into an Ollama workflow?

[Sider.AI](https://sider.ai) can connect to your local Ollama models and cloud models in one interface, making it easy to compare outputs and organize chats. It’s handy for testing prompts, keeping history tidy, and picking the best answer without juggling five apps.

Ollama का इस्तेमाल कैसे करें, बिना आपा खोए (या अपना सप्ताहांत बर्बाद किए)

क्या आपने कभी बिना छोटे कार्टून वाले व्यक्ति के IKEA फर्नीचर का एक टुकड़ा जोड़ने की कोशिश की है? स्थानीय AI मॉडल को घुमाना ऐसा ही महसूस हो सकता है। बहुत सारे हिस्से, रहस्यमय नाम, और एक डर जो आपको "LLM runtime" लेबल वाला एक पेंच याद आ गया। Ollama दर्ज करें। यह आपकी अपनी मशीन पर बड़े भाषा मॉडल चलाने के लिए एलन रिंच है - तेज़, निजी और आश्चर्यजनक रूप से यातना उपकरण नहीं।

इस गाइड में, हम वास्तव में Ollama का उपयोग करने जा रहे हैं। न केवल इसके बारे में पढ़ें। हम इसे डाउनलोड करेंगे, एक मॉडल चलाएंगे, इसे अनुकूलित करेंगे, इसे अपने पसंदीदा टूल में पाइप करेंगे, "मेरा पंखा क्यों चीख रहा है?" पल को ठीक करेंगे, और एक सेटअप के साथ दूर चले जाएंगे जिस पर आप वास्तव में काम करने के लिए भरोसा कर सकते हैं। हाँ, ऑफ़लाइन भी। हाँ, विमान पर भी। नहीं, आपको Ph.D. या सर्वर फार्म की आवश्यकता नहीं है।

यहां बताया गया है कि Ollama का उपयोग एक पेशेवर की तरह कैसे करें - बिना अपने लैपटॉप या अपनी समझदारी को खोए।

Ollama क्या है (और आपको क्यों परवाह करनी चाहिए)?

Ollama स्थानीय रूप से बड़े भाषा मॉडल (LLM) चलाने का एक आसान तरीका है। ChatGPT के बारे में सोचें, लेकिन मॉडल आपके कंप्यूटर पर रहता है। लाभ:

गोपनीयता: आपका डेटा आपकी मशीन पर रहता है। कोई रहस्यमय क्लाउड यात्रा नहीं।

गति: सर्वर के लिए कोई इंतजार नहीं। यह आपके CPU/GPU के चमकने का समय है।

नियंत्रण: मॉडल, संस्करण, आकार और व्यवहार चुनें।

यदि आपने कभी सोचा है, "काश मैं अपनी व्यक्तिगत नोट्स को नेपच्यून में भेजे बिना AI से चीजें पूछ पाता," तो यह आपके लिए है।

Ollama का उपयोग करने का सबसे तेज़ तरीका

आप हाउ-टू के लिए आए थे। चलो हाउ-टू करते हैं।

चरण 1: Ollama स्थापित करें

macOS: आधिकारिक साइट से इंस्टॉलर का उपयोग करें या brew install --cask ollama यदि आप शक्तिशाली महसूस करना पसंद करते हैं।

Windows: इंस्टॉलर लें। यह एक सामान्य सेटअप है—अगला, अगला, इंस्टॉल।

Linux: आधिकारिक स्क्रिप्ट के माध्यम से वन-लाइनर। 30 सेकंड के लिए अपने आंतरिक Sysadmin को चैनल करें।

एक बार इंस्टॉल हो जाने के बाद, Ollama एक स्थानीय सेवा चलाता है। आप टर्मिनल, PowerShell या अन्य ऐप्स के माध्यम से इससे बात करते हैं जो इसके साथ एकीकृत होते हैं।

चरण 2: अपना पहला मॉडल पुल करें

अपने टर्मिनल में:

ollama run llama3

पहली बार, Ollama मॉडल वेट डाउनलोड करता है। इसे एक बड़ी Netflix मूवी को कैश करने की तरह सोचें। उसके बाद, यह तत्काल है। आपको एक प्रॉम्प्ट मिलेगा जहां आप टाइप और चैट कर सकते हैं।

एक परीक्षण आज़माएं: "पेंगुइन पर विकिपीडिया की प्रविष्टि का 2-वाक्य सारांश लिखें—कोई बकवास नहीं।" यदि यह पेंगुइन TED टॉक के साथ जवाब देता है, तो आप जानते हैं कि यह जीवित है।

चरण 3: प्लेलिस्ट बदलने की तरह मॉडल बदलें

लोकप्रिय मॉडल जिन्हें आप आज़मा सकते हैं:

ollama run llama3.1

ollama run mistral

ollama run phi3

ollama run qwen

ollama run gemma

प्रत्येक की अलग-अलग ताकतें हैं। Mistral तेज़ है। Llama 3.1 अच्छी तरह से गोल है। Phi हल्का है और अपने आकार के लिए चौंकाने वाला चालाक है। आप विशिष्ट टैग खींच सकते हैं, उदाहरण के लिए, llama3:8b-instruct या छोटे क्वांटाइज्ड वेरिएंट।

प्रो टिप: पहले से डाउनलोड करने के लिए ollama pull <model> का उपयोग करें। यह देखने के लिए ollama list का उपयोग करें कि आपके पास क्या है और ollama rm <model> यदि आपकी SSD रो रही है।

चरण 4: सामाजिक कौशल वाले हैकर की तरह टर्मिनल से चैट करें

एक सत्र शुरू करें: ollama run llama3

एक सिस्टम संदेश प्रदान करें: ollama run llama3 --system "आप एक संक्षिप्त कोडिंग सहायक हैं।"

चैट मोड में प्रवेश किए बिना एक बार का प्रॉम्प्ट दें: ollama run llama3 -p "Kubernetes को इस तरह समझाएं जैसे मैं पांच साल का हूं।"

आप एक जादूगर की तरह लगने लगेंगे। एक विनम्र जादूगर।

चरण 5: अपने पसंदीदा ऐप्स के साथ Ollama का उपयोग करें

यहाँ बताया गया है कि Ollama का उपयोग कैसे करें मजेदार हो जाता है। Ollama HTTP बोलता है। इसका मतलब है कि बहुत सारे टूल इससे बात कर सकते हैं।

स्थानीय वेब UI: कई AI चैट UI आपके Ollama एंडपॉइंट से कनेक्ट हो सकते हैं। आपको एक सुंदर विंडो, अलग चैट और इतिहास मिलता है।

कोड संपादक: VS Code के लिए एक्सटेंशन आपके प्रॉम्प्ट को Ollama पर रूट कर सकते हैं—इनलाइन कोड स्पष्टीकरण, रिफैक्टर और परीक्षण।

नोट लेने वाले ऐप्स: कुछ आपको सारांश और विचार-मंथन के लिए एक स्थानीय मॉडल से कनेक्ट करने देते हैं। मीटिंग नोट्स के लिए बिल्कुल सही जो वास्तव में कहीं जाते हैं।

ध्यान दें: यदि आप एक सुपर क्लीन, ब्राउज़र-आधारित चैट और अनुसंधान वर्कफ़्लो चाहते हैं, तो यह ध्यान देने योग्य है—Sider.AI स्थानीय और क्लाउड मॉडल से कनेक्ट हो सकता है, चैट को व्यवस्थित कर सकता है, और आपको साइड-बाय-साइड प्रॉम्प्ट का परीक्षण करने में मदद कर सकता है। जब मैं "मॉडल A होशियार है" और "मॉडल B तेज़ है" के बीच फटा हुआ होता हूं, तो यह मुझे ईमानदार रखता है।

शुरुआती का ब्लूप्रिंट: Ollama के साथ आपका पहला उत्पादक घंटा

आपके पास 60 मिनट हैं। चलो "हं?" को "हेक हाँ" में बदलते हैं।

Ollama स्थापित करें। कॉफी की चुस्की। हो गया।

llama3:8b-instruct खींचें। यह अधिकांश लैपटॉप पर गुणवत्ता और गति के लिए एक अच्छा स्थान है।

एक सिस्टम प्रॉम्प्ट बनाएं जो आपके काम के लिए फिट हो: "आप मेरे अनुसंधान सहायक हैं। हमेशा स्रोत और बुलेट पॉइंट प्रदान करें। जब तक मैं न कहूं, उत्तर 200 शब्दों से कम रखें।"

तीन कार्य परीक्षण करें जो आप वास्तव में करते हैं:

एक लेख को 250 शब्दों से कम में संक्षेप में प्रस्तुत करें।

अपने न्यूज़लेटर के लिए 10 शीर्षक विचारों पर विचार-मंथन करें।

मीटिंग नोट्स को मालिकों और तारीखों के साथ एक्शन आइटम में बदलें।

अपनी पसंद के प्रॉम्प्ट को सहेजें। उनका पुन: उपयोग करें। इस तरह आप AI के साथ खेलने से लेकर वास्तव में इसका उपयोग करने तक जाते हैं।

बोनस: यदि आप कोड लिखते हैं, तो codellama या कोड-ट्यून मॉडल खींचें और इसे अपना फ़ंक्शन खिलाएं। परीक्षण, रिफैक्टर या डॉकस्ट्रिंग के लिए पूछें। आप 30% होशियार महसूस करेंगे, जो स्थानीय AI के लिए कानूनी सीमा है।

सही मॉडल कैसे चुनें (बिना सिरदर्द के)

एक मॉडल चुनना एक स्ट्रीमिंग योजना चुनने जैसा है: आप उन चीजों के लिए बिल्कुल अधिक भुगतान कर सकते हैं जिनकी आपको आवश्यकता नहीं है।

लेखन और विचार-मंथन: llama3 या mistral बढ़िया हैं।

सुपर हल्के लैपटॉप: phi3 या बड़े मॉडल के छोटे क्वांटाइज्ड संस्करण आज़माएं।

कोडिंग सहायता: codellama, deepseek coder, या एक कोड-अनुकूलित संस्करण।

बहुभाषी: qwen परिवार ठोस बहुभाषी काम करते हैं।

लंबा संदर्भ: यदि आप बड़े दस्तावेज़ों को खिलाते हैं तो बड़े संदर्भ विंडो के साथ लेबल वाले मॉडल की तलाश करें।

यदि हर बार जब आप प्रॉम्प्ट करते हैं तो आपका पंखा एक हेलीकॉप्टर में बदल जाता है, तो मॉडल आकार में नीचे जाएं या अधिक आक्रामक क्वांटाइजेशन आज़माएं।

गुप्त सॉस: मॉडलफ़ाइल और कस्टम व्यवहार

यहाँ Ollama आश्चर्यजनक रूप से रमणीय हो जाता है। आप एक मॉडलफ़ाइल बना सकते हैं—मूल रूप से एक रेसिपी—जो आपके मॉडल के साथ-साथ उसके व्यक्तित्व और डिफ़ॉल्ट को परिभाषित करती है।

उदाहरण मॉडलफ़ाइल (वैचारिक):

FROM llama3:8b-instruct SYSTEM "आप एक कुरकुरा, मैत्रीपूर्ण सहायक हैं। बुलेट पॉइंट और छोटे वाक्यों का उपयोग करें।" PARAMETER temperature 0.5

इसे एक फ़ोल्डर में मॉडलफ़ाइल के रूप में सहेजें, फिर चलाएं:

ollama create crisp-assistant -f Modelfile

ollama run crisp-assistant

अब आपके पास एक कस्टम सहायक है जिसे आप हर जगह पुन: उपयोग कर सकते हैं। यह अपना निजी ChatGPT स्वाद बनाने जैसा है—वेनिला, एस्प्रेसो शॉट्स के साथ।

मुझसे JSON में बात करो: Ollama के HTTP API का उपयोग करना

यदि आपके पास हल्की डेवलपर प्रवृत्तियाँ भी हैं, तो API आपको मुस्कुरा देगा।

एंडपॉइंट: ` text generation के लिए।

model, prompt, और वैकल्पिक stream के साथ एक JSON पेलोड भेजें।

आपको एक स्ट्रीम में टोकन वापस मिलेंगे। यह वास्तविक समय में एक उपन्यास पढ़ने जैसा लगता है, एक समय में एक चरित्र।

API का उपयोग क्यों करें?

न्यूज़लेटर सारांश स्वचालित करें।

अपने दस्तावेज़ों पर एक चैटबॉट बनाएं।

उत्पाद विवरणों को थोक में फिर से लिखने के लिए स्क्रिप्ट बनाएं। (बस उन सभी को एक ऐसे रोबोट की तरह न बनाएं जिसने एक बार इम्प्रूव किया था।)

अपनी खुद की फ़ाइलों के साथ Ollama का उपयोग कैसे करें (क्रोध के बिना RAG)

RAG—पुनर्प्राप्ति-संवर्धित पीढ़ी—आपकी फ़ाइलों को मॉडल को खिलाती है ताकि यह आपकी सामग्री के तथ्यों के साथ उत्तर दे, न कि इसकी अस्पष्ट स्मृति के साथ।

बुनियादी मार्ग:

अपनी दस्तावेज़ों को अनुक्रमित करने के लिए एक स्थानीय एम्बेडिंग टूल का उपयोग करें।

प्रत्येक प्रश्न पर, शीर्ष चंक्स की खोज करें।

Ollama को अपने प्रॉम्प्ट में सबसे प्रासंगिक टेक्स्ट को संदर्भ के रूप में भेजें।

इसे AI के लिए ओपन-बुक टेस्टिंग की तरह सोचें। इसे आपकी कर्मचारी पुस्तिका को "याद रखने" की आवश्यकता नहीं है—इसे केवल इसे उद्धृत करने की आवश्यकता है।

प्रो मूव: अपने चंक्स को छोटा रखें (200-600 शब्द), हेडिंग जोड़ें और प्रॉम्प्ट में स्रोत लिंक शामिल करें ताकि मॉडल उद्धृत करना सीखे।

प्रदर्शन ट्यूनिंग: Ollama को उड़ना बनाएं (बिना अपनी डेस्क पिघलाए)

क्वांटाइजेशन मायने रखता है: Q4 छोटा/तेज़ है, Q8 बड़ा/होशियार है। छोटे से शुरू करें, ऊपर जाएं।

यदि उपलब्ध हो तो GPU का उपयोग करें: Apple सिलिकॉन बहुत अच्छा करता है। नए NVIDIA कार्ड? शेफ किस।

तापमान: सटीक उत्तरों के लिए कम (0.2-0.5); रचनात्मक अराजकता के लिए उच्च (0.8+)।

अधिकतम टोकन: 3,000-शब्द उपन्यास के लिए न पूछें जब तक कि आपको वास्तव में इसकी आवश्यकता न हो। आपका लैपटॉप जीना चाहेगा।

यदि प्रतिक्रियाएं सुस्त महसूस होती हैं:

एक छोटा मॉडल आज़माएं।

Chrome टैब बंद करें। हाँ, सभी 47।

अस्थायी रूप से पृष्ठभूमि सिंक ऐप्स को अक्षम करें।

सुरक्षा और गोपनीयता: वास्तविक कारण लोग Ollama का उपयोग करते हैं

स्थानीय का मतलब स्थानीय है। लेकिन चलो लापरवाह नहीं होते हैं।

संवेदनशील डेटा: आप क्लाउड की तुलना में सुरक्षित हैं, लेकिन अपने ड्राइव को एन्क्रिप्ट करें और सुरक्षित रूप से बैकअप लें।

मॉडल स्रोत: विश्वसनीय repos से खींचें। यदि एक मॉडल विवरण ऐसा दिखता है जैसे कि यह एक बिल्ली द्वारा कीबोर्ड पर चलने से लिखा गया था, तो शायद इसे छोड़ दें।

नेटवर्क एक्सेस: Ollama स्थानीय रूप से चलता है; सार्वजनिक नेटवर्क पर पोर्ट को उजागर न करें जब तक कि आप नहीं जानते कि आप क्या कर रहे हैं।

हर रोज वर्कफ़्लो जिनका आप वास्तव में उपयोग करेंगे

क्योंकि "वाह साफ" "मैं इसे दैनिक उपयोग करता हूं" के समान नहीं है। यहां बताया गया है कि Ollama का वास्तविक जीवन में उपयोग कैसे करें:

मीटिंग क्लीनर: नोट्स पेस्ट करें, व्यक्ति द्वारा एक्शन आइटम के लिए पूछें, और एक फॉलो-अप ईमेल ड्राफ्ट का अनुरोध करें।

अनुसंधान मित्र: एक लेख पेस्ट करें। एक प्रतिवाद, दावों को मान्य करने के लिए 3 स्रोत और 60-सेकंड का सारांश पूछें।

कोडिंग कोपिलॉट: डॉकस्ट्रिंग, परीक्षण या एक सुरक्षित रेगेक्स के लिए पूछें। इसे सादे अंग्रेजी में वापस परिवर्तन को समझाने के लिए कहें।

लेखन स्प्रिंट: पहले रूपरेखा बनाएं, फिर विस्तार करें, फिर स्वर को कस लें। एक सिस्टम संदेश रखें जो आपकी आवाज को परिभाषित करता है।

सीखना: मुझे SSH सिखाओ जैसे कि तुम मेरे धैर्यवान बड़े चचेरे भाई हो। फिर मुझसे प्रश्नोत्तरी करो।

ध्यान दें: यदि आप यह सब एक ही स्थान पर रखना पसंद करते हैं—चैट इतिहास, साइड-बाय-साइड मॉडल परीक्षण और त्वरित वेब लुकअप—Sider.AI स्थानीय मॉडल के साथ अच्छी तरह से खेलता है और आपको एक साफ कॉकपिट देता है। यह आपके प्रॉम्प्ट के लिए मिशन कंट्रोल की तरह है।

समस्या निवारण: जब Ollama मूडी हो जाता है

"मॉडल नहीं मिला।" आपने इसे अभी तक नहीं खींचा है। ollama pull <model>।

"मेमोरी से बाहर।" एक छोटा क्वांटाइजेशन या मॉडल आकार का उपयोग करें।

"यह इतना धीमा है कि मैं अपने लैपटॉप को बूढ़ा होते हुए सुन सकता हूं।" अधिकतम टोकन कम करें, मॉडल बदलें या GPU त्वरण का उपयोग करें।

"उत्तर बहुत अस्पष्ट हैं।" तापमान कम करें और अपने प्रॉम्प्ट में उदाहरण जोड़ें।

"यह लगातार मेरे निर्देशों को अनदेखा कर रहा है।" सिस्टम प्रॉम्प्ट में नियम डालें, न कि केवल उपयोगकर्ता प्रॉम्प्ट में।

प्रो टिप: उन प्रॉम्प्ट को सहेजें जो काम करते हैं। अच्छे प्रॉम्प्ट अच्छी कॉफी रेसिपी की तरह होते हैं। भविष्य में आप अतीत को धन्यवाद देंगे।

उन्नत चाल: मल्टी-मॉडल, टूल और स्वचालन

चेन-ऑफ-थॉट लाइट: उत्तर देने से पहले इसे चरणों को सूचीबद्ध करने के लिए कहें। "पहले रूपरेखा बनाएं, फिर पैराग्राफ द्वारा पैराग्राफ लिखें।"

मल्टी-मॉडल वर्कफ़्लो: एक रचनात्मक मॉडल के साथ विचार-मंथन करें, एक सटीक मॉडल के साथ सत्यापित करें। दोस्त कॉप फिल्म के बारे में सोचो।

टूल उपयोग: स्क्रिप्ट के माध्यम से Ollama के चारों ओर वेब खोज, कैलकुलेटर या कोड निष्पादन लपेटें। मॉडल को यह तय करने दें कि किस टूल को कॉल करना है, लेकिन आउटपुट को मान्य करें।

बैच नौकरियां: उत्पाद विवरणों का एक CSV एक स्क्रिप्ट में पाइप करें जो API को कॉल करता है और परिणामों को वापस लिखता है। कॉफी, रन, हो गया।

टीमों में Ollama को सुरक्षित रूप से कैसे उपयोग करें

यदि आप अनौपचारिक IT व्यक्ति हैं (क्षमा करें), तो गार्ड्रेल सेट करें:

कुछ स्वीकृत मॉडल पर मानकीकृत करें।

टीम आवाज और स्वरूपण के लिए एक मॉडलफ़ाइल साझा करें।

दोहराए गए कार्यों के लिए एक प्रॉम्प्ट लाइब्रेरी रखें।

कुछ वर्कफ़्लो के लिए इनपुट/आउटपुट लॉग करें—स्थानीय रूप से—ताकि आप लोगों पर रेंगने के बिना गुणवत्ता की समीक्षा कर सकें।

"क्या मुझे क्लाउड की आवश्यकता है?" प्रश्न

कभी-कभी हाँ। यदि आपको विशाल-संदर्भ अनुसंधान, अत्याधुनिक तर्क या मल्टी-मोडल जादूगरी की आवश्यकता है, तो एक क्लाउड मॉडल अभी भी जीत सकता है। हाइब्रिड चाल स्मार्ट है:

ड्राफ्ट, निजी दस्तावेज़ों और तेज़ पुनरावृत्ति के लिए स्थानीय रूप से Ollama का उपयोग करें।

जटिल तर्क या विशाल इनपुट के लिए एक क्लाउड मॉडल का उपयोग करें।

उसी इंटरफ़ेस में परिणामों की तुलना करें ताकि आप अपनी आंखों से चुन रहे हों, वाइब्स से नहीं।

ध्यान देने योग्य: Sider.AI उस तुलना को दर्द रहित बनाता है। आप एक ही प्रॉम्प्ट को स्थानीय Ollama और एक क्लाउड मॉडल पर रूट कर सकते हैं, फिर सर्वश्रेष्ठ प्रतिक्रिया चुन सकते हैं या उन्हें मर्ज कर सकते हैं। यह दो कॉफ़ी का स्वाद चखने और यह महसूस करने जैसा है कि आप उन्हें मिला सकते हैं।

ऑफिस Ollama व्हिस्परर बनने के लिए आपकी एक सप्ताह की योजना

दिन 1: स्थापित करें, llama3 खींचें, एक सिस्टम प्रॉम्प्ट सेट करें। दिन 2: अपने स्वर के लिए एक मॉडलफ़ाइल बनाएं। दो मॉडल आज़माएं और अंतरों को नोट करें। दिन 3: एक नोट लेने या कोडिंग टूल को Ollama में तार करें। दिन 4: कुछ PDF के साथ एक छोटा RAG प्रोटोटाइप बनाएं। दिन 5: API के साथ एक थकाऊ कार्य को स्वचालित करें। दिन 6: अपनी टीम के साथ एक प्रॉम्प्ट लाइब्रेरी साझा करें। दिन 7: समीक्षा करें कि क्या काम किया, क्या नहीं किया, उसे ट्रिम करें और डिफ़ॉल्ट सेट करें।

उस बिंदु पर आप न केवल Ollama का उपयोग करना जानेंगे—आप इसके बारे में सोचे बिना इसका उपयोग करेंगे, जो उन उपकरणों का पूरा बिंदु है जिन्हें हम रखते हैं।

तल - रेखा

Ollama का उपयोग कैसे करें तीन बातों पर निर्भर करता है:

शुरू करने के लिए इसे स्थानीय और सरल रखें। एक मॉडल खींचें, तीन वास्तविक कार्य करें।

सिस्टम प्रॉम्प्ट और मॉडलफ़ाइल के साथ व्यवहार को अनुकूलित करें ताकि यह आपके मस्तिष्क के अनुकूल हो, न कि इसके विपरीत।

इसे अपने काम में एकीकृत करें—संपादक, ब्राउज़र, नोट्स—ताकि यह एक और टैब न हो जिसे आप भूल जाएं।

Ollama आपके लैपटॉप को जादुई नहीं बनाएगा। यह इसे और अधिक आपका बना देगा। और एक ऐसी दुनिया में जहां हर ऐप आपके डेटा को किसी और के सर्वर पर ले जाने की कोशिश करता है, यह एक ताज़ा अपग्रेड है।

अब अपने स्थानीय AI से एक बेहतर आउट-ऑफ-ऑफिस संदेश लिखने के लिए कहें। और शायद आपको वास्तव में दिन की छुट्टी लेने की याद दिलाने के लिए।

सामान्य प्रश्न

Q1:Ollama के साथ शुरुआत करने का सबसे आसान तरीका क्या है? इसे स्थापित करें, llama3:8b-instruct जैसे एक दोस्ताना मॉडल को खींचें, और कुछ वास्तविक कार्य चलाएं—सारांश, रूपरेखा या ईमेल ड्राफ्ट। स्पष्ट, अनुमानित उत्तरों के लिए तापमान कम रखें और उन प्रॉम्प्ट को सहेजें जो अच्छी तरह से काम करते हैं।

Q2:लेखन और कोडिंग के लिए मुझे Ollama में किस मॉडल का उपयोग करना चाहिए? लेखन के लिए, संतुलित गुणवत्ता और गति के लिए llama3 या mistral से शुरुआत करें। कोडिंग के लिए, codellama या कोड-अनुकूलित मॉडल आज़माएं; कम मतिभ्रम के लिए तापमान 0.2-0.4 के आसपास रखें।

Q3:क्या मैं Ollama (RAG) के साथ अपने दस्तावेज़ों का उपयोग कर सकता हूं? हाँ—एक एम्बेडिंग टूल के साथ अपनी फ़ाइलों को अनुक्रमित करें, प्रत्येक क्वेरी पर शीर्ष चंक्स को पुनः प्राप्त करें, और उन चंक्स को Ollama को अपने प्रॉम्प्ट में संदर्भ के रूप में शामिल करें। यह आपके AI के लिए ओपन-बुक मोड की तरह है, और यह तथ्यात्मक सटीकता में बहुत सुधार करता है।

Q4:Ollama मेरे लैपटॉप पर धीमा क्यों है और मैं इसे कैसे तेज़ करूं? एक छोटा क्वांटाइज्ड मॉडल (उदाहरण के लिए, Q4) का उपयोग करें, अधिकतम टोकन कम करें और यदि आवश्यक हो तो तापमान कम करें। यदि आपके पास Apple सिलिकॉन या एक आधुनिक NVIDIA GPU है, तो ध्यान देने योग्य बढ़ावा के लिए हार्डवेयर त्वरण सक्षम करें।

Q5:Sider.AI Ollama वर्कफ़्लो में कैसे फिट बैठता है? Sider.AI आपके स्थानीय Ollama मॉडल और क्लाउड मॉडल को एक इंटरफ़ेस में कनेक्ट कर सकता है, जिससे आउटपुट की तुलना करना और चैट को व्यवस्थित करना आसान हो जाता है। यह प्रॉम्प्ट का परीक्षण करने, इतिहास को साफ रखने और पांच ऐप्स को जुगल किए बिना सर्वश्रेष्ठ उत्तर चुनने के लिए आसान है।