هل حاولت يومًا تجميع قطعة أثاث من ايكيا بدون الرجل الكرتوني الصغير؟ هذا ما قد يبدو عليه تشغيل نماذج الذكاء الاصطناعي المحلية. الكثير من الأجزاء، أسماء غامضة، وخوف دائم من أنك أضعت مسمارًا مُسمى بـ "وقت تشغيل LLM". هنا يأتي دور Ollama. إنه مفتاح Allen لتشغيل نماذج اللغة الكبيرة على جهازك الخاص—بسرعة وخصوصية، وبشكل مفاجئ ليس أداة تعذيب.
في هذا الدليل، سنستخدم Ollama فعليًا. ليس فقط القراءة عنه. سنقوم بتنزيله، وتشغيل نموذج، وتخصيصه، وتوجيهه إلى أدواتك المفضلة، وإصلاح لحظة "لماذا تصرخ مروحة جهازي؟"، والخروج بإعداد يمكنك الوثوق به فعليًا لإنجاز العمل. نعم، حتى في وضع عدم الاتصال. نعم، حتى على متن طائرة. لا، أنت لست بحاجة إلى درجة الدكتوراه أو مزرعة خوادم.
إليك كيفية استخدام Ollama كمحترف—دون إتلاف جهاز الكمبيوتر المحمول الخاص بك أو فقدان صوابك.
ما هو Ollama (ولماذا يجب أن تهتم)؟
Ollama هو وسيلة سهلة لتشغيل نماذج اللغة الكبيرة (LLMs) محليًا. فكر في ChatGPT، ولكن النموذج موجود على جهاز الكمبيوتر الخاص بك. المزايا:
- الخصوصية: تظل بياناتك على جهازك. لا توجد رحلة سحابية غامضة.
- السرعة: لا داعي للانتظار لخادم. حان وقت تألق وحدة المعالجة المركزية/وحدة معالجة الرسومات الخاصة بك.
- التحكم: اختر النموذج والإصدار والحجم والسلوك.
إذا فكرت يومًا، "أتمنى أن أتمكن من سؤال الذكاء الاصطناعي عن أشياء دون إرسال ملاحظاتي الشخصية إلى نبتون،" فهذا يناسبك.
أسرع طريقة لاستخدام Ollama
لقد أتيت من أجل كيفية الاستخدام. دعنا نفعل كيفية الاستخدام.
الخطوة 1: تثبيت Ollama
- macOS: استخدم المثبت من الموقع الرسمي أو
brew install --cask ollama إذا كنت تحب الشعور بالقوة.
- Windows: احصل على المثبت. إنه إعداد عادي—التالي، التالي، تثبيت.
- Linux: سطر واحد عبر البرنامج النصي الرسمي. وجه انتباهك إلى مسؤول النظام الداخلي لمدة 30 ثانية.
بمجرد التثبيت، يقوم Ollama بتشغيل خدمة محلية. أنت تتحدث إليه عبر Terminal أو PowerShell أو التطبيقات الأخرى التي تتكامل معه.
الخطوة 2: اسحب النموذج الأول
في جهازك الطرفي:
في المرة الأولى، يقوم Ollama بتنزيل أوزان النموذج. فكر في الأمر على أنه تخزين مؤقت لفيلم كبير على Netflix. بعد ذلك، يكون فوريًا. ستحصل على مطالبة حيث يمكنك الكتابة والدردشة.
جرب اختبارًا: "اكتب ملخصًا من جملتين لإدخال ويكيبيديا حول طيور البطريق—بدون حشو." إذا أجاب بمحادثة TED للبطريق، فأنت تعلم أنه على قيد الحياة.
الخطوة 3: تبديل النماذج كما تبدل قوائم التشغيل
النماذج الشائعة التي يمكنك تجربتها:
لكل منها نقاط قوة مختلفة. Mistral سريع. Llama 3.1 شامل. Phi خفيف الوزن وذكي بشكل صادم بالنسبة لحجمه. يمكنك سحب علامات محددة، على سبيل المثال، llama3:8b-instruct أو متغيرات كمية أصغر.
نصيحة احترافية: استخدم ollama pull <model> للتنزيل مسبقًا. استخدم ollama list لمعرفة ما لديك و ollama rm <model> إذا كان محرك الأقراص ذو الحالة الصلبة الخاص بك يبكي.
الخطوة 4: الدردشة من الجهاز الطرفي مثل المتسلل بمهارات اجتماعية
- ابدأ جلسة:
ollama run llama3
- تقديم رسالة نظام:
ollama run llama3 --system "أنت مساعد ترميز موجز."
- إعطاء مطالبة لمرة واحدة دون الدخول في وضع الدردشة:
ollama run llama3 -p "اشرح Kubernetes كما لو كنت في الخامسة من عمري."
ستبدأ في الظهور وكأنك ساحر. ساحر مهذب.
الخطوة 5: استخدام Ollama مع تطبيقاتك المفضلة
هنا يصبح كيفية استخدام Ollama ممتعًا. يتحدث Ollama HTTP. هذا يعني أن الكثير من الأدوات يمكنها التحدث إليه.
- واجهات المستخدم المحلية على الويب: يمكن للعديد من واجهات مستخدم الدردشة بالذكاء الاصطناعي الاتصال بنقطة نهاية Ollama الخاصة بك. تحصل على نافذة جميلة، ومحادثات منفصلة، وسجل.
- محررو التعليمات البرمجية: يمكن للإضافات الخاصة بـ VS Code توجيه مطالباتك إلى Ollama—تفسيرات التعليمات البرمجية المضمنة وإعادة البناء والاختبارات.
- تطبيقات تدوين الملاحظات: يتيح لك البعض الاتصال بنموذج محلي لعمليات التلخيص وتبادل الأفكار. مثالي لملاحظات الاجتماعات التي تذهب بالفعل إلى مكان ما.
تنبيه: إذا كنت تريد دردشة نظيفة للغاية قائمة على المتصفح وسير عمل بحثي، تجدر الإشارة إلى أن Sider.AI يمكنه الاتصال بنماذج محلية وسحابية، وتنظيم الدردشات، ومساعدتك في اختبار المطالبات جنبًا إلى جنب. عندما أكون ممزقًا بين "النموذج A أكثر ذكاءً" و "النموذج B أسرع،" فإنه يبقيني صادقًا. المخطط الأولي للمبتدئين: ساعتك الإنتاجية الأولى مع Ollama
لديك 60 دقيقة. دعنا نحول "هاه؟" إلى "يا إلهي نعم."
- تثبيت Ollama. رشفة قهوة. تم.
- سحب
llama3:8b-instruct. إنه مكان مثالي للجودة والسرعة على معظم أجهزة الكمبيوتر المحمولة.
- إنشاء مطالبة نظام تناسب عملك: "أنت مساعدي في البحث. قدم دائمًا المصادر والنقاط. احتفظ بالإجابات أقل من 200 كلمة ما لم أقل خلاف ذلك."
- اختبر ثلاث مهام تفعلها بالفعل:
- تلخيص مقال تم لصقه في أقل من 250 كلمة.
- تبادل الأفكار حول 10 أفكار لعناوين رسالتك الإخبارية.
- تحويل ملاحظات الاجتماع إلى بنود عمل مع المالكين والتواريخ.
- حفظ المطالبات التي تعجبك. أعد استخدامها. هذه هي الطريقة التي تنتقل بها من اللعب بالذكاء الاصطناعي إلى استخدامه فعليًا.
مكافأة: إذا كنت تكتب تعليمات برمجية، فاسحب codellama أو نموذجًا مضبوطًا على التعليمات البرمجية وقم بتغذيته بوظيفتك. اطلب اختبارات أو إعادة بناء أو سلاسل توثيق. ستشعر بأنك أكثر ذكاءً بنسبة 30٪، وهو الحد القانوني للذكاء الاصطناعي المحلي.
كيفية اختيار النموذج المناسب (دون صداع)
إن اختيار نموذج يشبه اختيار خطة بث: يمكنك بالتأكيد المبالغة في الدفع مقابل أشياء لا تحتاجها.
- الكتابة وتبادل الأفكار:
llama3 أو mistral رائعة.
- أجهزة الكمبيوتر المحمولة فائقة الخفة: جرب
phi3 أو إصدارات كمية أصغر من النماذج الأكبر.
- مساعدة في الترميز:
codellama، deepseek coder، أو متغير مُحسَّن للتعليمات البرمجية.
- متعدد اللغات: تقوم عائلات
qwen بعمل متعدد اللغات قوي.
- سياق أطول: ابحث عن نماذج تحمل علامات بنوافذ سياق أكبر إذا قمت بتغذية مستندات كبيرة.
إذا تحولت مروحتك إلى طائرة هليكوبتر في كل مرة تطلب فيها، فقلل من حجم النموذج أو جرب كمية أكثر قوة.
الصلصة السرية: ملفات النموذج والسلوكيات المخصصة
هنا يصبح Ollama مبهجًا بشكل مدهش. يمكنك إنشاء Modelfile—بشكل أساسي وصفة—تحدد النموذج الخاص بك بالإضافة إلى شخصيته وإعداداته الافتراضية.
مثال على ملف النموذج (مفاهيمي):
FROM llama3:8b-instruct
SYSTEM "أنت مساعد واضح وودود. استخدم النقاط والجمل القصيرة."
PARAMETER temperature 0.5
احفظه باسم Modelfile في مجلد، ثم قم بتشغيله:
ollama create crisp-assistant -f Modelfile
ollama run crisp-assistant
الآن لديك مساعد مخصص يمكنك إعادة استخدامه في كل مكان. إنه مثل صنع نكهة ChatGPT الخاصة بك—فانيليا، مع جرعات إسبريسو.
تحدث معي JSON: استخدام واجهة برمجة تطبيقات HTTP الخاصة بـ Ollama
إذا كان لديك حتى ميول مطور معتدلة، فستجعلك واجهة برمجة التطبيقات تبتسم.
- نقطة النهاية: ` لتوليد النص.
- أرسل حمولة JSON مع
model، prompt، و stream اختيارية.
- ستستعيد الرموز في دفق. يبدو الأمر وكأنه قراءة رواية في الوقت الفعلي، حرفًا واحدًا في كل مرة.
لماذا تستخدم واجهة برمجة التطبيقات؟
- أتمتة ملخصات الرسائل الإخبارية.
- بناء روبوت محادثة على مستنداتك.
- إنشاء نصوص لإعادة كتابة أوصاف المنتج بكميات كبيرة. (فقط لا تجعلها تبدو جميعها وكأنها روبوت أخذ دورًا مرتجلًا مرة واحدة.)
كيفية استخدام Ollama مع ملفاتك الخاصة (RAG بدون غضب)
RAG—جيل معزز بالاسترجاع—يغذي ملفاتك إلى النموذج حتى يجيب بحقائق من موادك، وليس ذاكرته الضبابية.
المسار الأساسي:
- استخدم أداة تضمين محلية لفهرسة مستنداتك.
- في كل سؤال، ابحث عن أفضل الأجزاء.
- أرسل النص الأكثر صلة كسياق في مطالبتك إلى Ollama.
فكر في الأمر على أنه اختبار الكتاب المفتوح للذكاء الاصطناعي. لا يحتاج إلى "تذكر" دليل الموظف الخاص بك—إنه يحتاج فقط إلى اقتباسه.
نقلة احترافية: حافظ على أجزائك صغيرة (200-600 كلمة)، وأضف عناوين، وقم بتضمين روابط المصدر في المطالبة حتى يتعلم النموذج الاستشهاد.
تحسين الأداء: اجعل Ollama يطير (دون تذويب مكتبك)
- تعتبر الكمية مهمة: Q4 أصغر/أسرع، Q8 أكبر/أكثر ذكاءً. ابدأ صغيرًا، ثم انتقل إلى الأعلى.
- استخدم وحدة معالجة الرسومات إذا كانت متوفرة: يعمل Apple Silicon بشكل رائع. بطاقات NVIDIA الأحدث؟ قبلة الشيف.
- درجة الحرارة: أقل (0.2-0.5) للإجابات الدقيقة؛ أعلى (0.8+) للفوضى الإبداعية.
- الحد الأقصى للرموز: لا تطلب رواية من 3000 كلمة ما لم تكن بحاجة إليها بالفعل. يود جهاز الكمبيوتر المحمول الخاص بك أن يعيش.
إذا كانت الاستجابات بطيئة:
- أغلق علامات تبويب Chrome. نعم، جميع الـ 47.
- تعطيل تطبيقات المزامنة في الخلفية مؤقتًا.
الأمان والخصوصية: السبب الحقيقي لاستخدام الأشخاص Ollama
محلي يعني محلي. لكن دعونا لا نكون مهملين.
- البيانات الحساسة: أنت أكثر أمانًا من السحابة، ولكن قم بتشفير محرك الأقراص الخاص بك وقم بعمل نسخة احتياطية آمنة.
- مصادر النموذج: اسحب من مستودعات موثوقة. إذا كان وصف النموذج يبدو وكأنه كتب بواسطة قطة تمشي على لوحة مفاتيح، فربما تخطيه.
- الوصول إلى الشبكة: يعمل Ollama محليًا؛ لا تعرض المنفذ على الشبكات العامة ما لم تكن تعرف ما تفعله.
سير العمل اليومي الذي ستستخدمه بالفعل
لأن "رائع وأنيق" ليس هو نفسه "أستخدم هذا يوميًا." إليك كيفية استخدام Ollama في الحياة الواقعية:
- منظف الاجتماعات: الصق الملاحظات، واطلب بنود العمل حسب الشخص، واطلب مسودة بريد إلكتروني للمتابعة.
- رفيق البحث: الصق مقالًا. اطلب حجة مضادة، و 3 مصادر للتحقق من صحة الادعاءات، وملخصًا لمدة 60 ثانية.
- طيار الترميز الآلي: اطلب سلاسل توثيق أو اختبارات أو تعبيرًا عاديًا أكثر أمانًا. اجعله يشرح التغيير لك باللغة الإنجليزية البسيطة.
- عدو الكتابة: حدد الخطوط العريضة أولاً، ثم وسّع، ثم شدد اللهجة. احتفظ برسالة نظام تحدد صوتك.
- التعلم: علمني SSH كما لو كنت ابن عمي الأكبر صبورًا. ثم اختبرني.
تنبيه: إذا كنت ترغب في الاحتفاظ بكل هذا في مكان واحد—محفوظات الدردشة، واختبارات النموذج جنبًا إلى جنب، وعمليات البحث السريع على الويب—فإن Sider.AI يعمل بشكل جيد مع النماذج المحلية ويمنحك قمرة قيادة أنظف. إنه مثل التحكم في المهام لمطالباتك. استكشاف الأخطاء وإصلاحها: عندما يصبح Ollama متقلب المزاج
- "لم يتم العثور على النموذج." لم تسحبه بعد.
ollama pull <model>.
- "نفاد الذاكرة." استخدم كمية أو حجم نموذج أصغر.
- "إنه بطيء جدًا لدرجة أنني أستطيع سماع جهاز الكمبيوتر المحمول الخاص بي يتقدم في العمر." تقليل الحد الأقصى للرموز، أو تبديل النماذج، أو استخدام تسريع وحدة معالجة الرسومات.
- "الإجابات غامضة جدًا." خفض درجة الحرارة وأضف أمثلة إلى مطالبتك.
- "إنه يتجاهل تعليماتي باستمرار." ضع القواعد في مطالبة النظام، وليس فقط مطالبة المستخدم.
نصيحة احترافية: احفظ المطالبات التي تعمل. المطالبات الجيدة تشبه وصفات القهوة الجيدة. سيشكرك مستقبلك على ماضيك.
التحركات المتقدمة: متعدد النماذج، والأدوات، والأتمتة
- سلسلة الأفكار الخفيفة: اطلب منه سرد الخطوات قبل الإجابة. "حدد الخطوط العريضة أولاً، ثم اكتب فقرة تلو الأخرى."
- سير عمل متعدد النماذج: تبادل الأفكار مع نموذج إبداعي، وتحقق من نموذج دقيق. فكر في فيلم صديق شرطي.
- استخدام الأدوات: قم بتضمين عمليات البحث على الويب أو الآلات الحاسبة أو تنفيذ التعليمات البرمجية حول Ollama عبر البرامج النصية. دع النموذج يقرر الأداة التي سيتم استدعاؤها، ولكن تحقق من صحة المخرجات.
- مهام الدُفعات: قم بتوجيه ملف CSV لأوصاف المنتج إلى برنامج نصي يستدعي واجهة برمجة التطبيقات ويكتب النتائج مرة أخرى. قهوة، تشغيل، تم.
كيفية استخدام Ollama بأمان في الفرق
إذا كنت مسؤول تكنولوجيا المعلومات غير الرسمي (آسف)، فضع حواجز حماية:
- توحيد عدد قليل من النماذج المعتمدة.
- شارك ملف نموذج لصوت الفريق وتنسيقه.
- احتفظ بمكتبة مطالبات للمهام المتكررة.
- قم بتسجيل المدخلات/المخرجات لسير عمل معين—محليًا—حتى تتمكن من مراجعة الجودة دون التسلل إلى الأشخاص.
سؤال "هل أحتاج إلى السحابة؟"
في بعض الأحيان نعم. إذا كنت بحاجة إلى بحث واسع النطاق، أو استدلال متطور، أو سحر متعدد الوسائط، فقد يظل النموذج السحابي يفوز. الخطوة الهجينة ذكية:
- استخدم Ollama محليًا للمسودات والمستندات الخاصة والتكرار السريع.
- استخدم نموذجًا سحابيًا للاستدلال المعقد أو المدخلات الضخمة.
- قارن النتائج في نفس الواجهة حتى تختار بعينيك، وليس المشاعر.
تجدر الإشارة إلى أن Sider.AI يجعل هذه المقارنة سهلة. يمكنك توجيه نفس المطالبة إلى Ollama المحلي ونموذج سحابي، ثم اختيار أفضل استجابة أو دمجها. إنه مثل تذوق نوعين من القهوة وإدراك أنه يمكنك مزجهما. خطتك لمدة أسبوع لتصبح هامس Ollama في المكتب
اليوم الأول: تثبيت، سحب llama3، تعيين مطالبة نظام.
اليوم الثاني: قم ببناء ملف نموذج لنبرتك. جرب نموذجين ولاحظ الاختلافات.
اليوم الثالث: قم بتوصيل أداة تدوين الملاحظات أو الترميز بـ Ollama.
اليوم الرابع: قم بإنشاء نموذج RAG صغير باستخدام عدد قليل من ملفات PDF.
اليوم الخامس: أتمتة مهمة مملة واحدة باستخدام واجهة برمجة التطبيقات.
اليوم السادس: شارك مكتبة مطالبات مع فريقك.
اليوم السابع: راجع ما نجح، وقم بتقليم ما لم ينجح، وعين الإعدادات الافتراضية.
في تلك المرحلة، لن تعرف فقط كيفية استخدام Ollama—بل ستستخدمه دون التفكير فيه، وهو الهدف الكامل من الأدوات التي نحتفظ بها.
الخلاصة
تتوقف كيفية استخدام Ollama على ثلاثة أشياء:
- اجعلها محلية وبسيطة للبدء. اسحب نموذجًا واحدًا، وقم بثلاث مهام حقيقية.
- قم بتخصيص السلوك باستخدام مطالبات النظام وملفات النموذج بحيث تتناسب مع عقلك، وليس العكس.
- ادمجها في مكان عملك—المحرر والمتصفح والملاحظات—حتى لا تكون علامة تبويب أخرى تنساها.
لن يجعل Ollama جهاز الكمبيوتر المحمول الخاص بك سحريًا. سيجعله أكثر ملكًا لك. وفي عالم تحاول فيه كل التطبيقات نقل بياناتك إلى خادم شخص آخر، فإن هذا يمثل ترقية منعشة للغاية.
اذهب الآن واطلب من الذكاء الاصطناعي المحلي الخاص بك كتابة رسالة أفضل خارج المكتب. وربما لتذكيرك بأخذ إجازة بالفعل.
أسئلة متكررة
س 1: ما هي أسهل طريقة للبدء في استخدام Ollama؟
قم بتثبيته، واسحب نموذجًا ودودًا مثل llama3:8b-instruct، وقم بتشغيل بعض المهام الحقيقية—الملخصات أو الخطوط العريضة أو مسودات البريد الإلكتروني. حافظ على انخفاض درجة الحرارة للحصول على إجابات واضحة ويمكن التنبؤ بها وحفظ أي مطالبات تعمل بشكل جيد.
س 2: أي نموذج يجب أن أستخدمه في Ollama للكتابة والترميز؟
للكتابة، ابدأ بـ llama3 أو mistral للحصول على جودة وسرعة متوازنة. للترميز، جرب codellama أو نموذجًا مُحسَّنًا للتعليمات البرمجية؛ حافظ على درجة الحرارة حوالي 0.2-0.4 لتقليل الهلوسة.
س 3: هل يمكنني استخدام المستندات الخاصة بي مع Ollama (RAG)؟
نعم—قم بفهرسة ملفاتك باستخدام أداة تضمين، واسترجع أفضل الأجزاء في كل استعلام، وقم بتضمين تلك الأجزاء كسياق في مطالبتك إلى Ollama. إنه مثل وضع الكتاب المفتوح للذكاء الاصطناعي الخاص بك، ويحسن الدقة الواقعية بشكل كبير.
س 4: لماذا Ollama بطيء على جهاز الكمبيوتر المحمول الخاص بي وكيف يمكنني تسريعه؟
استخدم نموذجًا كميًا أصغر (على سبيل المثال، Q4)، وقلل من الحد الأقصى للرموز، وخفض درجة الحرارة إذا لزم الأمر. إذا كان لديك Apple Silicon أو وحدة معالجة رسومات NVIDIA حديثة، فقم بتمكين تسريع الأجهزة للحصول على تعزيز ملحوظ.
س 5: كيف يتناسب Sider.AI مع سير عمل Ollama؟
يمكن لـ Sider.AI الاتصال بنماذج Ollama المحلية والنماذج السحابية في واجهة واحدة، مما يسهل مقارنة المخرجات وتنظيم الدردشات. إنه مفيد لاختبار المطالبات والحفاظ على نظافة السجل واختيار أفضل إجابة دون التوفيق بين خمسة تطبيقات.