بیایید بدون اینکه حسابتان خالی شود (یا مغزتان ذوب شود) هوش مصنوعی را به اپلیکیشن خود اضافه کنیم.
آیا تا به حال سعی کردهاید مبلمان IKEA را بدون آچار آلن سرهم کنید؟ اضافه کردن هوش مصنوعی هم همین حس را دارد، وقتی به شما میگویند: «فقط کلید API خود را وارد کنید و یک حساب کاربری برای پرداخت باز کنید.» بله، و در همین حین، من هم سیمکشی خانه را عوض میکنم و یک ماهواره پرتاب میکنم.
خبر خوب: برای اضافه کردن ویژگیهای هوش مصنوعی هوشمند و کاربردی به یک اپلیکیشن دوستداشتنی، نیازی به کلیدهای API، داشبوردهای مصرف یا رهن دوم ندارید. در این راهنما، قصد داریم در مورد نحوه اضافه کردن هوش مصنوعی به یک اپلیکیشن دوستداشتنی (بدون کلیدهای API، بدون هزینه اضافی) با استفاده از الگوهای عملی، ویژگیهای پلتفرممحور و چند راهکار هوشمندانه صحبت کنیم. ترجمه: شما میتوانید ویژگیهای هوش مصنوعی مفیدی را ارائه دهید که برای کاربران جادویی به نظر میرسند، بدون اینکه با یک صورتحساب 3,842 دلاری از خواب بیدار شوید، زیرا شخصی از جعبه چت شما برای نوشتن یک حماسه درباره یک سیبزمینی استفاده کرده است.
این یک آموزش عملی است. من به شما نشان خواهم داد که چگونه ویژگیهای هوشمند را طراحی کنید، از کجا مدلها را بدون کلید دریافت کنید، و چگونه با هوش مصنوعی روی دستگاه، wrappers سمت سرور و کمی درک محصول، هزینهها را در صفر (یا نزدیک به صفر) نگه دارید.
منظور ما از «بدون کلیدهای API» و «بدون هزینه اضافی» چیست؟
رمزگشایی سریع:
- بدون کلیدهای API: شما از کاربران نمیخواهید که کلیدهای خود را وارد کنند، و شما کلیدها را از طرف آنها ذخیره یا چرخش نمیدهید.
- بدون هزینه اضافی: شما کاربران خود را به یک счетчик مبتنی بر توکن هدایت نمیکنید. شما یا هوش مصنوعی را روی دستگاه اجرا میکنید، هزینهها را در برنامه موجود خود جمع میکنید، یا از سطوح رایگان щедрый که کنترل میکنید، استفاده میکنید.
هدف این نیست که برای همیشه از پرداخت هزینه فرار کنید. هدف این است که یک اپلیکیشن دوستداشتنی با هوش مصنوعی هوشمند طراحی کنید که قابل پیشبینی، خصوصی و باعث نشود که شما را به زندان CFO ببرند.
چک لیست اپلیکیشن دوست داشتنی: هوش مصنوعی واقعاً چه کاری باید انجام دهد
قبل از اینکه چیزی را وصل کنیم، مشخص کنید که «دوستداشتنی» برای اپلیکیشن شما به چه معناست:
- یک کار دردناک و مکرر را فوراً حل میکند. خلاصهسازی با یک ضربه. بازنویسی با یک کلیک. یک جستجوی هوشمند.
- به اندازهای سریع است که احساس محلی بودن را القا میکند. اگر هوش مصنوعی شما مانند یک دونات در حال загрузка بچرخد، شما از قبل باختهاید.
- به طور پیشفرض به حریم خصوصی احترام میگذارد. کاربران نباید برای ویژگیهای اساسی به یک ابر загадочный اعتماد کنند.
- قابل توضیح است. یک اشاره کوچک مانند «لحن را اصلاح و گرامر را تصحیح کرد» جادو را به اعتماد تبدیل میکند.
اگر ایده ویژگی شما این موارد را بررسی نمیکند، به هوش مصنوعی نیازی ندارید. شما به یک چرت نیاز دارید.
استراتژی شماره 1: هوش مصنوعی روی دستگاه (معروف به MVP بدون کلید، بدون هزینه)
آیا سادهترین راه برای «بدون کلید، بدون هزینه» را میخواهید؟ مدل را روی دستگاه کاربر اجرا کنید. این مانند درست کردن اسموتی در خانه به جای سفارش یک اسموتی 12 دلاری با یک شات علف گندم است.
مزایای هوش مصنوعی روی دستگاه:
- حریم خصوصی: دادهها دستگاه را ترک نمیکنند.
- هزینه قابل پیشبینی: 0 دلار در هر درخواست. هزینه شما زمان مهندسی و کمی حجم اپلیکیشن است.
- سرعت: برای بسیاری از وظایف—خلاصهها، اصلاحات، طبقهبندی—دستگاههای مدرن به اندازه کافی سریع هستند.
گزینههای практический:
- از چارچوبهای پلتفرم-محور استفاده کنید:
- iOS/macOS: Core ML اپل با یک مدل زبانی کوچک. عالی برای طبقهبندی، تغییرات لحن و خلاصههای کوتاه.
- Android: TensorFlow Lite با یک LLM فشرده یا مدل специфический для конкретной задачи.
- Desktop/Web: WebGPU + WebAssembly runtimes برای اجرای مدلهای 7B و کوچکتر در مرورگر (واقعاً).
- مدلهای کوچک اما قدرتمند را انتخاب کنید:
- مدلهای 3B-7B parameter میتوانند исправления грамматических ошибок، خلاصههای نکتهای و پرسش و پاسخ اساسی را انجام دهند.
- از نسخههای quantized (به عنوان مثال، 4-bit) برای کاهش حافظه و زمان загрузка استفاده کنید.
- الگوهای UX که روی دستگاه میدرخشند:
- دکمه «بازنویسی» با لحنهای قابل انتخاب: دوستانه، مختصر، رسمی.
- «خلاصهسازی انتخاب» برای اسناد، ایمیلها یا یادداشتها.
- «استخراج موارد اقدام» از یادداشتهای جلسه.
- «جستجو در این صفحه» semantic finder.
نکته حرفهای: یک «حالت سریع» (روی دستگاه) و یک «حالت قدرت» اختیاری (ابری) ارائه دهید—بدون نیاز به کلید. در یک دقیقه بیشتر در مورد آن صحبت خواهیم کرد.
استراتژی شماره 2: مدل خودت را بیاور… اما نه کلیدهای کاربران خودت
شما همچنان میتوانید از مدلهای ابری بدون دادن جاکلیدی به کاربران خود استفاده کنید. شما کلید را در سرور خود پنهان میکنید، تماسها را محدود میکنید و هزینهها را محدود میکنید. از دیدگاه کاربر، هیچ کلید API وجود ندارد، و از دیدگاه شما، هیچ صورتحساب بیرویهای وجود ندارد.
چگونه این کار را با خیال راحت انجام دهیم:
- Server-side proxy: برنامه شما سرور شما را صدا میکند. سرور شما مدل provider را صدا میکند. شما مالک дроссельная заслонка هستید.
- Budget guardrails: محدودیتهای هزینهکرد روزانه یا ماهانه، سهمیههای per-user و timeouts را تنظیم کنید.
- Caching: запросы частые و نتایج را برای قطع تماسها ذخیره کنید.
- هنگامی که به محدودیتها رسیدید، به جای صفحه خطا، به هوش مصنوعی روی دستگاه برگردید.
چه زمانی از این استفاده کنیم:
- شما به استدلال بهتر، زمینه طولانیتر یا پشتیبانی мультимодальный نسبت به یک مدل محلی کوچک نیاز دارید.
- شما میخواهید یک طرح رایگان را ساده نگه دارید، در حالی که سطوح پولی با آب بیشتر ارائه میدهید—باز هم بدون افشای یک کلید.
استراتژی شماره 3: از قبل هوش را آماده کنید (قالبها توکنها را شکست میدهند)
این راز هر مدیر محصول هوش مصنوعی عالی است: اکثر کاربران نمیخواهند «prompt» کنند. آنها دکمههایی را میخواهند که کار درست را انجام دهند.
هوش مصنوعی خود را حول шаблоны و اقدامات структурированные بسازید، نه جعبههای چت خام. نتایج بهتری، توکنهای کمتر و موارد краевых کمتری دریافت خواهید کرد.
نمونههای шаблон که احساس دوستداشتنی بودن را القا میکنند:
- «این را دوستانهتر کنید اما همان معنی را حفظ کنید.»
- «تاریخها، نامها و موارد اقدام را از این متن بیرون بکشید.»
- «سه заголовки جایگزین زیر 60 کاراکتر تولید کنید.»
- «این رونویسی جلسه را به یک دستور کار با صاحبان و تاریخهای سررسید تبدیل کنید.»
شما میتوانید اینها را با مدلهای کوچک روی دستگاه اجرا کنید یا در صورت نیاز به ابر بفرستید. در هر صورت، شما prompt را کنترل میکنید—بنابراین هزینهها و کیفیت را کنترل میکنید.
استراتژی شماره 4: از بازیابی استفاده کنید تا بدون فکر کردن زیاد، هوشمند به نظر برسید
مدلهای بزرگ توهم میزنند. مدلهای کوچک سریعتر توهم میزنند. بازیابی از اختراع کردن مطالب توسط هر دو جلوگیری میکند.
- یک فهرست محلی از محتوای کاربر (اسناد، یادداشتها، билеты) بسازید و ابتدا جستجوی семантический انجام دهید.
- فقط фрагменты برتر را به مدل خود تغذیه کنید. prompt کوچکتر، دقت بهتر.
- برای برنامههایی که حریم خصوصی در اولویت است، فهرست را محلی نگه دارید تا چیزی دستگاه را ترک نکند.
نتیجه: برنامه شما درخشان به نظر میرسد در حالی که مدل شما کار کمتری انجام میدهد. به آن به عنوان دادن یک امتحان کتاب باز به هوش مصنوعی فکر کنید به جای اینکه از آن بخواهید کل کتابخانه را به خاطر بسپارد.
استراتژی شماره 5: offline-first را با superpowers آنلاین اختیاری ارائه دهید
کاربران شما در هواپیماها، قطارها و گهگاهی در یک زیرزمین با یک خط هستند. هوش مصنوعی خود را به صورت آفلاین کار کنید. سپس، وقتی اتصال وجود دارد، «حالت قدرت» opt-in را ارائه دهید.
چگونه بازی میکند:
- آفلاین: بازنویسی اساسی، خلاصهسازی و استخراج از طریق مدلهای روی دستگاه.
- آنلاین: پنجرههای زمینه بزرگتر، استدلال بهتر و درک تصویر از طریق سرور proxy شما.
- UI: یک toggle کوچک «رعد و برق» که معاوضه را توضیح میدهد: «سریعتر و خصوصی (آفلاین)» در مقابل «هوشمندتر اما از ابر استفاده میکند (آنلاین).»
بدون نیاز به کلید; بدون صورتحسابهای غیرمنتظره. فقط یک انتخاب.
استراتژی شماره 6: Guardrails که ویژگیها را دوستداشتنی نگه میدارند، نه قابل شکایت
یک برنامه دوستداشتنی مفید، قابل پیشبینی و… به طور скучный ایمن است. guardrails را در آن بپزید:
- Content filters: prompts مضر یا خارج از خطمشی را قبل از اینکه به هر مدلی برسند مسدود کنید.
- Transparent labels: برچسبهای «AI-generated» با تاریخچه ویرایش.
- Reproducibility: prompts و تنظیمات را به صورت محلی (با رضایت کاربر) ثبت کنید تا نتایج قابل تکثیر باشند.
- Opt-outs برای آموزش: اگر چیزی را fine-tune میکنید، بپرسید. و «نه» را دکمه آسان کنید.
طرح اولیه: چگونه هوش مصنوعی را به یک برنامه دوستداشتنی اضافه کنیم (بدون کلیدهای API، بدون هزینه اضافی)
بیایید این را به یک گام به گام تبدیل کنیم، از طرح روی دستمال کاغذی تا ویژگی حمل شده.
- یک کار را برای автоматизировать انتخاب کنید
- یک کار single و مکرر را انتخاب کنید که کاربران شما روزانه انجام میدهند. مثال: «خلاصه کردن متن انتخاب شده در پنج نکته.»
- خط موفقیت را به زبان ساده بنویسید: «کاربر متن را выделяет، روی خلاصه کلیک میکند، پنج نکته واضح را در کمتر از دو ثانیه دریافت میکند.»
- اثر خود را انتخاب کنید: сначала на устройстве
- با یک مدل quantized کوچک شروع کنید. payloads را کوچک نگه دارید، مدل را پس از اولین اجرا ذخیره کنید.
- یک token cap سختگیرانه تنظیم کنید. اگر متن طولانی است، آن را تکهتکه کنید و per chunk خلاصه کنید.
- یک قالب بسازید، نه یک جعبه چت
- دستورالعمل را با چند مثال واضح کد سخت کنید. فقط دستگیرههای کاربرپسندی را که مهم هستند در معرض دید قرار دهید: لحن، طول.
- یک خط توضیح به نتایج اضافه کنید: «متراکم شده برای وضوح. پرکنندهها حذف شدند.»
- بازیابی را برای زمینه اضافه کنید
- اگر خلاصه کردن سندی که به اسناد دیگر ارجاع میدهد، فهرست را به صورت محلی فهرست کنید و بیتهای مربوطه را وارد کنید.
- منابع را با استنادهای قابل کلیک نشان دهید. اعتماد یک ویژگی است.
- حالت قدرت را طراحی کنید (اختیاری)
- اگر نتایج آفلاین برای موارد краевых ضعیف هستند، یک «حالت قدرت» ابری اضافه کنید.
- از طریق سرور خود مسیریابی کنید، نه کلید کاربر شما. سهمیهها و کلاههای روزانه را اضافه کنید.
- برای радость آزمایش کنید، نه فقط دقت
- زمان до первого токена و زمان завершения را اندازهگیری کنید.
- A/B test copy: «بازنویسی» در مقابل «صیقل دادن.» اسپویلر: слова matter.
- ویرایشهای کاربر را پس از خروجی هوش مصنوعی (با رضایت) ثبت کنید. اگر همه نکته اول را ویرایش میکنند، шаблон شما به کار نیاز دارد، نه یک مدل بزرگتر.
- بدون درام صورتحساب اضافی، قیمتگذاری کنید
- ویژگی هوش مصنوعی را در طرحهای موجود خود قرار دهید.
- از محدودیتهای мягкие استفاده کنید: «20 اجرای حالت قدرت/روز در Pro.»
- اجراهای آفلاین نامحدود ارائه دهید—زیرا روی دستگاه رایگان است.
سناریوهای دنیای واقعی که واقعاً کار میکنند
سه دستور غذا با اندازه бита که میتوانید این ماه حمل کنید، بدون نیاز به کلید برای تجربه اصلی:
- کار: لحن را در ایمیلها و پیامها پاک کنید.
- چگونه: مدل روی دستگاه با یک prompt ثابت برای حفظ معنی، حذف مشکلات گرامری و تنظیم لحن.
- UX: پیش نمایش ویرایش درون خطی با یک toggle برای دوستانه، رسمی، مختصر. یک diff نشان دهید تا کاربران یاد بگیرند.
- کار: یادداشتهای جلسه را به موارد اقدام تبدیل کنید.
- چگونه: خلاصهسازی تکهتکه روی دستگاه، سپس حالت قدرت اختیاری برای رونویسیهای طولانی.
- UX: نتایج گروهبندی شده توسط مالک با پیشنهادات تاریخ سررسید. قابل کلیک برای کپی کردن در ابزار задачи شما.
- کار: اطلاعات مربوطه را در اسناد کاربر پیدا کنید.
- چگونه: شاخص بردار محلی + LLM کم عمق برای синтез.
- UX: نکات برجسته با پیوندهای منبع و یک یادداشت «چرا این نتیجه؟». احساسی شبیه Ctrl+F دکتری گرفت.
نکات عملکردی تا هوش مصنوعی شما احساس شمارهگیری نداشته باشد
- مدل را هنگام запуска приложения با یک استنتاج манекен маленькая گرم کنید تا اولین درخواست کند نباشد.
- Embeddings و نتایج جزئی را ذخیره کنید; آنها را بین جلسات دوباره استفاده کنید.
- پاسخها را پخش کنید و خط به خط رندر کنید. انسانها عاشق احساس پیشرفت هستند، حتی اگر فقط سه نقطه رقصنده باشند.
- Prompts را تحت کنترل نگه دارید. Шаблоны > مقالات.
حریم خصوصی بدون مانیفست 10 صفحهای
- به طور پیشفرض به پردازش محلی. پردازش ابری را per feature opt-in کنید.
- در یک جمله توضیح دهید: «این روی دستگاه شما اجرا میشود. هیچ چیزی آپلود نمیشود.» یا: «این از سرور ما استفاده میکند. ناشناس شده، هرگز فروخته نمیشود.»
- یک دکمه حذف داده با یک ضربه ارائه دهید. هیچ کس نمیخواهد یک زنجیره ایمیل لیست مواد غذایی خود را از سال 2021 پاک کند.
شایان ذکر است: یک کمک خلبان مفید برای این سفر
شایان ذکر است: اگر میخواهید یک بررسی سلامت عقل هوش مصنوعی در حین پیشنمونهسازی prompts داشته باشید، Sider.AI میتواند مانند یک همسایه دوستانه در مرورگر شما بنشیند که در واقع قوانین HOA را میخواند. شما میتوانید prompts را پیشنویس کنید، خروجیها را مقایسه کنید و به سرعت روی шаблоны تکرار کنید قبل از اینکه آنها را در برنامه خود بپزید—بدون اینکه نیمی از دوجین داشبورد را دستکاری کنید. این یک تبلیغ نیست; این یک میانبر است. برنامه ادغام پنج دقیقهای (معروف به یادداشت چسبنده شما)
- با یک کار شروع کنید. کوچکترین نسخه دوستداشتنی را حمل کنید.
- آن را روی دستگاه با یک مدل فشرده و quantized اجرا کنید.
- آن را در یک قالب بپیچید، نه یک جعبه چت.
- برای هوشمند به نظر رسیدن، بازیابی را اضافه کنید، نه экстрасенс.
- حالت قدرت را از طریق سرور خود با کلاههای سخت ارائه دهید.
- همه چیز را به وضوح برچسب بزنید. اول حریم خصوصی. دوم радость. همه چیز دیگر سوم.
از چه چیزهایی باید اجتناب کرد تا برنامه شما به یک рекламы هوش مصنوعی تبدیل نشود
- تله Magic Wand: قول ندهید که «مانند یک انسان مینویسد». مانند یک هوش مصنوعی که قهوه خورده است مینویسد.
- ادعاهای نامحدود: счетчики توکن همیشه راهی برای خراب کردن یک روز خوب پیدا میکنند.
- Prompt playgrounds برای کاربران نهایی: عالی برای демонстрации, meh برای استفاده روزانه.
- مدلهای یک اندازه متناسب با همه: کوچکترین چیزی را که کار را انجام میدهد انتخاب کنید. بزرگتر بهتر نیست; بهتر лучше.
پرسش و پاسخ سریع برای مدیر محصول скептический
- «آیا واقعاً میتوانیم این کار را بدون کلیدهای API انجام دهیم؟» بله. ابتدا روی دستگاه، سرور-proxy اختیاری. کاربران هرگز کلیدها را نمیبینند.
- «کیفیت چطور؟» برای وظایف متمرکز، مدلهای کوچک بهطور شگفتانگیزی عالی هستند—بهویژه با بازیابی و шаблоны.
- «آیا از مدلهای محلی فراتر خواهیم رفت؟» شاید. این همان چیزی است که حالت قدرت برای آن است. آن را به طرح خود گره بزنید، نه کارت اعتباری کاربر خود.
- «چگونه از غافلگیری جلوگیری کنیم؟» کلاهها، caching و یک پیشفرض آفلاین واضح. شما در اتاق بزرگسال هستید.
یک مطالعه موردی کوچک در سه پاراگراف
یک برنامه یادداشت کوچک یک دکمه «خلاصه» روی دستگاه اضافه کرد. یک مدل 4-bit 3B را با یک قالب ثابت و یک token cap 500 اجرا کرد. میانگین زمان پاسخ: 1.6 ثانیه در تلفنهای جدید.
کاربران آن را برای фрагменты روزانه دوست داشتند اما از یادداشتهای تحقیقاتی طولانی شکایت داشتند. این تیم یک حالت قدرت اختیاری را اضافه کرد که از طریق سرور آنها با سهمیههای روزانه per-user مسیریابی میشد. رضایت بالا رفت، هزینهها قابل پیشبینی باقی ماند.
ضربه: билеты پشتیبانی پایین رفت زیرا هیچ کلید API برای درگیری وجود نداشت، هیچ ایمیل «چرا 27 دلار شارژ شدم؟» و هیچ صفحه محدودیت نرخ ترسناکی وجود نداشت.
جمعبندی: برنامه هوش مصنوعی دوستداشتنی شما، منهای خماری صورتحساب
این بازی است: یک ویژگی هوش مصنوعی متمرکز بسازید که به صورت آفلاین اجرا شود. آن را در قالبی بپیچید که کاربران درک کنند. آن را با بازیابی بهبود بخشید. یک حالت قدرت محدود شده ارائه دهید که سرور شما آن را کنترل کند. در مورد حریم خصوصی صادق باشید. و برای радость آزمایش کنید انگار این کار شماست—زیرا اینطور است.
اینگونه است که هوش مصنوعی را به یک برنامه دوستداشتنی اضافه میکنید (بدون کلیدهای API، بدون هزینه اضافی). حالا ای کاش IKEA یک آچار آلن quantized حمل میکرد.
سؤالات متداول
س 1: آیا میتوانم ویژگیهای هوش مصنوعی را بدون درخواست کلیدهای API از کاربران اضافه کنم؟
بله. مدلهای کوچک روی دستگاه را برای ویژگیهای اصلی اجرا کنید و در صورت نیاز، تماسهای ابری را از طریق سرور proxy خود با کلاهها مسیریابی کنید. کاربران هرگز کلیدها را لمس نمیکنند و شما هزینه را قابل پیشبینی نگه میدارید.
س 2: آیا هوش مصنوعی روی دستگاه برای برنامه من به اندازه کافی دقیق خواهد بود؟
برای مشاغل متمرکز مانند بازنویسی، خلاصهسازی و استخراج، مدلهای компакт отлично انجام میدهند—بهویژه با шаблоны و بازیابی. استدلال پیچیده یا контекст огромный را برای حالت قدرت اختیاری ذخیره کنید.
س 3: چگونه بدون صورتحساب اضافی از هزینههای هوش مصنوعی غیرمنتظره جلوگیری کنم؟
به طور پیشفرض به پردازش روی دستگاه و ذخیره агрессивно. برای усилений ابری، سهمیههای сервер-سايد، کلاههای روزانه و timeouts را تنظیم کنید—سپس به نتایج محلی برگردید.
س 4: بهترین UX برای هوش مصنوعی که کاربران واقعاً دوست دارند چیست؟
دکمههایی که یک کار را به خوبی انجام میدهند، چت باز-понятия beat. از шаблоны با لحنها و طولهای واضح استفاده کنید، یک diff یا توضیح نشان دهید و حریم خصوصی: حالت قدرت آفلاین در مقابل ابری را برچسب بزنید.
س 5: چگونه هوش مصنوعی را خصوصی و سازگار نگه دارم؟
به طور پیشفرض به صورت محلی پردازش کنید، هنگام استفاده از ابر افشا کنید و حذف داده با یک ضربه را ارائه دهید. فیلترهای محتوا را اضافه کنید و منابع را استناد کنید تا بدون رمان حریم خصوصی، اعتماد ایجاد کنید.