ચાલો તમારી એપ્લિકેશનમાં AI ઉમેરીએ તમારા વૉલેટ (અથવા મગજ)ને ઓગાળ્યા વિના
શું તમે ક્યારેય એલન રેંચ વિના IKEA ફર્નિચરને એસેમ્બલ કરવાનો પ્રયાસ કર્યો છે? જ્યારે તમને કહેવામાં આવે છે કે, "ફક્ત તમારી API કી પ્લગ ઇન કરો અને બિલિંગ એકાઉન્ટ શરૂ કરો." ત્યારે AI ઉમેરવાનું એવું લાગે છે. ચોક્કસ, અને જ્યારે હું તે કરી રહ્યો છું, ત્યારે હું ઘરને ફરીથી વાયર કરીશ અને સેટેલાઇટ પણ લોન્ચ કરીશ.
સારા સમાચાર: સ્માર્ટ, ઉપયોગી AI સુવિધાઓને લવ્વેબલ એપ્લિકેશનમાં ઉમેરવા માટે તમારે API કી, વપરાશ ડેશબોર્ડ અથવા બીજા મોર્ટગેજની જરૂર નથી. આ માર્ગદર્શિકામાં, અમે વાત કરવા જઈ રહ્યા છીએ કે વ્યવહારુ પેટર્ન, પ્લેટફોર્મ-નેટીવ સુવિધાઓ અને થોડા હોંશિયાર વર્કઅરાઉન્ડનો ઉપયોગ કરીને લવ્વેબલ એપ્લિકેશનમાં AI કેવી રીતે ઉમેરવું (કોઈ API કી નહીં, કોઈ વધારાનું બિલિંગ નહીં). અનુવાદ: તમે મદદરૂપ AI સુવિધાઓ મોકલી શકો છો જે વપરાશકર્તાઓને જાદુઈ લાગે છે 3,842 ડોલરનું ઇન્વૉઇસ આવ્યા વિના કારણ કે કોઈએ તમારા ચેટ બૉક્સનો ઉપયોગ બટાકા વિશે મહાકાવ્ય લખવા માટે કર્યો હતો.
આ એક હેન્ડ-ઓન વોકથ્રુ છે. હું તમને સ્માર્ટ સુવિધાઓ ડિઝાઇન કરવાનું, કી વગર મોડેલ્સ ક્યાંથી મેળવવા અને ઓન-ડિવાઇસ AI, સર્વર-સાઇડ રેપર્સ અને થોડી પ્રોડક્ટ સેન્સથી ખર્ચને શૂન્ય (અથવા નજીક) કેવી રીતે રાખવો તે બતાવીશ.
"કોઈ API કી નહીં" અને "કોઈ વધારાનું બિલિંગ નહીં" દ્વારા અમારો અર્થ શું છે
ઝડપી ડીકોડર રિંગ:
- કોઈ API કી નહીં: તમે વપરાશકર્તાઓને તેમની પોતાની કી પેસ્ટ કરવાનું કહી રહ્યા નથી અને તમે તેમના વતી કી સ્ટોર અથવા રોટેટ કરી રહ્યા નથી.
- કોઈ વધારાનું બિલિંગ નહીં: તમે તમારા વપરાશકર્તાઓને ટોકન આધારિત મીટર પર ફોરવર્ડ કરી રહ્યા નથી. તમે ક્યાં તો ઓન-ડિવાઇસ AI ચલાવો છો, તમારા હાલના પ્લાનમાં ખર્ચ બંડલ કરો છો અથવા તમે નિયંત્રિત કરો છો તે ઉદાર ફ્રી ટિયર્સનો ઉપયોગ કરો છો.
મુદ્દો કાયમ માટે ચૂકવણી કરવાનું ટાળવાનો નથી. તે સ્માર્ટ AI સાથેની લવ્વેબલ એપ્લિકેશન ડિઝાઇન કરવાનો છે જે અનુમાનિત, ખાનગી હોય અને તમને CFO જેલમાં ન ઉતારે.
લવ્વેબલ એપ્લિકેશન ચેકલિસ્ટ: AI એ ખરેખર શું કરવું જોઈએ
અમે કંઈપણ પ્લગ ઇન કરીએ તે પહેલાં, તમારી એપ્લિકેશન માટે "લવ્વેબલ" નો અર્થ શું છે તે વ્યાખ્યાયિત કરો:
- તે એક પીડાદાયક, વારંવાર થતું કામ તરત જ હલ કરે છે. વન-ટેપ સારાંશ. વન-ક્લિક ફરીથી લખો. એક સ્માર્ટ શોધ.
- તે સ્થાનિક લાગે તેટલું ઝડપી છે. જો તમારું AI લોડિંગ ડોનટની જેમ ફરે છે, તો તમે પહેલાથી જ હારી ગયા છો.
- તે ડિફોલ્ટ રૂપે ગોપનીયતાનું સન્માન કરે છે. મૂળભૂત સુવિધાઓ માટે વપરાશકર્તાઓએ રહસ્યમય ક્લાઉડ પર વિશ્વાસ કરવાની જરૂર નથી.
- તે સમજાવી શકાય તેવું છે. "ટોન સાફ કર્યો અને વ્યાકરણ સુધાર્યું" જેવી નાની સંકેત જાદુને વિશ્વાસમાં ફેરવે છે.
જો તમારો સુવિધા વિચાર તે બૉક્સને ચેક કરતો નથી, તો તમારે AI ની જરૂર નથી. તમારે એક ઝોંકું લેવાની જરૂર છે.
વ્યૂહરચના #1: ઓન-ડિવાઇસ AI (એટલે કે કોઈ કી નહીં, કોઈ બિલ MVP)
"કોઈ કી નહીં, કોઈ બિલ નહીં" નો સૌથી સહેલો રસ્તો જોઈએ છે? વપરાશકર્તાના ઉપકરણ પર મોડેલ ચલાવો. તે ઘઉંના ઘાસના શોટ સાથે 12 ડોલરનો ઓર્ડર આપવાને બદલે ઘરે સ્મૂધી બનાવવા જેવું છે.
ઓન-ડિવાઇસ AI ક્યાં જીતે છે:
- ગોપનીયતા: ડેટા ઉપકરણ છોડતો નથી.
- અનુમાનિત ખર્ચ: વિનંતી દીઠ 0 ડોલર. તમારો ખર્ચ એન્જિનિયરિંગ સમય અને એપ્લિકેશન કદનો થોડો ભાગ છે.
- ઝડપ: ઘણા કાર્યો માટે - સારાંશ, સુધારાઓ, વર્ગીકરણ - આધુનિક ઉપકરણો પૂરતા પ્રમાણમાં ઝડપી છે.
વ્યવહારુ વિકલ્પો:
- પ્લેટફોર્મ-નેટીવ ફ્રેમવર્કનો ઉપયોગ કરો:
- iOS/macOS: નાના ભાષા મોડેલ સાથે Apple નું Core ML. વર્ગીકરણ, ટોન ટ્વીક્સ અને ટૂંકા સારાંશ માટે સરસ.
- Android: કોમ્પેક્ટ LLM અથવા કાર્ય-વિશિષ્ટ મોડેલ સાથે TensorFlow Lite.
- ડેસ્કટોપ/વેબ: વેબમાં 7B અને નાના મોડેલો ચલાવવા માટે WebGPU + WebAssembly રનટાઇમ્સ (હા, ખરેખર).
- નાના-પરંતુ-શક્તિશાળી મોડેલો પસંદ કરો:
- 3B–7B પરિમાણ મોડેલો વ્યાકરણ સુધારણા, બુલેટ-પોઇન્ટ સારાંશ અને મૂળભૂત પ્રશ્નો અને જવાબો કરી શકે છે.
- મેમરી અને લોડ સમય ઘટાડવા માટે ક્વોન્ટાઇઝ્ડ વર્ઝન (દા.ત., 4-બીટ) નો ઉપયોગ કરો.
- UX પેટર્ન જે ઓન-ડિવાઇસ પર ચમકે છે:
- પસંદ કરી શકાય તેવા ટોન સાથે "ફરીથી લખો" બટન: મૈત્રીપૂર્ણ, સંક્ષિપ્ત, ઔપચારિક.
- દસ્તાવેજો, ઇમેઇલ્સ અથવા નોંધો માટે "પસંદગીનો સારાંશ".
- મીટિંગ નોંધોમાંથી "એક્શન આઇટમ કાઢો".
- "આ પૃષ્ઠ શોધો" સિમેન્ટીક શોધક.
પ્રો ટીપ: "ઝડપી મોડ" (ઓન-ડિવાઇસ) અને વૈકલ્પિક "પાવર મોડ" (ક્લાઉડ) ઓફર કરો - કોઈ કીની જરૂર નથી. તેના વિશે એક મિનિટમાં વધુ.
વ્યૂહરચના #2: તમારું પોતાનું મોડેલ લાવો... પરંતુ તમારા વપરાશકર્તાઓની કી નહીં
તમે તમારા વપરાશકર્તાઓને કીરીંગ આપ્યા વિના ક્લાઉડ મોડેલ્સનો ઉપયોગ કરી શકો છો. તમે તમારી સર્વર પર કી છુપાવો, રેટ-લિમિટ કોલ્સ અને ટોપી ખર્ચ કરો છો. વપરાશકર્તાના પરિપ્રેક્ષ્યમાં, કોઈ API કી નથી, અને તમારા પરિપ્રેક્ષ્યમાં, કોઈ બેફામ બિલિંગ નથી.
તેને સુરક્ષિત રીતે કેવી રીતે કરવું:
- સર્વર-સાઇડ પ્રોક્સી: તમારી એપ્લિકેશન તમારા સર્વરને કૉલ કરે છે; તમારું સર્વર મોડેલ પ્રદાતાને કૉલ કરે છે. તમે થ્રોટલના માલિક છો.
- બજેટ ગાર્ડ્રેલ્સ: દૈનિક અથવા માસિક ખર્ચ કેપ્સ, વપરાશકર્તા દીઠ ક્વોટા અને સમયસમાપ્તિ સેટ કરો.
- કેશીંગ: કોલ્સ કાપવા માટે વારંવાર પ્રોમ્પ્ટ્સ અને પરિણામો કેશ કરો.
- જ્યારે તમે મર્યાદાઓ પર પહોંચો છો ત્યારે ભૂલ સ્ક્રીન નહીં, ઓન-ડિવાઇસ પર પાછા ફરો.
આનો ઉપયોગ ક્યારે કરવો:
- નાના સ્થાનિક મોડેલ કરતાં વધુ સારા તર્ક, લાંબી સંદર્ભ અથવા મલ્ટિમોડલ સપોર્ટની તમને જરૂર છે.
- તમે કી જાહેર કર્યા વિના, વધુ રસ સાથે ચૂકવણી કરેલ સ્તરો ઓફર કરતી વખતે મફત યોજનાને સરળ રાખવા માંગો છો.
વ્યૂહરચના #3: બુદ્ધિને પ્રીબેક કરો (ટેમ્પ્લેટ્સ ટોકન્સને હરાવે છે)
અહીં દરેક મહાન AI પ્રોડક્ટ મેનેજરનું રહસ્ય છે: મોટાભાગના વપરાશકર્તાઓ "પ્રોમ્પ્ટ" કરવા માંગતા નથી. તેઓ એવા બટનો ઇચ્છે છે જે યોગ્ય કામ કરે.
કાચા ચેટ બૉક્સને બદલે ટેમ્પ્લેટ્સ અને સ્ટ્રક્ચર્ડ ક્રિયાઓની આસપાસ તમારું AI બનાવો. તમને વધુ સારા પરિણામો, ઓછા ટોકન્સ અને ઓછી ધારની ઘટનાઓ મળશે.
લવ્વેબલ લાગે તેવા ટેમ્પ્લેટ ઉદાહરણો:
- "આને વધુ મૈત્રીપૂર્ણ બનાવો પરંતુ અર્થ એ જ રાખો."
- "આ ટેક્સ્ટમાંથી તારીખો, નામો અને એક્શન આઇટમ ખેંચો."
- "60 અક્ષરો હેઠળ ત્રણ વૈકલ્પિક હેડલાઇન્સ જનરેટ કરો."
- "આ મીટિંગ ટ્રાંસ્ક્રિપ્ટને માલિકો અને નિયત તારીખો સાથે એજન્ડામાં ફેરવો."
જરૂર પડે ત્યારે તમે આને નાના મોડેલો સાથે ઓન-ડિવાઇસ ચલાવી શકો છો અથવા ક્લાઉડ પર બર્સ્ટ કરી શકો છો. કોઈપણ રીતે, તમે પ્રોમ્પ્ટને નિયંત્રિત કરી રહ્યા છો - તેથી તમે ખર્ચ અને ગુણવત્તાને નિયંત્રિત કરી રહ્યા છો.
વ્યૂહરચના #4: સખત વિચાર્યા વિના સ્માર્ટ દેખાવા માટે રિટ્રીવલનો ઉપયોગ કરો
મોટા મોડેલો ભ્રમિત થાય છે. નાના મોડેલો વધુ ઝડપથી ભ્રમિત થાય છે. પુનઃપ્રાપ્તિ બંનેને સામગ્રી બનાવવાથી અટકાવે છે.
- વપરાશકર્તાની સામગ્રી (દસ્તાવેજો, નોંધો, ટિકિટો) ની સ્થાનિક અનુક્રમણિકા બનાવો અને પહેલા સિમેન્ટીક શોધ કરો.
- ફક્ત ટોચના સ્નિપેટ્સને તમારા મોડેલમાં ફીડ કરો. નાનું પ્રોમ્પ્ટ, વધુ સારી ચોકસાઈ.
- ગોપનીયતા-પ્રથમ એપ્લિકેશનો માટે, અનુક્રમણિકાને સ્થાનિક રાખો જેથી કંઈપણ ઉપકરણ છોડે નહીં.
પરિણામ: તમારું મોડેલ ઓછું કામ કરે ત્યારે પણ તમારી એપ્લિકેશન તેજસ્વી લાગે છે. તેને AI ને આખી લાઇબ્રેરી યાદ રાખવાનું કહેવાને બદલે ઓપન-બુક ટેસ્ટ આપવા તરીકે વિચારો.
વ્યૂહરચના #5: વૈકલ્પિક ઓનલાઈન સુપરપાવર્સ સાથે ઓફલાઈન-ફર્સ્ટ ઓફર કરો
તમારા વપરાશકર્તાઓ પ્લેન, ટ્રેન અને પ્રસંગોપાત એક બાર સાથે ભોંયરામાં છે. તમારા AI ને ઓફલાઇન કામ કરો. પછી, જ્યારે કનેક્શન હોય, ત્યારે ઓપ્ટ-ઇન "પાવર મોડ" ઓફર કરો.
તે કેવી રીતે ચાલે છે:
- ઓફલાઈન: ઓન-ડિવાઇસ મોડેલો દ્વારા મૂળભૂત ફરીથી લખવું, સારાંશ આપવું અને નિષ્કર્ષણ.
- ઓનલાઈન: તમારા સર્વર પ્રોક્સી દ્વારા મોટા સંદર્ભ વિન્ડો, વધુ સારી તર્ક અને છબી સમજણ.
- UI: એક નાનું "લાઈટનિંગ" ટૉગલ જે ટ્રેડ-ઓફ સમજાવે છે: "ઝડપી અને ખાનગી (ઓફલાઇન)" વિરુદ્ધ "સ્માર્ટ પરંતુ ક્લાઉડનો ઉપયોગ કરે છે (ઓનલાઈન)."
કોઈ કીની જરૂર નથી; કોઈ આશ્ચર્યજનક બિલ નથી. ફક્ત એક પસંદગી.
વ્યૂહરચના #6: ગાર્ડ્રેલ્સ જે સુવિધાઓને લવ્વેબલ રાખે છે, કાયદા માટે યોગ્ય નથી
એક લવ્વેબલ એપ્લિકેશન મદદરૂપ, અનુમાનિત અને... કંટાળાજનક રીતે સલામત છે. ગાર્ડ્રેલ્સમાં બેક કરો:
- સામગ્રી ફિલ્ટર્સ: કોઈપણ મોડેલ પર હિટ થાય તે પહેલાં હાનિકારક અથવા ઑફ-પોલિસી પ્રોમ્પ્ટ્સને અવરોધિત કરો.
- પારદર્શક લેબલ્સ: સંપાદન ઇતિહાસ સાથે "AI-જનરેટેડ" ટૅગ્સ.
- પુનઃઉત્પાદનક્ષમતા: પરિણામોને નકલ કરી શકાય તે માટે પ્રોમ્પ્ટ્સ અને સેટિંગ્સને સ્થાનિક રીતે (વપરાશકર્તાની સંમતિથી) લૉગ કરો.
- તાલીમ માટે ઓપ્ટ-આઉટ્સ: જો તમે કંઈપણ ફાઇન-ટ્યુન કરો છો, તો પૂછો. અને "ના" ને સરળ બટન બનાવો.
બ્લુપ્રિન્ટ: લવ્વેબલ એપ્લિકેશનમાં AI કેવી રીતે ઉમેરવું (કોઈ API કી નહીં, કોઈ વધારાનું બિલિંગ નહીં)
ચાલો તેને નેપકીન સ્કેચથી લઈને મોકલેલ સુવિધા સુધીના પગલા-દર-પગલામાં ફેરવીએ.
- ઓટોમેટ કરવા માટે એક કામ પસંદ કરો
- એક જ, વારંવાર થતું કાર્ય પસંદ કરો જે તમારા વપરાશકર્તાઓ દરરોજ કરે છે. ઉદાહરણ: "પાંચ બુલેટ્સમાં પસંદ કરેલા ટેક્સ્ટનો સારાંશ આપો."
- સાદા અંગ્રેજીમાં સફળતા લાઇન લખો: "વપરાશકર્તા ટેક્સ્ટને હાઇલાઇટ કરે છે, સારાંશ પર ટૅપ કરે છે, બે સેકન્ડથી ઓછા સમયમાં પાંચ સ્પષ્ટ બુલેટ્સ મેળવે છે."
- તમારું ફૂટપ્રિન્ટ પસંદ કરો: ઓન-ડિવાઇસ પ્રથમ
- એક નાના ક્વોન્ટાઇઝ્ડ મોડેલથી પ્રારંભ કરો. પેલોડ્સને નાનું રાખો, પ્રથમ રન પછી મોડેલને કેશ કરો.
- સખત ટોકન કેપ સેટ કરો. જો ટેક્સ્ટ લાંબો હોય, તો તેને ચંક કરો અને ચંક દીઠ સારાંશ આપો.
- ચેટ બૉક્સ નહીં, ટેમ્પ્લેટ બનાવો
- થોડા ચપળ ઉદાહરણો સાથે સૂચનાને હાર્ડ-કોડ કરો. ફક્ત વપરાશકર્તા-સામનો કરતા નોબ્સને જ ઉજાગર કરો જે મહત્વપૂર્ણ છે: ટોન, લંબાઈ.
- પરિણામોમાં એક સમજૂતી લાઇન ઉમેરો: "સ્પષ્ટતા માટે સંક્ષિપ્ત. ફિલર દૂર કર્યું."
- સંદર્ભ માટે પુનઃપ્રાપ્તિ ઉમેરો
- જો કોઈ દસ્તાવેજનો સારાંશ આપતા હોય જે અન્ય દસ્તાવેજોનો ઉલ્લેખ કરે છે, તો સ્થાનિક રીતે અનુક્રમણિકા બનાવો અને સંબંધિત બીટ્સમાં ખેંચો.
- ટેપ કરી શકાય તેવા ટાંકણો સાથે સ્ત્રોતો બતાવો. વિશ્વાસ એક સુવિધા છે.
- પાવર મોડ ડિઝાઇન કરો (વૈકલ્પિક)
- જો ધારની ઘટનાઓ માટે ઑફલાઇન પરિણામો નબળા હોય, તો ક્લાઉડ "પાવર મોડ" ઉમેરો.
- તમારા વપરાશકર્તાની કી નહીં, તમારા સર્વર દ્વારા રૂટ કરો. ક્વોટા અને દૈનિક કેપ્સ ઉમેરો.
- ચોકસાઈ માટે જ નહીં, આનંદ માટે પરીક્ષણ કરો
- ફર્સ્ટ-ટોકન અને પૂર્ણ થવાના સમયનો સમય માપો.
- A/B પરીક્ષણ નકલ: "ફરીથી લખો" વિરુદ્ધ "પોલિશ". સ્પોઇલર: શબ્દો મહત્વપૂર્ણ છે.
- AI આઉટપુટ પછી વપરાશકર્તા સંપાદનો લોગ કરો (સંમતિ સાથે). જો દરેક વ્યક્તિ પ્રથમ બુલેટને સંપાદિત કરે છે, તો તમારા ટેમ્પ્લેટને મોટા મોડેલની નહીં, કામ કરવાની જરૂર છે.
- વધારાના બિલિંગ ડ્રામા વિના તેની કિંમત
- તમારી હાલની યોજનાઓમાં AI સુવિધાને બંડલ કરો.
- સોફ્ટ મર્યાદાઓનો ઉપયોગ કરો: "પ્રો પર 20 પાવર મોડ રન/દિવસ."
- અમર્યાદિત ઑફલાઇન રન ઑફર કરો - કારણ કે ઑન-ડિવાઇસ મફત છે.
વાસ્તવિક-વિશ્વના દૃશ્યો જે ખરેખર કામ કરે છે
ત્રણ બાઇટ-સાઇઝ રેસિપી જે તમે આ મહિને મોકલી શકો છો, મુખ્ય અનુભવ માટે કોઈ કીની જરૂર નથી:
- કામ: ઇમેઇલ્સ અને સંદેશાઓમાં ટોન સાફ કરો.
- કેવી રીતે: અર્થ રાખવા, વ્યાકરણની સમસ્યાઓ દૂર કરવા અને ટોનને સમાયોજિત કરવા માટે નિશ્ચિત પ્રોમ્પ્ટ સાથે ઓન-ડિવાઇસ મોડેલ.
- UX: મૈત્રીપૂર્ણ, ઔપચારિક, સંક્ષિપ્ત માટે ટૉગલ સાથે ઇનલાઇન સંપાદન પૂર્વાવલોકન. જેથી વપરાશકર્તાઓ શીખે તે માટે તફાવત બતાવો.
- કામ: મીટિંગ નોટ્સને એક્શન આઇટમમાં કન્વર્ટ કરો.
- કેવી રીતે: ઓન-ડિવાઇસ પર ચંક્ડ સારાંશ, પછી લાંબા ટ્રાંસ્ક્રિપ્ટ્સ માટે વૈકલ્પિક પાવર મોડ.
- UX: નિયત તારીખ સૂચનો સાથે માલિક દ્વારા જૂથબદ્ધ પરિણામો. તમારી ટાસ્ક ટૂલમાં કૉપિ કરવા માટે ટૅપ કરી શકાય તેવું.
- કામ: વપરાશકર્તાના દસ્તાવેજોમાં સંબંધિત માહિતી શોધો.
- કેવી રીતે: સંશ્લેષણ માટે સ્થાનિક વેક્ટર ઇન્ડેક્સ + છીછરું LLM.
- UX: સ્ત્રોત લિંક્સ સાથે હાઇલાઇટ્સ અને "આ પરિણામ શા માટે?" નોંધ. એવું લાગે છે કે Ctrl+F એ PhD કર્યું.
પર્ફોર્મન્સ ટીપ્સ જેથી તમારું AI ડાયલ-અપ જેવું ન લાગે
- એપ્લિકેશન લોન્ચ પર એક નાના ડમી અનુમાન સાથે મોડેલને ગરમ કરો જેથી પ્રથમ વિનંતી ધીમી ન હોય.
- એમ્બેડિંગ્સ અને આંશિક પરિણામોને કેશ કરો; તેમને સત્રો વચ્ચે ફરીથી વાપરો.
- પ્રવાહ પ્રતિભાવો અને લાઇન-બાય-લાઇન રેન્ડર કરો. માનવીઓને પ્રગતિ અનુભવવાનું ગમે છે, પછી ભલે તે માત્ર ત્રણ ટપકાં નાચતા હોય.
- પ્રોમ્પ્ટ્સને નિયંત્રણમાં રાખો. નિબંધો > ટેમ્પ્લેટ્સ.
10-પૃષ્ઠના મેનિફેસ્ટો વિના ગોપનીયતા
- સ્થાનિક પ્રોસેસિંગ માટે ડિફોલ્ટ. ક્લાઉડ પ્રોસેસિંગને ફીચર દીઠ ઓપ્ટ-ઇન કરો.
- એક વાક્યમાં સમજાવો: "આ તમારા ઉપકરણ પર ચાલે છે. કશું અપલોડ કરવામાં આવતું નથી." અથવા: "આ અમારા સર્વરનો ઉપયોગ કરે છે. અનામી, ક્યારેય વેચાય નહીં."
- વન-ટેપ ડેટા ડિલીટ બટન પ્રદાન કરો. 2021 થી તેમની કરિયાણાની યાદીને ભૂંસી નાખવા માટે કોઈને ઇમેઇલ સાંકળ જોઈતી નથી.
નોંધનીય છે: આ યાત્રા માટે એક સરળ સહ-પાયલોટ
નોંધનીય છે: જો તમે પ્રોમ્પ્ટ્સનું પ્રોટોટાઇપ કરતી વખતે AI સેનિટી ચેક ઇચ્છતા હો, તો Sider.AI તમારા બ્રાઉઝરમાં મૈત્રીપૂર્ણ પાડોશીની જેમ બેસી શકે છે જે ખરેખર HOA નિયમો વાંચે છે. તમે અડધો ડઝન ડેશબોર્ડને જગલિંગ કર્યા વિના, પ્રોમ્પ્ટ્સનો ડ્રાફ્ટ કરી શકો છો, આઉટપુટની તુલના કરી શકો છો અને તમે તેને તમારી એપ્લિકેશનમાં બેક કરો તે પહેલાં ટેમ્પ્લેટ્સ પર ઝડપથી પુનરાવર્તન કરી શકો છો. તે કોઈ જાહેરાત નથી; તે એક શોર્ટકટ છે. પાંચ મિનિટની એકીકરણ યોજના (એટલે કે તમારી સ્ટીકી નોટ)
- એક કામથી પ્રારંભ કરો. સૌથી નાનું લવ્વેબલ વર્ઝન મોકલો.
- એક કોમ્પેક્ટ, ક્વોન્ટાઇઝ્ડ મોડેલ સાથે તેને ઓન-ડિવાઇસ ચલાવો.
- ચેટ બૉક્સ નહીં, તેને ટેમ્પ્લેટમાં લપેટી લો.
- માનસિક નહીં, સ્માર્ટ દેખાવા માટે પુનઃપ્રાપ્તિ ઉમેરો.
- હાર્ડ કેપ્સ સાથે તમારા સર્વર દ્વારા પાવર મોડ ઓફર કરો.
- બધું સ્પષ્ટ રીતે લેબલ કરો. પ્રથમ ગોપનીયતા. બીજો આનંદ. બાકીનું બધું ત્રીજું.
શું ટાળવું જેથી તમારી એપ્લિકેશન AI ઇન્ફોમર્શિયલ ન બને
- મેજિક વાન્ડ ટ્રેપ: વચન ન આપો કે તે "માણસની જેમ લખે છે." તે એવા AI ની જેમ લખે છે જેણે કોફી પીધી હોય.
- અમર્યાદિત દાવાઓ: ટોકન મીટર હંમેશા સારા દિવસને બગાડવાનો રસ્તો શોધે છે.
- અંતિમ વપરાશકર્તાઓ માટે પ્રોમ્પ્ટ પ્લેગ્રાઉન્ડ્સ: ડેમો માટે સરસ, દૈનિક ઉપયોગ માટે મેહ.
- વન-સાઇઝ-ફિટ્સ-ઑલ મોડેલ્સ: જે કામ કરે છે તે સૌથી નાની વસ્તુ પસંદ કરો. મોટું સારું નથી; સારું સારું છે.
શંકાસ્પદ ઉત્પાદન મેનેજર માટે ઝડપી પ્રશ્નો અને જવાબો
- "શું અમે ખરેખર API કી વિના આ કરી શકીએ?" હા. પ્રથમ ઓન-ડિવાઇસ, સર્વર-પ્રોક્સી વૈકલ્પિક. વપરાશકર્તાઓ ક્યારેય કી જોતા નથી.
- "ગુણવત્તા વિશે શું?" ધ્યાન કેન્દ્રિત કાર્યો માટે, નાના મોડેલો આશ્ચર્યજનક રીતે મહાન છે - ખાસ કરીને પુનઃપ્રાપ્તિ અને ટેમ્પ્લેટ્સ સાથે.
- "શું અમે સ્થાનિક મોડેલોને પાછળ છોડી દઈશું?" કદાચ. તે પાવર મોડ શેના માટે છે. તેને તમારા વપરાશકર્તાના ક્રેડિટ કાર્ડ સાથે નહીં, તમારી યોજના સાથે બાંધો.
- "અમે આશ્ચર્યને કેવી રીતે અટકાવી શકીએ?" કેપ્સ, કેશીંગ અને સ્પષ્ટ ઓફલાઇન ડિફોલ્ટ. તમે રૂમમાં મોટા છો.
ત્રણ ફકરામાં એક નાનો કેસ સ્ટડી
એક નાની નોટ્સ એપ્લિકેશને ઓન-ડિવાઇસ "સારાંશ" બટન ઉમેર્યું. તેણે નિશ્ચિત ટેમ્પ્લેટ અને 500-ટોકન કેપ સાથે 4-બીટ 3B મોડેલ ચલાવ્યું. સરેરાશ પ્રતિભાવ સમય: તાજેતરના ફોન પર 1.6 સેકન્ડ.
વપરાશકર્તાઓને દૈનિક સ્નિપેટ્સ માટે તે ગમ્યું પરંતુ લાંબી સંશોધન નોંધો વિશે ફરિયાદ કરી. ટીમે પ્રતિ-વપરાશકર્તા દૈનિક ક્વોટા સાથે તેમના સર્વર દ્વારા રૂટ કરાયેલ વૈકલ્પિક પાવર મોડ ઉમેર્યો. સંતોષ વધ્યો, ખર્ચ અનુમાનિત રહ્યો.
કિકર: સપોર્ટ ટિકિટો ઘટી ગઈ કારણ કે રેન્ગલ કરવા માટે કોઈ API કી નહોતી, "મને 27 ડોલર કેમ વસૂલવામાં આવ્યા?" કોઈ ઇમેઇલ્સ અને કોઈ ડરામણી રેટ-લિમિટ સ્ક્રીન નહીં.
રેપ-અપ: તમારી લવ્વેબલ AI એપ્લિકેશન, બિલિંગ હેંગઓવર વિના
અહીં પ્લે છે: એક ધ્યાન કેન્દ્રિત AI સુવિધા બનાવો જે ઑફલાઇન ચાલે છે. વપરાશકર્તાઓ સમજે તેવા ટેમ્પ્લેટમાં તેને લપેટી લો. તેને પુનઃપ્રાપ્તિ સાથે વધારો. કેપ્ડ પાવર મોડ ઓફર કરો જે તમારા સર્વરને નિયંત્રિત કરે છે. ગોપનીયતા વિશે પ્રમાણિક બનો. અને આનંદ માટે પરીક્ષણ કરો જેમ કે તે તમારી નોકરી છે - કારણ કે તે છે.
આ રીતે તમે લવ્વેબલ એપ્લિકેશનમાં AI ઉમેરો છો (કોઈ API કી નહીં, કોઈ વધારાનું બિલિંગ નહીં). હવે જો IKEA એ ક્વોન્ટાઇઝ્ડ એલન રેંચ મોકલ્યો હોય તો.
FAQ
Q1: શું હું વપરાશકર્તાઓને API કી માટે પૂછ્યા વિના AI સુવિધાઓ ઉમેરી શકું?
હા. મુખ્ય સુવિધાઓ માટે નાના ઓન-ડિવાઇસ મોડેલો ચલાવો અને જો જરૂરી હોય તો, કેપ્સ સાથે તમારા પોતાના સર્વર પ્રોક્સી દ્વારા ક્લાઉડ કોલ્સને રૂટ કરો. વપરાશકર્તાઓ કીને ક્યારેય સ્પર્શતા નથી, અને તમે ખર્ચને અનુમાનિત રાખો છો.
Q2: શું ઓન-ડિવાઇસ AI મારી એપ્લિકેશન માટે પૂરતું સચોટ હશે?
ફરીથી લખવા, સારાંશ આપવા અને કાઢવા જેવા ધ્યાન કેન્દ્રિત કાર્યો માટે, કોમ્પેક્ટ મોડેલો સરસ કામ કરે છે - ખાસ કરીને ટેમ્પ્લેટ્સ અને પુનઃપ્રાપ્તિ સાથે. વૈકલ્પિક પાવર મોડ માટે જટિલ તર્ક અથવા વિશાળ સંદર્ભ સાચવો.
Q3: વધારાના બિલિંગ વિના હું આશ્ચર્યજનક AI ખર્ચને કેવી રીતે ટાળું?
ડિફૉલ્ટ રૂપે ઑન-ડિવાઇસ પ્રોસેસિંગ અને આક્રમક રીતે કૅશ કરો. ક્લાઉડ બૂસ્ટ્સ માટે, સર્વર-સાઇડ ક્વોટા, દૈનિક કૅપ્સ અને સમયસમાપ્તિ સેટ કરો - પછી સ્થાનિક પરિણામો પર સુંદરતાથી પાછા ફરો.
Q4: AI માટે શ્રેષ્ઠ UX શું છે જે વપરાશકર્તાઓને ખરેખર ગમે છે?
એક કામ સારી રીતે કરતા બટનો ખુલ્લા ચેટને હરાવે છે. સ્પષ્ટ ટોન અને લંબાઈ સાથે ટેમ્પ્લેટ્સનો ઉપયોગ કરો, તફાવત અથવા સમજૂતી બતાવો અને ગોપનીયતાને લેબલ કરો: ઑફલાઇન વિ. ક્લાઉડ પાવર મોડ.
Q5: હું AI ને ખાનગી અને સુસંગત કેવી રીતે રાખું?
ડિફૉલ્ટ રૂપે સ્થાનિક રીતે પ્રોસેસ કરો, જ્યારે તમે ક્લાઉડનો ઉપયોગ કરો ત્યારે જાહેર કરો અને વન-ટેપ ડેટા ડિલીશન પ્રદાન કરો. ગોપનીયતા નવલકથા વિના વિશ્વાસ બનાવવા માટે સામગ્રી ફિલ્ટર્સ ઉમેરો અને સ્ત્રોતો ટાંકો.