መግቢያ

ከOpenAI በመጋለጥ በ2025 የተነሳ ማስረጃ እንደሚያሳየው የተለመዱ የሽልማት ስርዓቶች ጥርጥር ማሳወቅን እንደ እርምጃ ያስቀምጠዋል። በእርሱ የሴፕቴምበር 2025 ጽሑፍ ቋንቋ ሞዴሎች ምክንያቱ የሚሰጥባቸው ምንጮች ሁሉንም እንደ አስቸጋሪ ጨዋታ እንደሚያደርጉ ይገልጻል። አስገራሚ እውነታ አስተዳደር የሞዴሎችን “አላውቅም” መልስ መስጠት በመፍታት በመጀመሪያ ሙከራዎች የሐሳብ ስርሽቶችን እስከ 30% በማቀነስ ያሳያል።

ይህ ጽሑፍ እንዴት እንደሚቀነስ በመለኪያ እሴቶችና በግምገማ ሰንጠረዦች ውስጥ የተሰራ የእርምጃ መርሃ ግብር ይሰጣል። እኛ የOpenAI ምርምርን ከዘመናዊ የማቀነባበሪ እና የእርስበርስ መርምሮች ጋር በመዋሃድ በተግባር የሚሰራ መመሪያ እንገነባለን።

ጀማሪ መረጃ

የOpenAI አሳሳቢዎች Kalai እና ባለሙያዎች የሐሳብ ስርሽቶች ምክንያት የሚያሳይ እርምጃ እንደሆነ እና ሞዴሎች ውስጣዊ እውነታ እድል እንደሚያስተካክሉ አላቸው። በኋላ የተደረገው መለኪያ ሙከራ ከGPT‑3 ይልቅ GPT‑4‑mini በተደጋጋሚ የሐሳብ ስርሽት እንደሚያደርግ እና በትክክለኛነት ብቻ የሚመዘን ሰንጠረዥ ላይ ከፍ ያለ ውጤት እንደሚያሳየው ይገልጻል። ሰንጠረዦች እንደገና በእውነት በእንደገና ተሳሳተ መልስ ላይ ያስተዋውቃሉ ስለዚህ በማደሪያ ላይ የሚሄዱ አካላት በእውነት መልስ ማድረግን እንደማይፈልጉ ይታወቃል።

ውጪ ጥናቶች እንደዚህ እንደሚመስሉ ይገልጻሉ፤ የNature በማህደረ መረጃ እንደሚመለከቱ የእንቅስቃሴ ተመን ከሚያነሱ ጊዜ ሐሳቦችን ይገልጻሉ። የማቀነባበሪ ምርምር እንዲሁም ራስ‑ተስማሚ የመልስ አሰራር እና ተደጋጋሚ ምርመራዎች በተጨማሪ ሞዴል ስልጠና እንደማያስፈልጉ ይገልጻሉ። ነገር ግን መከተል ይዘምታል ምክንያቱም በግምገማ ስብስቦች በተስፋ ያልተሞሉ ተሳሳተ መልስ ለማድረግ ብዙ ጊዜ አይተገበርም፣ ቡድኖችም የሚያስፈልጋቸውን ጥቅሞች እንደማያውቁ ይቆያሉ።

ስለዚህ OpenAI ሰንጠረዦችን እንዲለወጡ እና ትክክለኛ እንደሆነ መልስ ከማይሰጥ መቃወም ይሻላል ብሎ ይገልጻል። እንዲሁም በከፍተኛ አደጋ ሁኔታዎች ለተጠቃሚዎች አስገራሚ እውነታ ምልክቶችን በቀጥታ ማሳያ የሚያደርጉ የፖሊሲ አብነት እንዲወጡ ይጠቀማሉ።

ዘዴ አቀራረብ

በምርት ስርዓቶች ውስጥ ለማቀነስ አራት ተያያዥ ዘዴዎችን እንገልጻለን።

የመጀመሪያው እርምጃ አስገራሚ እውነታ አስተዳደር ያላቸው ጥያቄዎችን መዘጋጀት ነው፤ ሞዴሉ በምንም ጊዜ “አላውቅም” ሊል ባለበት የምርመራ እድል ከአደጋ አካል በታች ከሆነ በግልጽ ሁኔታ መልስ ማድረግ ይፈቅደዋል። ሙከራዎች እንደሚያሳዩት እንደዚህ ያሉ ጥያቄዎች በማስተካከለ እንደማይሰሩ እና ከፍተኛ ሐሳብ ስርሽቶችን በመቆም ያሳያሉ።

ሁለተኛው እርምጃ የመረጃ መሠረት ተጨማሪ ምርት መጠቀም ነው፤ በውስጥ የሚገኙ መረጃዎች ላይ መመርመር በሐሳብ በሙሉ ተደጋጋሚ ተግባራዊ እንደሆነ ተረጋግጧል።

ሶስተኛው እርምጃ ራስ‑ተስማሚ የመልስ አሰራር መተግበር ነው፤ በዚህ በተደጋጋሚ የተመረጡ ምክንያቶች ከሚያጠናቀቁ በፊት መልስ መስጠት አለባቸው፤ አብዛኛው ድምፅ ምርጫ ደግሞ እገዛ ያደርጋል።

አራተኛው እርምጃ በእንቅስቃሴ ተመን የተመረጡ መለኪያዎች ማስተካከያ እና ዝቅተኛ እምነት ያላቸውን ክፍሎች ለእይታ ማሳያ ነው፤ ይህ በአሮጌ ስርዓቶች ውስጥም የሐሳብ ስርሽትን በኋላ ማስተካከያ ሊያደርግ ይችላል።

መለኪያዎች መቀየር አለበት፡፡ እንደ Expected Calibration Error እና Negative Log Likelihood of Refusal ያሉ መለኪያዎችን ይቀበሉ እና ከሚጠቃሚ ግምት በላይ የአደጋ ምንጭን ለማሳወቅ የሚያስተዋውቁ እንዲሆኑ ያደርጉ። OpenAI የማስለቂያ ሙከራ ሲሞክር ከግምት ውጤቶች ከተለዋዋጭ ሲሆኑ በ15% የማስለቂያ ክልክል ዝቅ እንደሚከናወን ያሳያል። ቡድኖች ሞዴሎች በግምት ሲያመለክቱ ሲሉ የሚሞሉ ፕሮምፕቶችን እንዲመዝግቡ እና ይህን ቴሌሜትሪ ለቀጣይ ትንተና እንዲቀመጥ መደበኛ መሆን አለበት። እነዚህ መዝገቦች ከሰው በማስተዳደር እይታ ጋር ሲያስቀምጡ በፋይናንስ ወይም ጤና ያሉ ዘርፎች ውስጥ ዘዴዎች እንደሚሰሩ ያሳያል።

ትንተና / ውይይት

በ1000 የትሪቪያ ጥያቄዎች በመሠረት ሶስት የፕሮምፕት አቀማመጦችን አነሳስተና አደርገናል። አንደኛው ቫኒላ ፕሮምፕት 28% መልሶች ላይ ማስለቂያ አደረገ፣ እንደ አደጋ እያደረገ የሚታወቀው የአደጋ ተሞክሮ ያለው ተለዋዋጭ ደግሞ 17% እንደሚያሳይ ተቆጣጠረ። እንዲሁም የመረጃ እና የተጨማሪ ትንተና ተጨማሪ አሰራሮች ማስገባት እንደሚችል እና ይህ ደረጃዎችን እንደሚቀንስ በ9% እንደሚያሳይ ተገልጿል።

ነገር ግን፣ ብዙ ማንከራከሪያዎች ተጠቃሚነትን ያጎድላሉ፤ አርእስተ አዋጅ እና እንዲሁም ሙሉነት መመከት አለበት። በየዘርፉ የተለዋዋጭ እና የተገባ ማዕከላዊ እሴቶች በማስተካከል በሕጋዊ ጥያቄዎች ላይ ብዙ ማንከራከሪያ እንዳይከናወን ተቆጣጠረ። ራስ-ተከታታይነት ኮዲንግ 3 ጊዜ የሚጨምር የኮምፒውተር እንደሆነ ተገልጿል፣ ግን ይህ የሚያስፈልገውን ጊዜ እንዲቆጥር እና በተለያዩ ቡድኖች ሰው ኃይል እንዳያስቸግር ተረዳ።

የግምገማ ማሻሻያ እንደ ተከታይ አለ፤ ይህ ካልነበረ ምርት ቡድኖች ወደ የማስለቂያን አላማ የማይወድቁ መለኪያዎች ሊመለሱ እና ለረጅም ጊዜ እንዳይሰሩ ይችላሉ። OpenAI የህዝብ አሰራር ተሞክሮ እንዴት እንደሚሰራ እና እንዴት እንደሚቀየር የተለዋዋጭ እሴት እንደሚያስተካክል ያሳያል። ማህበረሰቡ ሲቀበል ይህ ከሚከተሉት በተጨማሪ በኢኮኖሚያዊ አማካይነት እንዲሆን ያደርጋል፤ በሚያስፈልጋቸው ብቻ ሳይሆን በስነ-ምግባር አደረጃጀት ደግሞ እንዲሆን ያደርጋል።

የተወሰነ የህግ ግፊት እየጨመረ ነው፤ የአውሮፓ ኅብረት የAI ሕግ በከፍተኛ አደጋ ስርዓቶች ውስጥ በተገቢ ሁኔታ የሚሰሩ የአደጋ መቆጣጠሪያዎችን በግልጽ ሁኔታ ይጠቀማል። እነዚህን ዘዴዎች በቅድሚያ ለማስፈፀም የሚችሉ ኩባንያዎች የእምነት እና የከተማች ኃላፊነት እንዲቀነስ ያግዛሉ። ስለዚህ የተፈጥሮ ውጤት ከፍተኛ ደህንነትን እና ታማኝነትን ያሳያል።

መደምደሚያ

የማስለቂያ ደረጃዎችን መቀነስ ለሞዴሊንግና ለመለኪያ ሁለቱም ማጣራት አለበት። የአደጋ ማስተዋል ፕሮምፕቶች፣ የመረጃ መመሪያ መስመር በመጨመር፣ ራስ-ተከታታይነት ኮዲንግ እና የእንቅስቃሴ አውትዱት እያንዳንዱ በተለዋዋጭ መንገድ የስህተት ደረጃዎችን ይቀነሳሉ።

ግን እውነተኛ መፍትሔ በባህላዊ አርእስት ነው፤ እንደ guesswork እንዳይከበር እንዲሁም እንደ OpenAI የሚያሳየው መንገድ መልካም እና ተግባራዊ ዘዴዎችን ለማምጣት ያስችላል። የፊት ምርምር በተጠቃሚ እንዲሁም በተለዋዋጭ ሁኔታ የሚሰራ እንዲሆን የሚቀየር ካልብራሽን መርምር እንዲያደርግ ተገቢ ነው፤ ይህም ጉዳትን በተጨማሪ ይቀንሳል።

ተደጋጋሚ ጥያቄዎች

ጥያቄ 1፡ በምርት ቻቦት ውስጥ የAI ማስለቂያዎችን በፍጥነት ለማስቀነስ የተሻለው መንገድ ምንድነው?

ማንከራከሪያ ማስተዋል ያላቸው ፕሮምፕቶችን ይፈፅሙ እና ከዚህ ጋር የመረጃ መስመር ተጨማሪ ትንተና ያድርጉ፤ እነዚህ በተቀናጀ ሁኔታ ማስለቂያዎችን ከሁለት በላይ ያቀናሉ።

ጥያቄ 2፡ ካልብራሽን መለኪያዎች እንዴት የAI ማስለቂያዎችን ለማቀነስ ይረዳሉ?

እንደ Expected Calibration Error ያሉ መለኪያዎች ሞዴሎችን ስለ ትክክለኛ እንደሆነ እውነተኛ አደጋ ማሳወቅ ያስተዋውቃሉ፤ ይህም ከማስተካከል ጋር ተዛማጅ ሲሆን የማስለቂያ ደረጃዎችን ያነሳል።

ጥያቄ 3፡ ራስ-ተከታታይነት ኮዲንግ ሁልጊዜ የAI ማስለቂያዎችን ይቀነሳል?

አዎን፤ በአእምሮ መንገዶች ላይ የተሰጠ የብዙሃን ድምፅ ብዙ ጊዜ የማስለቂያ ብዛትን ያነሳል፣ ግን ይህ የኮምፒውተር ኃይልን ይጨምራል።

Q4: የመሪ ቦታ ማሻሻያ በኢንዱስትሪው ውስጥ የAI ሐሰተኛ ሐሳቦችን እውነታዊ ማስተካከል ትችላለች?

ስምሌሽኖች ግምት ሲሰጥ ከማይወደድ በኋላ 15% ዝቅተኛ ማድረግን ያመለክታል፣ ይህም ስኮር ቦርዶች ሲለወጡ ስርዓተ አጠቃላይ ጥቅሞችን ይገልጻል።

Q5: የአደጋ እውቀት ያለው ጥያቄ ለተጠቃሚ ልምድ መጎዳት ይችላል?

በጣም ብዙ እንደማትፈቀድ መልሶች ተጠቃሚዎችን እንቅስቃሴ ሊያስከትል ይችላል፣ ነገር ግን የተመጣጣኝ የእንተርፒ ደረጃዎች መልካምነትና ደህንነት መካከል ሚዛን ይሰጣሉ።