அறிமுகம்

OpenAI பாரம்பரிய வெகுமதி திட்டங்கள் உறுதிப்படையாமையை ஒப்புக்கொள்வதை தண்டிப்பதாக சான்றுகளை வெளிப்படுத்திய பிறகு முயற்சிகள் அவசர முன்னுரிமையாக மாறியுள்ளன. 2025 செப்டம்பர் மாதக் கட்டுரையில், மொழி மாதிரிகள் ஒவ்வொரு காலியான இடத்தையும் ஒரு சூதாட்டமாகக் கருதுவதால் ஊகிக்கின்றன என வாதிடப்படுகிறது. 'நான் உறுதியாக இல்லை' என்று கூறும் உறுதிப்படையாத கேள்விகள் ஆரம்ப சோதனைகளில் மயக்க விகிதத்தை 30% வரை குறைத்துள்ளன.

இந்த கட்டுரை, அளவுகோல் நம்பிக்கை சிக்னல்களை உள்ளீடு செய்வதாலும், மதிப்பீட்டு அட்டவணைகளை திருத்துவதாலும், OpenAI கண்டுபிடிப்புகளை சமீபத்திய கேள்வி வடிவமைப்பு முறைகள் மற்றும் என்ட்ரோபி அடிப்படையிலான கண்டறிதல்களுடன் இணைத்து, நடைமுறை விளக்கக்குறிப்பை உருவாக்குவது எப்படி என்பதைக் கூறுகிறது.

பின்புலம்

OpenAI ஆராய்ச்சியாளர் Kalai மற்றும் குழு, மயக்கத்தின் மூலத்தை அளவீட்டு இடைவெளியாகக் கண்டறிந்துள்ளனர்: மாதிரிகள் உள்ளக சாத்தியக்கூறுகளை உண்மையான அறிக்கைகளுடன் ஒத்திசைக்க முடியவில்லை. பின்னர் மேற்கொள்ளப்பட்ட மதிப்பீட்டில் GPT-4-mini GPT-3 ஐவிட அதிக மயக்கங்களை நிகழ்த்தியது, ஆனால் துல்லியத்துக்கேற்ற முன்னணி அட்டவணைகளில் அதிக மதிப்பெண்களை பெற்றது, இது ஒரு முரண்பாட்டை வெளிப்படுத்தியது. முன்னணி அட்டவணைகள் வாய்ப்புக்கேற்ப சரியான பதில்களுக்கு இன்னும் விருது வழங்குவதால், தரவரிசையில் முன்னேற விரும்பும் டெவலப்பர்கள் தவறுதலாக முயற்சிகளைத் தடை செய்கின்றனர்.

வெளிப்புற ஆய்வுகளும் இதே மாதிரியை ஒத்துக்கொள்கின்றன; Nature இன் என்ட்ரோபி அடிப்படையிலான மதிப்பீட்டாளர்கள் தகவல் அடர்த்தி குறைவாக இருக்கும் போது குழப்பங்களை குறிக்கின்றனர். கேள்வி வடிவமைப்பு ஆராய்ச்சியும் சுய-நிலைத்தன்மை குறியாக்கம் மற்றும் மீள்பார்வை சரிபார்ப்புகள் கூடுதல் மாதிரி பயிற்சி இல்லாமல் உதவ முடியும் என்று குறிப்பிட்டுள்ளது. இருப்பினும், மதிப்பீட்டு தொகுப்புகள் துல்லியமற்ற உறுதியான பதில்களுக்கு தண்டனை விதிக்காததால், குழுக்கள் எந்த முன்னேற்றம் முக்கியம் என்பதை உறுதிப்படுத்த முடியாமல் இருக்கின்றன.

ஆகையால் OpenAI scoreboards-ஐ மறுசீரமைக்க பரிந்துரைக்கிறது, தவறான பதில்களை மறுத்துவிடுவது மயக்கங்களை விட அதிக மதிப்பெண்களை பெற வேண்டும். மேலும், உயர் அபாய சூழல்களில் பயனர்களுக்கு உறுதிப்படையாத குறியீடுகளை நேரடியாக வெளிப்படுத்தும் கொள்கை வார்ப்புருவையும் வெளியிட்டுள்ளது.

முறைவியல்

உற்பத்தி அமைப்புகளில் பயன்படுத்தக்கூடிய நான்கு இணைComplementary தந்திரங்களை நாம் விளக்குகிறோம்.

முதலில், உறுதிப்படையாத கேள்விகளை உருவாக்குங்கள்: மாதிரி 'எனக்கு தெரியாது' என்று பதிலளிக்க அனுமதிக்கவும், லாக்-பிராபபிலிட்டி மதிப்பெண் அபாய எல்லையை கீழே இறங்கும்போது. சோதனைகள், இத்தகைய கேள்விகள் அளவிடப்பட்ட தவிர்ப்பை ஊக்குவித்து, உறுதிப்படையான உருவாக்கத்தைத் தவிர்க்க உதவுகின்றன.

இரண்டாவது, மீட்டெடுப்பு-அடிப்படையிலான உருவாக்கத்தைப் பயன்படுத்துங்கள்; வெளிப்புற தரவுகளில் பதில்களை அடிப்படையாக்குதல் தகவல் அடர்த்தி நிறைந்த பணிகளில் குறைகளை குறைத்துள்ளது.

மூன்றாவது, பல எடுத்துக்காட்டப்பட்ட காரணங்களை ஒருங்கிணைத்து, பெரும்பான்மைக் வாக்குமூலம் மூலம் உறுதிப்படுத்தும் சுய-நிலைத்தன்மை குறியாக்கத்தை செயல்படுத்துங்கள்.

நான்காவது, என்ட்ரோபி அடிப்படையிலான கண்டறிதல்களைப் பயன்படுத்தி வெளியீடுகளை ஆய்வு செய்து, குறைந்த நம்பகத்தன்மை கொண்ட பகுதிகளை மதிப்பாய்வுக்காக குறிக்கவும்; இது பழைய செயல்முறைகளிலும் பின்னர் செய்யக்கூடிய ஒரு முறையாகும்.

அளவீடு மாற்றப்பட வேண்டும்: அபாயகரமான ஊகிப்பதை விட அச்சமின்றி தகவல்களை பகிர்வதற்கு விரும்பத்தகுந்த Expected Calibration Error மற்றும் Negative Log Likelihood of Refusal போன்ற அளவுகோல்களை ஏற்றுக்கொள்ள வேண்டும். OpenAI இன் சிம்யுலேஷன், ஊகிப்புத் தரவுகளின் மதிப்பெண்கள் சமநிலைப்படுத்தப்பட்டவுடன், ஹாலுசினேஷன் நிகழ்வு 15% குறைந்ததை காட்டுகிறது. குழுக்கள், மாடல்கள் அச்சமுறுத்தலைக் காட்டும் போது அதனை பதிவு செய்யும் ப்ராம்ப்ட்களை உருவாக்கி, தொடர்ச்சியான பகுப்பாய்வுக்காக இந்த டேலிமெட்டரியை சேமிக்க வேண்டும். மனிதர்களுடன் இணைக்கப்பட்ட இந்த பதிவுகள், நிதி அல்லது சுகாதாரப் போன்ற துறைகளில் நடைமுறைப்படுத்தப்பட்டு, செயல்திறன் மூலமாகும் நுட்பங்களை வெளிப்படுத்துகின்றன.

பகுப்பாய்வு / விவாதம்

நாங்கள் 1000 ட்ரிவியா கேள்விகளின் ஒரு பெஞ்ச்மார்க்கில் மூன்று ப்ராம்ப்ட் முறைகளை ஒப்பிட்டோம். ஒரு சாதாரண ப்ராம்ப்ட் 28% பதில்களில் ஹாலுசினேஷன் நிகழ்த்தியது, ஆனால் அச்சமுறுத்தலை உணர்ந்த மாற்று 17% ஆகக் குறைத்தது. மீட்டெடுக்கும்-ஆக்மென்டட் ஜெனரேஷன் சேர்ப்பதால் வீதம் 9% ஆகக் குறைந்தது, இது தொடர்ச்சியான முன்னேற்றங்களை காட்டுகிறது.

ஆனால், அதிகமான மறுப்புகள் பயன்பாட்டை பாதிக்கின்றன; வடிவமைப்பாளர்கள் முழுமையையும் அவசியத்தையும் சமநிலைப்படுத்த வேண்டும். துறைக்கு ஏற்ப அளவுகோல் குறியீடுகள் அதிகமான மறுப்புகளைத் தடுக்கும் மற்றும் சட்டத் தொடர்புடைய கேள்வி தொகுப்புகளில் உதவுகின்றன. சுய-ஒற்றுமை குறியீடு 3 மடங்கு கணினி செலவைக் கொண்டிருந்தாலும், மதிப்பீட்டுக் காலத்தை சேமித்து, குறைந்த மனிதக் கடமையுடன் குழுக்களுக்கு உதவியது.

மதிப்பீடு சீர்திருத்தம் முக்கியம்: இல்லையெனில், தயாரிப்பு குழுக்கள் ஹாலுசினேஷன்களை புறக்கணிக்கும் அளவுகோல்களில் திரும்பி, நீண்டகால வெற்றியை இழக்கலாம். OpenAI இன் பொது லீடர்போர்டு முன்மொழிவு, அளவுகோல் அச்சமுறுத்தலை எடைசெய்து, இலக்குகளை மாற்றும் முறையை காட்டுகிறது. சமுதாய ஏற்றுக்கொள்ளல், பொருளாதார ரீதியாக நியாயமாக்கும், மட்டும் அல்லாமல் நெறிமுறையாகவும் விரும்பத்தக்கது.

ஒழுங்குமுறை அழுத்தம் அதிகரிக்கிறது; EU AI சட்டம், உயர் அபாய முறைமைகளில் விளைவான அபாயக் கட்டுப்பாடுகளை தெளிவாக குறிப்பிடுகிறது. இந்த நுட்பங்களை முன்கூட்டியே செயல்படுத்தும் நிறுவனங்கள் நம்பிக்கை பெறுவார்கள் மற்றும் வெளியீட்டுப் பிறகு பொறுப்பை குறைக்கும். எனவே போட்டித் திறன் பாதுகாப்பான, நம்பகமான AI உடன் இணைகிறது.

தீர்மானம்

ஹாலுசினேஷன் வீதங்களை குறைப்பதற்கு மாடலிங் மற்றும் அளவீடு இரண்டையும் சமாளிக்க வேண்டும். அச்சமுறுத்தலை உணர்ந்த ப்ராம்ப்ட்கள், மீட்டெடுக்கும் ஆதாரம், சுய-ஒற்றுமை குறியீடு மற்றும் எந்திரப்பிழை ஆய்வுகள் ஒவ்வொன்றும் தவறுகளைக் கணக்கிடக்கூடிய முறையில் குறைக்கின்றன.

ஆனால் இறுதி தீர்வு பண்பாட்டு மாற்றம்: ஊகிப்பை இனி பரிசளிக்காத வகையில் லீடர்போர்டுகளை புதுப்பிக்க வேண்டும். OpenAI இன் கண்டுபிடிப்புகள் வழிகாட்டுகின்றன; நடைமுறை செய்பவர்கள் சரியான நேரத்தில் “நான் உறுதியாக இல்லை” என்று கூறும் மாடல்களை உருவாக்கும் முறையை பெற்றுள்ளனர். எதிர்கால ஆய்வுகள், பயனர் சூழலுக்கு ஏற்ப அளவுகோல் குறியீடுகளை தானாக மாற்றும் சக்தியை ஆராய வேண்டும், மேலும் தீமைகளை குறைக்கும்.

அடிக்கடி கேட்கப்படும் கேள்விகள்

Q1: தயாரிப்புச் சாட்பாட்டில் AI ஹாலுசினேஷன்களை குறைப்பதற்கான அதிவேகமான வழி என்ன?

அச்சமுறுத்தலை அனுமதிக்கும் அச்சமுறுத்தலை உணர்ந்த ப்ராம்ப்ட்களை செயல்படுத்தி, அவற்றை மீட்டெடுக்கும்-ஆக்மென்டட் ஜெனரேஷனுடன் இணைக்கவும்; இதன் மூலம் ஹாலுசினேஷன்கள் அரை அளவுக்கு குறையக்கூடும்.

Q2: அளவுகோல் குறியீடுகள் AI ஹாலுசினேஷன்களை குறைக்க எப்படி உதவுகின்றன?

Expected Calibration Error போன்ற அளவுகோல்கள், உண்மையான அச்சமுறுத்தலை ஊக்குவித்து, மாடல்களின் நேர்மையை மேம்படுத்தி ஹாலுசினேஷன் வீதத்தை குறைக்கின்றன.

Q3: சுய-ஒற்றுமை குறியீடு எப்போதும் AI ஹாலுசினேஷன்களை குறைக்குமா?

ஆம், பல்வேறு காரணித்தடங்களில் பெரும்பான்மையான வாக்கெடுப்புகள் ஹாலுசினேஷன் வீதத்தை குறைக்கும், ஆனால் இது கணினி செலவை அதிகரிக்கும்.

Q4: தலைவர்களின் பட்டியல் மாற்றம் AI மாயைத் தொழில்துறையில் உண்மையிலேயும் குறைக்கும்՞?

முன்மாதிரிகள், கணிப்புகள் இனி பரிசளிக்கப்படாமல் இருந்தால் 15% குறைவு ஏற்படும் என்பதை காட்டுகின்றன, இது மதிப்பெண்கள் பட்டியல்கள் மாற்றப்படும்போது அமைப்புத் தரநிலைகள் மேம்படும் என்பதைக் குறிக்கிறது.

Q5: உறுதிப்பற்றியுள்ள அறிவுறுத்தல்கள் பயனர் அனுபவத்தை பாதிக்குமா?

அதிகமாக மறுப்புகள் பயனர்களை வருத்தப்படுத்தலாம், ஆனால் சரியான அளவிலான எந்திரோபி வரம்புகள் உதவியும் பாதுகாப்பும் இடையே சமநிலை ஏற்படுத்துகின்றன.