PPT ద్వారా AIని సులభంగా చూపించే ప్రయత్నం చేసే భాగం
కృత్రిమ మేధస్సులో నిర్ణయం తీసుకోవడం గురించి ఒక విషయం ఏమిటంటే, ప్రతి ఒక్కరూ దీనిని అర్థం చేసుకున్నట్లు నటిస్తారు—అది అద్భుతమైన నిర్ణయం తీసుకునే వరకు లేదా స్పష్టమైన తప్పులో ముఖం పడేసే వరకు. అప్పుడు అకస్మాత్తుగా అది "చాలా క్లిష్టమైనది" లేదా "బ్లాక్ బాక్స్" అవుతుంది, గణితం అరటి తొక్కపై జారిపోయినట్లుగా ఉంటుంది. మీరు ఎప్పుడైనా PPT ద్వారా కూర్చుని ఉంటే, మీకు రొటీన్ తెలుసు: పెద్ద బాణాలు, ఫ్లోచార్ట్లు మరియు అనివార్యతను సూచించే క్లిప్ఆర్ట్ ముక్కలు. ఇది అనివార్యం కాదు. ఇది అన్ని విధాలా ఎంపికలు.
ఇది AI నిర్ణయం తీసుకోవడానికి ఉపయోగించే అల్గారిథమ్లలోకి—నిజమైన వాటిలోకి—లోతైన డైవ్. బాక్సీ బాణాలతో కూడిన స్లైడ్ డెక్ కాదు. “AI మన కోసం నిర్ణయిస్తుంది” అనే నాటకాన్ని తగ్గించి, ఈ సిస్టమ్లు నిజంగా ఎలా ఎంచుకుంటాయో మాట్లాడటమే లక్ష్యం. స్పాయిలర్: అవి సర్వజ్ఞులైన ఒరాకిల్స్ లాగా కాకుండా, చాలా వేగవంతమైన, చాలా అక్షరాలా రీజనర్ల వలె ఉంటాయి, వారు ఎప్పుడూ ట్రాఫిక్లో కూర్చోవాల్సిన అవసరం లేదు లేదా పసిపిల్లల నిద్రవేళ గురించి చర్చించాల్సిన అవసరం లేదు.
"AIలో నిర్ణయం తీసుకోవడం" అంటే ఏమిటి (మరియు PPTలు ఏమి అంగీకరించవు)
"కృత్రిమ మేధస్సులో నిర్ణయం తీసుకోవడం" గొప్పగా అనిపిస్తుంది, కానీ ఆచరణలో ఇది సాంకేతికతల సమితి: నియమం-ఆధారిత తార్కికం, శోధన, ఆప్టిమైజేషన్, సంభావ్య అనుమితి, రీన్ఫోర్స్మెంట్ లెర్నింగ్, ప్రణాళిక మరియు మొత్తం గందరగోళాన్ని కలిపి కుట్టే హైబ్రిడ్ సిస్టమ్స్. అల్గారిథమ్లకు ఏమి "కావాలి" అని ఉండదు. అవి నిర్దిష్ట పరిమితుల క్రింద నిర్దిష్ట ఫంక్షన్లను ఆప్టిమైజ్ చేస్తాయి. ఫంక్షన్ లేదా పరిమితులను మార్చండి మరియు మీకు వేరే "ఇంటెలిజెన్స్" వస్తుంది. అది స్పష్టంగా అనిపిస్తే, అభినందనలు—మీరు SlideShareలోని సగం డెక్ల కంటే ముందున్నారు.
చాలా PPTలతో ఉన్న నిజమైన సమస్య ఏమిటంటే అవి సరళీకృతం చేయవు. అవి తప్పు దిశలో సరళీకృతం చేస్తాయి. నమూనాలు "నేర్చుకున్నాయి" కాబట్టి నిర్ణయిస్తాయని అవి సూచిస్తున్నాయి. నేర్చుకోవడం నిర్ణయించడం కాదు. నేర్చుకోవడం మీకు పాలసీ లేదా మోడల్ను అందిస్తుంది; నిర్ణయం తీసుకోవడం అనేది శిక్షణ డేటా వలె ఎప్పుడూ ఉండని సందర్భంలో ఆ పాలసీని అమలు చేయడం. చెస్ ప్రారంభాన్ని గుర్తుంచుకోవడం మరియు మిడిల్గేమ్ గందరగోళాన్ని తట్టుకోవడం మధ్య వ్యత్యాసం—మొదటిది బుల్లెట్ పాయింట్లో బాగుంది; రెండోది గెలుస్తుంది.
నిజమైన సాధనాలు: నియమాల నుండి రివార్డ్ల వరకు
పాతకాలపు (కానీ ఇప్పటికీ ముఖ్యమైనది) అనిపించే వాటి నుండి ఆధునిక సిస్టమ్లకు శక్తినిచ్చే సాంకేతికతల వరకు స్టాక్ను పరిశీలిద్దాం. సాధారణ మాటలు, శృంగారం లేదు.
రూల్-బేస్డ్ సిస్టమ్స్: ఇంకా చనిపోలేదు, నిజాయితీగా ఉన్నాయి
కొంతమంది AI వ్యక్తులకు నియమాలు ఇబ్బందికరంగా ఉంటాయి, చెప్పులతో సాక్స్ ధరించినట్లుగా ఉంటుంది. కానీ నియమం-ఆధారిత నిర్ణయం తీసుకోవడానికి ఒక పెద్ద ప్రయోజనం ఉంది: పారదర్శకత. ఒక PPT నియమాలను "లెగసీ"గా దాటవేస్తే, అది సగం కథను దాచిపెడుతోంది. నిపుణుల వ్యవస్థలు డొమైన్ పరిజ్ఞానాన్ని ఇఫ్-దెన్ స్టేట్మెంట్లుగా ఎన్కోడ్ చేస్తాయి. అవి పెళుసుగా ఉంటాయి, అవును, కానీ అవి ఆడిట్ చేయగలవు. మీకు నిర్ధారణ మరియు ట్రేసబిలిటీ అవసరమైనప్పుడు—సమ్మతి తనిఖీలు, వైద్య ట్రియేజ్ ప్రోటోకాల్లు—నియమాలు ఇప్పటికీ పని చేయడమే కాదు; అవి బాగా పని చేస్తాయి.
- ప్రోస్: నిర్ధారిత, వివరించదగిన, డీబగ్ చేయడం సులభం
- కాన్స్: పెళుసుగా ఉంటాయి, గందరగోళ డొమైన్లలో విస్తరించడం కష్టం
రూల్ సిస్టమ్ ఎప్పుడు విఫలమవుతుందో మీకు తెలుసు ఎందుకంటే అది మీకు చెబుతుంది. చాలా ఆధునిక సిస్టమ్లు నిశ్శబ్దంగా విఫలమవుతాయి.
శోధన మరియు ఆప్టిమైజేషన్: నావిగేషన్గా నిర్ణయాలు
మేము ప్రతిదీ డేటా సముద్రాలపై శిక్షణ ఇవ్వడానికి ముందు, మేము శోధించాము. బ్రెడ్త్-ఫస్ట్ సెర్చ్, డెప్త్-ఫస్ట్ సెర్చ్, A*, బీమ్ సెర్చ్. ఇది ఆకర్షణీయంగా లేదు, కానీ మీరు ఎప్పుడైనా పాత్ఫైండింగ్ సమస్యను పరిష్కరిస్తుంటే—అక్షరాలా లేదా రూపకంగా—శోధన వెన్నెముక. మంచి హ్యూరిస్టిక్తో కూడిన A* తెలివితక్కువ లక్ష్యంతో "స్మార్ట్" మోడల్ను ఓడిస్తుంది.
ఆప్టిమైజేషన్ దీన్ని సాధారణీకరిస్తుంది: మీరు ఒక లక్ష్య ఫంక్షన్ మరియు పరిమితులను సెట్ చేస్తారు, ఆపై మీ వద్ద ఉన్న కంప్యూట్తో మీరు భరించగలిగే ఉత్తమ పరిష్కారం వైపుకు నెట్టండి. లీనియర్ ప్రోగ్రామింగ్, మిక్స్డ్-ఇంటిజర్ ప్రోగ్రామింగ్, ఎవల్యూషనరీ అల్గారిథమ్స్—“దాదాపు మంచి” నుండి “సరిపోయేంత మంచి” వరకు గడువులోగా పొందడానికి అక్షర క్రమం.
- ప్రోస్: నిరూపించదగిన హామీలు, నియంత్రించదగిన ట్రేడ్-ఆఫ్లు
- కాన్స్: మోడలింగ్ కష్టం; లక్ష్యాలు సూక్ష్మమైన, విపత్తు కలిగించే మార్గాల్లో తప్పుగా పేర్కొనబడతాయి
ఒక మోడల్ ఏదో వింతగా చేస్తే, మీరు అడిగినది ఖచ్చితంగా పొందినందుకే—మీరు అర్థం చేసుకున్నది కాదు.
సంభావ్య తార్కికం: అనిశ్చితి ఒక లక్షణం
బేసియన్ నెట్వర్క్లు, హిడెన్ మార్కోవ్ మోడల్స్, కల్మన్ ఫిల్టర్లు: క్లాసిక్స్. ప్రపంచం ఖచ్చితమైనదని నటించే బదులు, ఈ పద్ధతులు అనిశ్చితి యొక్క నడుస్తున్న లెక్కింపును ఉంచుతాయి మరియు దానికి వ్యతిరేకంగా రక్షణగా ఉండే చర్యలను ఎంచుకుంటాయి. మరో మాటలో చెప్పాలంటే, వాస్తవికత.
- ప్రోస్: అనిశ్చితిలో సూత్రబద్ధమైనది; వివరించదగిన నిర్మాణం
- కాన్స్: అధిక-డైమెన్షనల్ గందరగోళానికి విస్తరించడం బాధాకరమైనది; ఊహలు వెనక్కి కొడతాయి
సంభావ్య పద్ధతులు అంటే చాలా PPT డెక్లు “విశ్వాస స్కోర్లు”తో సూచిస్తాయి. విశ్వాసం సంభావ్యత కాదు. సంభావ్యత అనేది రసీదులతో కూడిన గణితం.
రీన్ఫోర్స్మెంట్ లెర్నింగ్: రివార్డ్లు నియమాలను రూపొందిస్తాయి
రీన్ఫోర్స్మెంట్ లెర్నింగ్—Q-లెర్నింగ్, పాలసీ గ్రేడియంట్స్, యాక్టర్-క్రిటిక్ వేరియంట్లు—నిర్ణయం తీసుకోవడాన్ని స్కోర్బోర్డ్తో ట్రయల్ మరియు ఎర్రర్గా ఫ్రేమ్ చేస్తుంది. మీరు చర్యలను ఎంచుకుంటారు, పర్యావరణం మీకు రివార్డ్లను అందిస్తుంది మరియు కాలక్రమేణా చెల్లించే చర్యల వైపు మీ పాలసీని నెట్టండి. ఇక్కడే AI నిజంగా "నిర్ణయిస్తుంది", మీరు రూపొందించిన ఆట ఆడుతున్నట్లుగా—మీకు అది తెలిసిందా లేదా అనేది వేరే విషయం.
- ప్రోస్: సీక్వెన్షియల్ డెసిషన్ టాస్క్లకు బలంగా ఉంది; మీరు స్పష్టంగా కోడ్ చేయని వ్యూహాలను నేర్చుకుంటుంది
- కాన్స్: రివార్డ్ హ్యాకింగ్; నమూనా అసమర్థత; ప్రపంచం కొంచెం మారినప్పుడు పెళుసుగా ఉండే సాధారణీకరణ
రీన్ఫోర్స్మెంట్ లెర్నింగ్ "మానవులు ఎలా నేర్చుకుంటారో అలానే ఉంటుంది" అని ప్రజలు చెప్పడానికి ఇష్టపడతారు. నిజంగా కాదు. మానవులకు పూర్వ అనుభవాలు, శరీరాలు, విసుగు మరియు సాధారణ జ్ఞానం ఉన్నాయి. RL ఏజెంట్లకు రివార్డ్ ఫంక్షన్ మరియు పని చేసే వరకు అర్థంలేని విషయాలను ప్రయత్నించడానికి అనంతమైన ఓపిక ఉంటాయి.
ప్రణాళిక మరియు POMDPలు: ప్రపంచం సగం కనిపిస్తుంది
నిజ-ప్రపంచ నిర్ణయం తీసుకోవడం అరుదుగా ఖచ్చితమైన సమాచారంతో వస్తుంది. పాక్షికంగా గమనించదగిన మార్కోవ్ డెసిషన్ ప్రాసెస్లు (POMDPలు) ఆ అనిశ్చితిని స్పష్టంగా మోడల్ చేస్తాయి: మీకు స్థితి తెలియదు, దాని గురించి సూచనలు ఇచ్చే పరిశీలనలు మాత్రమే తెలుస్తాయి. పాక్షికంగా గమనించదగిన స్థితిలో ప్రణాళిక చేయడం మిమ్మల్ని నమ్మక స్థితిని ఉంచుకోవడానికి బలవంతం చేస్తుంది—“మనకు కనిపించిన వాటిని బట్టి ఏమి జరుగుతోందని మేము అనుకుంటున్నామో” చెప్పడానికి ఒక ఫాన్సీ పదం.
- ప్రోస్: అనిశ్చితి గురించి నిజాయితీగా ఉంటుంది; తెలివైన చర్య కోసం అధికారిక పునాదులు
- కాన్స్: గణనపరంగా క్రూరమైనది; ఉజ్జాయింపులు అవసరమైన దుష్టత్వం
మీ PPT కనీసం “POMDP” అని గుసగుసలాడకపోతే, అది వాస్తవికతను ఐచ్ఛిక సెట్టింగ్గా పరిగణిస్తోంది.
హైబ్రిడ్ సిస్టమ్స్ మరియు న్యూరో-సింబాలిక్ మాషప్లు
న్యూరల్ నెట్వర్క్లు చూసి లేబుల్ చేస్తాయి; సింబాలిక్ సిస్టమ్లు వివరిస్తాయి మరియు పరిమితం చేస్తాయి. వాటిని కలిపి అతికించండి మరియు మీకు ఉపయోగకరమైనది ఏదో వస్తుంది. అవగాహన కోసం విజన్ మోడల్, భద్రత కోసం నియమాలు. అభ్యర్థి చర్యల కోసం భాషా నమూనా, సాధ్యత కోసం ప్లానర్. ఈ హైబ్రిడ్లు ట్రెండీ మాత్రమే కాదు; అవి ఇంజనీరింగ్ వినయాన్ని ప్రతిబింబిస్తాయి: అవగాహన కష్టమైన చోట నేర్చుకున్న మోడల్ను ఉపయోగించండి, వాటాలు ఎక్కువగా ఉన్న చోట స్పష్టమైన తర్కాన్ని ఉపయోగించండి.
- ప్రోస్: ఆచరణాత్మకమైనది, నియంత్రించదగినది, రెండింటిలోనూ ఉత్తమమైనది
- కాన్స్: ఇంటిగ్రేషన్ తలనొప్పి, పెళుసుగా ఉండే ఇంటర్ఫేస్లు, నకిలీ సంక్లిష్టత
డెసిషన్ లూప్: యంత్రాల కోసం OODA, తక్కువ సంక్షిప్త పదాలతో
చాలా AI నిర్ణయ వ్యవస్థలు ఒక లూప్ను అమలు చేస్తాయి: గమనించండి, అనుకోండి, ప్లాన్ చేయండి, చర్య తీసుకోండి, పునరావృతం చేయండి. స్లైడ్ డెక్లు వృత్తాలు మరియు బాణాలను ఇష్టపడతాయి; ముఖ్యమైన బిట్ టెన్షన్. ప్రతి దశ రాజీపడుతుంది. గమనించండి (కానీ ప్రతిదీ కాదు). అనుకోండి (కానీ మీ అనిశ్చితిని ఉంచుకోండి). ప్లాన్ చేయండి (కానీ సమయం ప్రకారం). చర్య తీసుకోండి (కానీ ప్రపంచాన్ని తగలబెట్టవద్దు).
- ఫీచర్లకు ముడి డేటా నుండి చిహ్నానికి అవగాహన. సమాచారాన్ని కోల్పోండి, ఆశాజనకంగా సరైన సమాచారం.
- ప్రస్తుతం ఏమి జరుగుతోందనే దానిపై పంపిణీకి లక్షణాల నుండి నమ్మకానికి అంచనా.
- ప్రస్తుత నమ్మకం నుండి చర్య క్రమానికి పాలసీ, కంప్యూట్ మరియు రిస్క్ ఆకలి ద్వారా పరిమితం చేయబడింది.
- చర్య, ఫలితాలను కొలవడం, నమ్మకాలను మరియు పారామితులను నవీకరించడం చర్య నుండి అభిప్రాయానికి. మీ లూప్ అనుభవంతో మెరుగుపడకపోతే, అది ఆటోమేషన్, AI కాదు.
PPTలో అతిపెద్ద తప్పు ఏమిటంటే లూప్ శుభ్రంగా ఉందని నటించడం. ఉత్పత్తిలో, సెన్సార్లు డ్రిఫ్ట్ అవుతాయి, మానవులు జోక్యం చేసుకుంటారు మరియు కొలమానాలు ఒకదానితో ఒకటి పోరాడతాయి. గొప్ప వ్యవస్థలు ప్రపంచం భుజం తడుముకున్నప్పుడు చక్కగా దిగజారుతాయి.
అల్గారిథమ్లలోకి లోతైన డైవ్ (బజ్వర్డ్ సాస్ లేకుండా)
ప్రజలు ఉపయోగించే అల్గారిథమ్లను నిజంగా చూద్దాం—వాటిని ఏమి పరిష్కరిస్తాయి, అవి ఎలా విఫలమవుతాయి మరియు అవి ఎక్కడ ప్రకాశిస్తాయి.
మల్టీ-ఆర్మ్డ్ బాండిట్స్: డ్రామా లేకుండా అన్వేషణ
కొత్త విషయాలను ప్రయత్నించడం మరియు పని చేసే వాటిని ఉపయోగించుకోవడం మధ్య సమతుల్యం అవసరమైనప్పుడు—ప్రకటన ఎంపిక, సిఫార్సు ట్వీక్లు, UI ప్రయోగాలు—వేగం కోసం మల్టీ-ఆర్మ్డ్ బాండిట్స్ A/B పరీక్షను ఓడిస్తాయి. థాంప్సన్ నమూనా ఆచరణాత్మక ఇష్టమైనది: బేసియన్, సరళమైనది, ప్రభావవంతమైనది. ఇది పూర్తి RL ఏజెంట్గా నటించదు. ఇది దాని కోసం మంచిది.
- దీని కోసం ఉపయోగించండి: అభిప్రాయంతో వేగవంతమైన ఆన్లైన్ నిర్ణయం తీసుకోవడం
- దీని కోసం ఉపయోగించవద్దు: సుదీర్ఘ-హోరిజోన్ వ్యూహం, సంక్లిష్ట ఆధారపడటం, భద్రత-క్లిష్టమైన ఏదైనా
మోంటే కార్లో ట్రీ సెర్చ్: బడ్జెట్లో ముందుచూపు ఆడటం
MCTS భవిష్యత్తులను నమూనా చేస్తుంది, వాటన్నింటినీ కాదు, నమ్మదగిన వాటిలో తగినంత మాత్రమే. ఇది “దీని గురించి ఆలోచిద్దాం, కానీ రోజంతా కాదు” అనే అల్గారిథమిక్ సమానమైనది. ఆటలలో మరియు నిర్మాణాత్మక ప్రణాళికలో, ఇది గెలుస్తుంది. బహిరంగ గందరగోళంలో, ఇది అక్కడ లేని నిర్మాణాన్ని భ్రమ చేస్తుంది.
- దీనికి గొప్పది: బౌండ్ చేయబడిన, బాగా మోడల్ చేయబడిన నిర్ణయ స్థలాలు (ఆటలు, పరిమిత ప్రణాళిక)
- దీనికి బలహీనమైనది: మోడల్ చేయని గందరగోళం (మానవులు, మార్కెట్లు, ట్విట్టర్)
డైనమిక్ ప్రోగ్రామింగ్: క్యాచ్తో సరైనది
బెల్మన్ సమీకరణాలు, విలువ పునరుక్తి, పాలసీ పునరుక్తి. నియంత్రణ సిద్ధాంతంలోని కిరీట రత్నాలు, ఘాతాంక పెరుగుదలతో చేసిన కిరీటంతో. స్థితి స్థలం పేలితే, మీ ఆశావాదం కూడా పేలుతుంది.
- దీనికి గొప్పది: తెలిసిన డైనమిక్స్తో కూడిన చిన్న-నుండి-మధ్యస్థ మార్కోవ్ ప్రపంచాలు
- దీనికి బలహీనమైనది: మిగతావన్నీ, మీరు ఉజ్జాయింపు చేస్తే తప్ప (అంటే, ఎల్లప్పుడూ)
హ్యూరిస్టిక్స్ మరియు మెటాహ్యూరిస్టిక్స్: నిరాడంబరమైన వర్క్హార్స్లు
సిమ్యులేటెడ్ అన్నేలింగ్, టాబు శోధన, జన్యు అల్గారిథమ్లు. ఇవి మహిమాన్వితమైన "చాలా విషయాలను ప్రయత్నించండి, ఉత్తమమైనదాన్ని ఉంచండి, కొనసాగించండి." అది అవమానం కాదు. చాలా నిజమైన నిర్ణయాలు స్కేల్లో ఇలాగే కనిపిస్తాయి ఎందుకంటే గడియారం ముగిసేలోపు ఖచ్చితమైన సమీకరణాన్ని పరిష్కరించడానికి వాస్తవికత మిమ్మల్ని కూర్చోనివ్వదు.
- దీనికి గొప్పది: కఠినమైన కాంబినేటోరియల్ సమస్యలు, అక్కడ సరైనది ఒక ఫాంటసీ
- దీనికి బలహీనమైనది: డొమైన్లు వేగం కంటే హామీలు ముఖ్యమైనవి
కారణ నమూనాలు: ఎందుకంటే సహసంబంధం ఒక మోసగాడు
కారణ నిర్ణయం తీసుకోవడం—అవును, పెర్ల్, గ్రాఫ్లు, జోక్యాలు—“మనం నిజంగా ఏదైనా మార్చినట్లయితే ఏమి జరుగుతుంది?” అని అడగడానికి మీకు ఒక మార్గాన్ని అందిస్తుంది. బదులుగా “గతసారి ఏమి జరిగింది?” అని అడుగుతుంది. మీ PPT కారణ అనుమితిని పేర్కొనకపోతే, కానీ మీ ఉత్పత్తి ప్రజలను ప్రభావితం చేసే ఎంపికలను చేస్తే, మీరు చింత కోసం సిఫార్సు ఇంజిన్ను నిర్మిస్తున్నారు.
- దీనికి గొప్పది: పాలసీ, వైద్యం, రెండవ-క్రమ ప్రభావాలతో ఉత్పత్తి మార్పులు
- దీనికి బలహీనమైనది: ప్రతిఘటనలు పట్టింపు లేని పూర్తిగా అంచనా వేసే పనులు
రెండు కష్టమైన సమస్యలు: లక్ష్యాలు మరియు పరిమితులు
AI నిర్ణయం తీసుకోవడంలో మొదటి అబద్ధం ఏమిటంటే మనం “పనితీరును” ఆప్టిమైజ్ చేస్తున్నాం. ఖచ్చితంగా ఏమి ఆప్టిమైజ్ చేయాలి? క్లిక్లు? సమయపాలన? ఆదాయం? భద్రత? న్యాయం? జాప్యం? మీరు దాన్ని వివరించకపోతే, మీకు సిస్టమ్ లేదు—మీకు ఒక కోరిక ఉంది. లక్ష్య ఫంక్షన్ అనేది ఉత్పత్తి. చట్టపరమైన బాయిలర్ప్లేట్లాగా వ్యవహరించండి మరియు అది చట్టపరమైన బాయిలర్ప్లేట్లాగా కొరుకుతుంది.
- బహుళ-లక్ష్య ట్రేడ్-ఆఫ్లు బగ్లు కాదు. అవి ఉద్యోగం. వాటిని స్పష్టంగా బరువు పెట్టండి, నొప్పిని నిజాయితీగా కొలవండి మరియు పరేటో ఫ్రంట్లు నైతిక దిక్సూచీలు అని నటించవద్దు.
- పరిమితులు తర్వాత ఆలోచనలు కావు. అవి హానిని ఎలా బౌండ్ చేస్తాయో. కఠినమైన పరిమితులు (లేదు, నిజంగా, Xని ఎప్పుడూ మించకూడదు) మృదువైన జరిమానాల కంటే భిన్నంగా ఉంటాయి (దయచేసి అది లాభదాయకం కాకపోతే Xని మించవద్దు). మీరు దానిని అర్థం చేసుకున్నట్లుగా వ్రాసి ఉంచండి.
పరిశ్రమ యొక్క ఇష్టమైన స్వీయ-భ్రమ ఏమిటంటే ఎక్కువ డేటా చెడ్డ లక్ష్యాన్ని పరిష్కరిస్తుందని భావించడం. అది అలా చేయదు. ఇది తప్పు పనిని చాలా సమర్థవంతంగా చేస్తుంది.
వివరించదగినది ఐచ్ఛికం కాదు; ఇది సందర్భం
వివరించదగిన AI కోసం ఒత్తిడి తరచుగా సమ్మతి ఇబ్బందిగా రూపొందించబడుతుంది. అది వెనక్కి ఉంది. “వివరించదగినది” అనేది నిర్ణయంపై ఆధారపడే వ్యక్తులతో—వారు ఇంజనీర్లు అయినప్పటికీ—మీరు ఎలా నమ్మకాన్ని పెంచుతారో. నియంత్రణ సంస్థను శాంతింపజేయడానికి కాదు, మళ్లీ జరిగే ముందు క్రాష్ను డీబగ్ చేయడానికి మోడల్ “ఎడమకు తిరగండి” అని ఎందుకు చెప్పిందో మీరు తెలుసుకోవాలి.
- తర్వాత వివరణలు (సాలియన్సీ మ్యాప్స్, SHAP) ఏమీ లేకపోవడం కంటే మంచివి, కానీ అవి లిప్స్టిక్—ఉపయోగకరమైన లిప్స్టిక్—పందెం గుర్రం కాగల పందిపై.
- అంతర్నిర్మిత వివరణాత్మకత (మోనోటోనిక్ నమూనాలు, సాధారణీకరించిన సంకలిత నమూనాలు, నేర్చుకున్న థ్రెషోల్డ్లతో నియమాలు) ఊహాజనిత ప్రవర్తన కోసం కొంచెం ముడి ఖచ్చితత్వాన్ని వర్తకం చేస్తుంది. చాలా డొమైన్లలో, అది బేరం.
మీ PPT రంగురంగుల హీట్మ్యాప్ను చూపిస్తే మరియు దానిని ఒక రోజుగా పిలిస్తే, ఉత్పత్తిలో ఒక సిస్టమ్ను ఎలా అమలు చేయకూడదో మీరు ఖచ్చితంగా నేర్చుకున్నారు.
పెద్ద భాషా నమూనాలు మరియు నిర్ణయ మిరేజ్
అవును, LLMలు నిర్ణయించగలవు—లేదా కనీసం అవి వింతైన స్పష్టతతో నిర్ణయాలను ప్రతిపాదించగలవు. అవి ఎంపిక స్థలాలను స్కెచ్ చేయడానికి, ట్రేడ్-ఆఫ్లను జాబితా చేయడానికి, ప్రణాళికా లూప్ చుట్టూ నిర్మాణాన్ని వ్రాయడానికి కూడా గొప్పవి. కానీ ఆకర్షణీయమైన భాగం చాలా చెడ్డ భాగం: అవి కల్పించినప్పుడు కూడా అవి నమ్మకంగా అనిపిస్తాయి.
సురక్షితమైన నమూనా "మోడల్ నిర్ణయించనివ్వండి" కాదు. ఇది: మోడల్ సూచించనివ్వండి, నియమాలతో పరిమితం చేయండి, ప్లానర్ లేదా ఆప్టిమైజర్తో ధృవీకరించండి మరియు ప్రతి దశను లాగ్ చేయండి. LLMలను చక్రం వద్ద కాకుండా లూప్లో ఉంచండి. మీరు మీ కారును ఆటోకరెక్ట్ను డ్రైవ్ చేయడానికి అనుమతించరు.
స్లయిడ్ల నుండి సిస్టమ్లకు: ఉత్పత్తిలో నిజంగా ఏమి పని చేస్తుంది
AIలో క్రియాత్మక నిర్ణయం తీసుకునే వ్యవస్థ స్లైడ్లా కనిపించదు. ఇది ఇలా కనిపిస్తుంది:
- వాస్తవికతను ప్రతిబింబించే స్పష్టమైన లక్ష్యం, ఆశ కాదు.
- పరిమితులు కఠినంగా ఉండవలసిన చోట కఠినంగా ఉంటాయి, మృదువుగా ఉండగలిగే చోట మృదువుగా ఉంటాయి.
- దాని స్వంత తప్పిపోయిన భాగాలను అంగీకరించే డేటా పైప్లైన్.
- పద్ధతులను మిళితం చేసే నిర్ణయ ఇంజిన్: నేర్చుకున్న అవగాహన, సంభావ్య అనుమితి మరియు “నాకు ఖచ్చితంగా తెలియదు” అని చెప్పగల పాలసీ.
- పరిశీలనా సామర్థ్యం: ట్రేసింగ్, వివరణలు మరియు రోల్బ్యాక్.
- ఓవర్రైడ్ చేయడానికి అధికారం కలిగిన మానవ పర్యవేక్షణ.
ఆ చివరి భాగం కొన్ని సర్కిల్లలో అసభ్యంగా పరిగణించబడుతుంది. “AI స్వయంప్రతిపత్తి కలిగి ఉండాలి.” బహుశా. లేదా వృత్తిపరమైన వినయం ప్రెస్-రిలీజ్ మ్యాచిస్మోను ఓడిస్తుంది.
తప్పనిసరిగా వచ్చే “సాధనాలు” ప్రశ్న
మీరు లైబ్రరీలు మరియు సేవల నక్షత్రరాశితో ఈ నిర్ణయ స్టాక్ను సమీకరించవచ్చు. చాలా మంచివి. తక్కువ స్థిరంగా ఉంటాయి. ఉత్తమ సెటప్లు ఘర్షణను తగ్గిస్తాయి—ప్రాంప్ట్లను రచించడం, అవుట్పుట్లను తనిఖీ చేయడం, తార్కికాన్ని చైన్ చేయడం, అంచు కేసులను పరీక్షించడం—మరియు అవి ముఖ్యమైన చోట గార్డ్రైల్స్ను ఉంచడం సులభం చేస్తాయి.
Sider.AIని ఆచరణాత్మక ఉదాహరణగా పరిగణించండి. ఇది మీకు స్పృహ కలిగిన వ్యక్తిని అమ్మడానికి ప్రయత్నించడం లేదు. ఇది నిజంగా గందరగోళ మధ్యస్థాన్ని పరిష్కరించడంలో సహాయపడే సాధనం: తార్కిక గొలుసులను రూపొందించడం, అల్గారిథమిక్ ఎంపికలను సరిపోల్చడం మరియు LLM సహాయాన్ని అది ఉత్పాదకంగా ఉండే చోట చొప్పించడం, పనితీరును ప్రదర్శించే చోట కాదు. ఇది ఆకర్షణీయం కాని బిట్లలో మంచిది—పునరావృతం, తనిఖీ మరియు “12 మరియు 13 వెర్షన్ల మధ్య ఏమి మారింది?” అనే వాటిలో. ప్రచారం ఉన్న ప్రపంచంలో, “నిజంగా పని చేయడం” ఒక సూపర్పవర్. AI PPT సర్క్యూట్లో నిర్ణయం తీసుకోవడం నుండి సాధారణ అపోహలు
- అపోహ: “ఎక్కువ డేటా మంచి నమూనాలను ఓడిస్తుంది.” కొన్నిసార్లు. తరచుగా ఇది చెడ్డ ఆలోచనను ఓడిస్తుంది. నిరాడంబరమైన డేటాతో స్పష్టమైన లక్ష్యం తప్పు కొలమానం వద్ద గురిపెట్టిన అగ్నిమాపక గొట్టం కంటే మెరుగ్గా పని చేస్తుంది.
- అపోహ: “బ్లాక్ బాక్స్ అనివార్యం.” కాదు. ఇది కొన్నిసార్లు సౌకర్యవంతంగా ఉంటుంది. మీరు అపారదర్శక కోర్ల చుట్టూ వివరించదగిన పొరలను నిర్మించవచ్చు. మీరు శ్రద్ధ వహించాలి అంతే.
- అపోహ: “అన్వేషణ ప్రమాదకరం.” ఖచ్చితంగా—మరియు స్తబ్దత కూడా. బాండిట్లు కారణం లేకుండా ఉనికిలో లేరు.
- అపోహ: “స్వయంప్రతిపత్తి లక్ష్యం.” స్వయంప్రతిపత్తి ఒక సాధనం. విశ్వసనీయత లక్ష్యం.
కేస్లెట్లు: రబ్బరు రోడ్డును కలిసే చోట
- లాజిస్టిక్స్ రూటింగ్: సాధ్యత కోసం A*, ధర కోసం MILP, చివరి-మైలు గందరగోళం కోసం హ్యూరిస్టిక్స్. అనిశ్చితితో డిమాండ్ అంచనాను చల్లుకోండి మరియు మీకు బలమైన వ్యవస్థ వస్తుంది. లేదు, నగరం ఒక వంతెనను మూసివేసినప్పుడు వారం రెండులో ఒకే ఎండ్-టు-ఎండ్ డీప్ నెట్ మెరుగ్గా చేయదు.
- వైద్య ట్రియేజ్: కఠినమైన భద్రత కోసం నియమాలు, రిస్క్ స్కోరింగ్ కోసం సంభావ్య నమూనాలు, అవుట్లైయర్ల కోసం మానవ-ఇన్-ది-లూప్. సిస్టమ్ యొక్క ధర్మం వేగం కాదు; ఎప్పుడు నెమ్మదిగా నడవాలో తెలుసుకోవడమే దాని గొప్పతనం.
- కంటెంట్ మోడరేషన్: ట్రియేజ్ కోసం వర్గీకరణకర్త, చట్టపరమైన పరిమితుల కోసం పాలసీ నియమాలు, మానవులకు విజ్ఞప్తులు. మీరు దీన్ని "పరిష్కరించరు", మీరు దీన్ని నిర్వహిస్తారు—ఒక పక్కకు పెరిగే పచ్చికను కత్తిరించినట్లుగా.
నిర్ణయ వ్యవస్థను ఎలా అంచనా వేయాలి (స్లైడ్ డెక్ కాదు)
మూడు ప్రశ్నలు అడగండి:
- మీరు ఖచ్చితంగా ఏమి ఆప్టిమైజ్ చేస్తున్నారు? సమాధానం ఒకటి కంటే ఎక్కువ వాక్యం లేదా ఒకటి కంటే తక్కువ వాక్యం తీసుకుంటే, చింతించండి.
- ప్రపంచం మారినప్పుడు ఏమి జరుగుతుంది? సమాధానం “పునర్ శిక్షణ” అయితే, వారు డ్రిఫ్ట్ గురించి ఆలోచించలేదు.
- మీరు తప్పు అని మీకు ఎలా తెలుస్తుంది? సమాధానం నిశ్శబ్దంగా ఉంటే, దూరంగా నడవండి.
మీ స్వంత లోతైన డైవ్ను నిర్మించడం: ఆచరణాత్మక అవుట్లైన్
మీరు మీ స్వంత PPTని సమీకరిస్తుంటే—ఎందుకంటే మనమందరం చివరికి దోషులమే—నిజాయితీ చుట్టూ నిర్మించండి:
- నిర్ణయ లూప్తో మరియు మీ లక్ష్య ఫంక్షన్తో ప్రారంభించండి. ఒక స్లైడ్, సాధారణ వచనం.
- "నేర్చుకోవడం" నుండి "నిర్ణయించడం" వేరు చేయండి. రెండు స్లైడ్లు, ఉదాహరణలు మాత్రమే.
- మీ పరిమితులను మరియు అవి ఎందుకు కఠినంగా ఉన్నాయో చూపించండి. ఒక స్లైడ్, ఉపలక్షణాలు లేవు.
- అవగాహన, అనుమితి, ప్రణాళిక కోసం అల్గారిథమ్లను ఎంచుకోండి. ప్రతిదానికి, వైఫల్య మోడ్లను జాబితా చేయండి.
- పర్యవేక్షణను వివరించండి: డ్రిఫ్ట్, ఓవర్రైడ్లు, సంఘటన ప్లేబుక్లు.
- పరిష్కరించని నష్టాలతో ముగించండి. మీకు ఏమీ లేకపోతే, మీరు పూర్తి చేయలేదు.
“నాకు తెలియదు” అని చెప్పే నిశ్శబ్ద శక్తి
AI సిస్టమ్లు విరమించుకోగలగాలి. దానిని అనిశ్చితి-గుర్తించే నిర్ణయం తీసుకోవడం, ఎంపిక చేసిన అంచనా, ఏదైనా అనవచ్చు. "వద్దు" అని చెప్పగలగడం అనేది ఒక సాధనానికీ మరియు బాధ్యతకీ మధ్య ఉన్న తేడా. మానవులు దీనిని సహజంగా చేస్తారు. మనం చేయలేని అనేక సిస్టమ్లను నిర్మించాము.
ఇది మనలను ఎక్కడ వదిలివేస్తుంది
కృత్రిమ మేధస్సులో నిర్ణయం తీసుకోవడం అనేది మాయాజాలం కాదు, మరియు అల్గారిథమ్లలోకి లోతైన డైవ్ కొత్త మతం కోసం పిచ్ డెక్ లాగా ఉండకూడదు. ఇది ఇంజనీరింగ్ - జాగ్రత్తగా లక్ష్యాలు, స్పష్టమైన పరిమితులు, నిష్కపటమైన అనిశ్చితి మరియు విశ్వసనీయత కోసం సొగసును మార్చుకోవడానికి సుముఖత. తదుపరిసారి PPT సిస్టమ్ "నిర్ణయించడం నేర్చుకుంది" అని మీకు చెబితే, వంతెన తెగిపోయినప్పుడు, కొలమానం తప్పుగా ఉన్నప్పుడు లేదా వినియోగదారు ఎవరూ ఊహించనిది చేసినప్పుడు ఏమి జరుగుతుందో అడగండి.
సమాధానం పెద్ద బాణం అయితే, మీకు మీ నిర్ణయం ఉంది.
కీవర్డ్-అవేర్ అనుబంధం (కీవర్డ్ స్టఫింగ్ లేకుండా)
- కృత్రిమ మేధస్సులో నిర్ణయం తీసుకోవడం: స్పష్టమైన లక్ష్యాలు మరియు పరిమితులను ఉపయోగించి అనిశ్చితిలో చర్యలను ఎంచుకునే అభ్యాసం.
- అల్గారిథమ్లలోకి లోతైన డైవ్: ఒక రూపకం కాదు - శోధన, ఆప్టిమైజేషన్, సంభావ్య అనుమితి, రీన్ఫోర్స్మెంట్ లెర్నింగ్, ప్రణాళిక, కారణ నమూనా, సంకరాలు.
- ఆచరణాత్మక టేకావే: పద్ధతులను కలపండి, పరిమితులను కఠినతరం చేయండి, అనిశ్చితిని స్వీకరించండి, ప్రతిదాన్నీ పర్యవేక్షించండి మరియు ఒక స్లైడ్ ఒక సిస్టమ్ అని నటించే కోరికను ప్రతిఘటించండి.
FAQ
Q1: కృత్రిమ మేధస్సులో నిర్ణయం తీసుకోవడం అంటే ఏమిటి, నిజంగా?
ఇది స్పష్టమైన లక్ష్యం మరియు పరిమితులతో అనిశ్చితిలో చర్యలను ఎంచుకోవడం - వైబ్స్ కాదు. ఆసక్తికరమైన భాగం మోడల్ కాదు; ప్రపంచం శిక్షణ సెట్కు సరిపోవడానికి నిరాకరించినప్పుడు మోడల్, డేటా మరియు గార్డ్రెయిల్లు కలిసి ఎలా పనిచేస్తాయనేది.
Q2: AI నిర్ణయం తీసుకోవడంలోకి లోతైన డైవ్ కోసం ఏ అల్గారిథమ్లు ముఖ్యమైనవి?
శోధన, ఆప్టిమైజేషన్, సంభావ్య తార్కికం, రీన్ఫోర్స్మెంట్ లెర్నింగ్, ప్రణాళిక మరియు కారణ నమూనాలు వెన్నెముక. నేర్చుకున్న అవగాహనను సింబాలిక్ నియమాలతో కలిపే సంకర వ్యవస్థలు నిజంగా ఉత్పత్తిలో మనుగడ సాగిస్తాయి.
Q3: పెద్ద భాషా నమూనాలు నిర్ణయం తీసుకోవడానికి మంచివా?
ఎంపికలను ప్రతిపాదించడానికి మరియు ప్రణాళికలను రూపొందించడానికి అవి చాలా గొప్పవి, తనిఖీ చేయని నిర్ణేతలుగా భయంకరమైనవి. LLMలను లూప్లో ఉపయోగించండి: సూచించండి, పరిమితం చేయండి, ధృవీకరించండి - ఆపై ప్రతి దశను న్యాయవాదికి వివరించాల్సిన అవసరం ఉన్నట్లుగా లాగ్ చేయండి.
Q4: కృత్రిమ మేధస్సులో నిర్ణయం తీసుకోవడంలో అతి పెద్ద పొరపాట్లను నేను ఎలా నివారించగలను?
నేర్చుకోవడం నుండి నిర్ణయించడం వేరు చేయండి, లక్ష్యాన్ని నిర్వచించండి మరియు పరిమితులను పేర్కొనండి. వైఫల్య రీతులను మరియు పర్యవేక్షణను చూపండి - మీ డెక్ అంతా బాణాలు మరియు ట్రేడ్-ఆఫ్లు లేకపోతే, అది ఇంజనీరింగ్ కాదు థియేటర్.
Q5: Sider.AI AI నిర్ణయ వర్క్ఫ్లోలలో ఎక్కడ సరిపోతుంది?
Sider.AI గందరగోళ మధ్యలో సహాయపడుతుంది - రచించడం, పోల్చడం మరియు తార్కిక వర్క్ఫ్లోలను తనిఖీ చేయడం - కాబట్టి మీరు LLM సహాయాన్ని మార్కెటింగ్ కోరుకునే చోట కాకుండా, ఎక్కడ పని చేస్తుందో అక్కడ ఉంచవచ్చు. ఆచరణాత్మక పునరుక్తి గురించి ఆలోచించండి, మాయా దండం గురించి కాదు.