ส่วนที่ PPT พยายามทำให้ AI ดูง่าย
สิ่งที่เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์คือ ทุกคนแสร้งทำเป็นเข้าใจมัน จนกว่ามันจะทำการตัดสินใจที่ยอดเยี่ยมหรือล้มเหลวอย่างเห็นได้ชัด จากนั้นทันใดนั้นมันก็กลายเป็น "ซับซ้อนเกินไป" หรือ "กล่องดำ" ราวกับว่าคณิตศาสตร์ลื่นล้มบนเปลือกกล้วย หากคุณเคยนั่งดู PPT เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ คุณจะรู้ว่ามันเป็นอย่างไร: ลูกศรขนาดใหญ่ แผนผังลำดับงาน และภาพตัดปะที่บ่งบอกถึงสิ่งที่หลีกเลี่ยงไม่ได้ มันไม่ได้หลีกเลี่ยงไม่ได้ มันคือตัวเลือกตลอดทาง
นี่คือการเจาะลึกอัลกอริทึม ซึ่งเป็นอัลกอริทึมที่แท้จริง ที่ใช้สำหรับการตัดสินใจของ AI ไม่ใช่สไลด์ที่มีลูกศรเป็นกล่อง เป้าหมายคือการตัดผ่านละครเรื่อง "AI จะตัดสินใจให้เรา" และพูดคุยเกี่ยวกับวิธีการที่ระบบเหล่านี้เลือกจริงๆ สปอยล์: พวกมันไม่เหมือนผู้ทำนายที่รอบรู้ แต่เหมือนนักให้เหตุผลที่รวดเร็วและตรงไปตรงมาที่ไม่เคยต้องนั่งอยู่ในการจราจรหรือเจรจาเวลานอนของเด็กเล็ก
สิ่งที่เราหมายถึงโดย "การตัดสินใจใน AI" (และสิ่งที่ PPT ไม่ค่อยยอมรับ)
"การตัดสินใจในปัญญาประดิษฐ์" ฟังดูสูงส่ง แต่ในทางปฏิบัติมันคือชุดของเทคนิค: การให้เหตุผลตามกฎ การค้นหา การเพิ่มประสิทธิภาพ การอนุมานเชิงน่าจะเป็น การเรียนรู้แบบเสริมกำลัง การวางแผน และระบบไฮบริดที่เย็บรวมความยุ่งเหยิงทั้งหมดเข้าด้วยกัน อัลกอริทึมไม่ได้ "ต้องการ" อะไร พวกเขาปรับฟังก์ชันเฉพาะให้เหมาะสมภายใต้ข้อจำกัดเฉพาะ สลับฟังก์ชันหรือข้อจำกัด แล้วคุณจะได้ "สติปัญญา" ที่แตกต่างออกไป หากฟังดูชัดเจน ขอแสดงความยินดี คุณนำหน้าสไลด์ครึ่งหนึ่งบน SlideShare
ปัญหาที่แท้จริงของ PPT ส่วนใหญ่เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ไม่ใช่ว่าพวกเขาง่ายเกินไป แต่เป็นเพราะพวกเขาง่ายเกินไปในทิศทางที่ผิด พวกเขาบอกเป็นนัยว่าโมเดลตัดสินใจเพราะพวกเขา "เรียนรู้" การเรียนรู้ไม่ใช่การตัดสินใจ การเรียนรู้ทำให้คุณมีนโยบายหรือโมเดล การตัดสินใจคือการใช้นโยบายนั้นในบริบทที่ไม่เหมือนกับข้อมูลการฝึกอบรม ความแตกต่างระหว่างการจำการเปิดหมากรุกและการเอาชีวิตรอดจากความวุ่นวายในเกมกลาง อย่างแรกดูดีในรูปแบบ bullet point อย่างหลังคือสิ่งที่ชนะ
เครื่องมือที่แท้จริง: จากกฎสู่รางวัล
มาเดินตามสแต็ก ตั้งแต่สิ่งที่ฟังดูแปลกตา (แต่ยังคงมีความสำคัญ) ไปจนถึงเทคนิคที่ขับเคลื่อนระบบสมัยใหม่ พูดอย่างตรงไปตรงมา ไม่มีเรื่องโรแมนติก
ระบบที่ใช้กฎ: ยังไม่ตาย แค่ซื่อสัตย์
กฎเป็นเรื่องน่าอายสำหรับผู้ที่ทำงานด้าน AI บางคน เหมือนกับการใส่ถุงเท้ากับรองเท้าแตะ แต่การตัดสินใจตามกฎมีข้อได้เปรียบอย่างมาก: ความโปร่งใส หาก PPT เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ข้ามกฎเป็น "มรดก" แสดงว่ากำลังซ่อนเรื่องราวครึ่งหนึ่ง ระบบผู้เชี่ยวชาญเข้ารหัสความรู้ในโดเมนเป็นข้อความ if–then พวกมันเปราะ ใช่ แต่สามารถตรวจสอบได้ เมื่อคุณต้องการ determinism และ traceability เช่น การตรวจสอบการปฏิบัติตามข้อกำหนด โปรโตคอลการคัดกรองทางการแพทย์ กฎไม่ได้แค่ยังคงใช้งานได้ พวกมันทำงานได้ดีกว่า
- ข้อดี: deterministic, อธิบายได้, แก้จุดบกพร่องได้ง่าย
- ข้อเสีย: เปราะ, ปรับขนาดได้ยากในโดเมนที่ยุ่งเหยิง
คุณจะรู้ว่าระบบกฎล้มเหลวเมื่อใด เพราะมันจะบอกคุณ ระบบสมัยใหม่ส่วนใหญ่ล้มเหลวอย่างเงียบๆ
การค้นหาและการเพิ่มประสิทธิภาพ: การตัดสินใจเป็นการนำทาง
ก่อนที่เราจะฝึกอบรมทุกอย่างบนข้อมูลจำนวนมหาศาล เราได้ค้นหา Breadth-first search, depth-first search, A*, beam search มันไม่น่าดึงดูด แต่เมื่อใดก็ตามที่คุณกำลังแก้ปัญหา pathfinding ไม่ว่าจะตามตัวอักษรหรือโดยนัย การค้นหาคือกระดูกสันหลัง A* ที่มี heuristic ที่ดีจะเอาชนะโมเดล "ฉลาด" ที่มีวัตถุประสงค์ที่โง่เขลา
การเพิ่มประสิทธิภาพสรุปสิ่งนี้: คุณตั้งฟังก์ชันวัตถุประสงค์และข้อจำกัด จากนั้นผลักดันไปสู่โซลูชันที่ดีที่สุดที่คุณสามารถจ่ายได้ด้วยการคำนวณที่คุณมี Linear programming, mixed-integer programming, evolutionary algorithms ซึ่งเป็น alphabet soup ของการเปลี่ยนจาก "เกือบดี" เป็น "ดีพอ" ภายใต้กำหนดเวลา
- ข้อดี: การันตีที่พิสูจน์ได้, การแลกเปลี่ยนที่ควบคุมได้
- ข้อเสีย: การสร้างแบบจำลองเป็นเรื่องยาก วัตถุประสงค์อาจถูกระบุผิดในรูปแบบที่ละเอียดอ่อนและร้ายแรง
เมื่อโมเดลทำสิ่งที่แปลกๆ บ่อยครั้งเป็นเพราะคุณได้สิ่งที่คุณขอมาทุกประการ แค่ไม่ใช่สิ่งที่คุณตั้งใจ
การให้เหตุผลเชิงน่าจะเป็น: ความไม่แน่นอนคือคุณสมบัติ
Bayesian networks, hidden Markov models, Kalman filters: คลาสสิก แทนที่จะแสร้งทำเป็นว่าโลกแน่นอน วิธีการเหล่านี้จะเก็บบันทึกความไม่แน่นอนและเลือกการกระทำที่ป้องกันความเสี่ยงจากมัน กล่าวอีกนัยหนึ่งคือ ความสมจริง
- ข้อดี: มีหลักการภายใต้ความไม่แน่นอน โครงสร้างที่ตีความได้
- ข้อเสีย: การปรับขนาดให้เข้ากับความยุ่งเหยิงที่มีมิติสูงเป็นเรื่องเจ็บปวด ข้อสันนิษฐานกัดกิน
วิธีการเชิงน่าจะเป็นคือสิ่งที่สไลด์ PPT ส่วนใหญ่เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ชี้นำด้วย "คะแนนความเชื่อมั่น" ความเชื่อมั่นไม่ใช่ความน่าจะเป็น ความน่าจะเป็นคือคณิตศาสตร์ที่มีใบเสร็จ
การเรียนรู้แบบเสริมกำลัง: รางวัลสร้างกฎ
การเรียนรู้แบบเสริมกำลัง เช่น Q-learning, policy gradients, actor-critic variants กำหนดการตัดสินใจเป็นการลองผิดลองถูกด้วยกระดานคะแนน คุณเลือกการกระทำ สภาพแวดล้อมจะมอบรางวัลให้คุณ และคุณจะผลักดันนโยบายของคุณไปสู่การกระทำที่ให้ผลตอบแทนเมื่อเวลาผ่านไป นี่คือที่ที่ AI "ตัดสินใจ" อย่างแท้จริง ในแง่ที่ว่ามันเล่นเกม เกมที่คุณออกแบบ ไม่ว่าคุณจะรู้ตัวหรือไม่ก็ตาม
- ข้อดี: แข็งแกร่งสำหรับงานตัดสินใจตามลำดับ เรียนรู้กลยุทธ์ที่คุณไม่ได้เขียนโค้ดอย่างชัดเจน
- ข้อเสีย: การแฮ็กรางวัล ความไม่มีประสิทธิภาพของตัวอย่าง การสรุปผลที่เปราะบางเมื่อโลกเปลี่ยนแปลงแม้เพียงเล็กน้อย
ผู้คนชอบอ้างว่าการเรียนรู้แบบเสริมกำลัง "เหมือนกับวิธีที่มนุษย์เรียนรู้" ไม่จริง มนุษย์มีความรู้เดิม ร่างกาย ความเบื่อ และสามัญสำนึก เอเจนต์ RL มีฟังก์ชันรางวัลและความอดทนอย่างไม่สิ้นสุดในการลองเรื่องไร้สาระจนกว่ามันจะได้ผล
การวางแผนและ POMDPs: โลกมองเห็นได้ครึ่งเดียว
การตัดสินใจในโลกแห่งความเป็นจริงแทบจะไม่มาพร้อมกับข้อมูลที่สมบูรณ์ Partially Observable Markov Decision Processes (POMDPs) สร้างแบบจำลองความไม่แน่นอนนั้นอย่างชัดเจน: คุณไม่รู้สถานะ รู้เพียงการสังเกตที่บอกใบ้ถึงมัน การวางแผนภายใต้การสังเกตบางส่วนบังคับให้คุณรักษาสถานะความเชื่อ ซึ่งเป็นคำที่ดูดีสำหรับ "สิ่งที่เราคิดว่ากำลังเกิดขึ้น โดยพิจารณาจากสิ่งที่เราได้เห็น"
- ข้อดี: ซื่อสัตย์เกี่ยวกับความไม่แน่นอน รากฐานที่เป็นทางการสำหรับการกระทำที่สมเหตุสมผล
- ข้อเสีย: โหดร้ายในการคำนวณ การประมาณเป็นสิ่งที่หลีกเลี่ยงไม่ได้
หาก PPT เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ของคุณไม่ได้กระซิบคำว่า "POMDP" อย่างน้อยที่สุด แสดงว่ากำลังปฏิบัติต่อความเป็นจริงเหมือนเป็นการตั้งค่าเสริม
ระบบไฮบริดและการผสมผสาน Neuro-Symbolic
Neural networks มองเห็นและติดป้ายกำกับ ระบบสัญลักษณ์อธิบายและจำกัด รวบรวมเข้าด้วยกันแล้วคุณจะได้สิ่งที่ใช้ได้จริง Vision model สำหรับการรับรู้ กฎสำหรับความปลอดภัย Language model สำหรับการกระทำที่เป็นไปได้ Planner สำหรับความเป็นไปได้จริง ไฮบริดเหล่านี้ไม่ได้เป็นแค่เทรนด์ พวกมันสะท้อนถึงความอ่อนน้อมถ่อมตนทางวิศวกรรม: ใช้โมเดลที่เรียนรู้มาเมื่อการรับรู้เป็นเรื่องยาก ใช้ตรรกะที่ชัดเจนเมื่อเดิมพันสูง
- ข้อดี: ใช้งานได้จริง, ควบคุมได้, ดีที่สุดของทั้งสอง
- ข้อเสีย: ปวดหัวกับการรวม, อินเทอร์เฟซที่เปราะ, ความซับซ้อนที่ซ้ำซ้อน
Decision Loop: OODA สำหรับเครื่องจักร โดยมีตัวย่อที่น้อยกว่า
ระบบตัดสินใจ AI ส่วนใหญ่ทำงานเป็นวงจร: สังเกต อนุมาน วางแผน ปฏิบัติ ทำซ้ำ สไลด์ชอบวงกลมและลูกศร สิ่งที่สำคัญคือความตึงเครียด แต่ละขั้นตอนประนีประนอม สังเกต (แต่ไม่ใช่ทุกอย่าง) อนุมาน (แต่รักษาความไม่แน่นอนของคุณ) วางแผน (แต่ภายใต้เวลา) ปฏิบัติ (แต่อย่าเผาโลก)
- Perception to Symbols: จากข้อมูลดิบสู่คุณสมบัติ สูญเสียข้อมูล หวังว่าจะเป็นข้อมูลที่ถูกต้อง
- Prediction to Belief: จากคุณสมบัติสู่การกระจายว่าเกิดอะไรขึ้นจริง
- Policy to Plan: จากความเชื่อปัจจุบันไปสู่ลำดับการกระทำ โดยมีขอบเขตจำกัดโดยการคำนวณและความอยากรับความเสี่ยง
- Action to Feedback: ปฏิบัติ วัดผลลัพธ์ อัปเดตความเชื่อและพารามิเตอร์ หากวงจรของคุณไม่ดีขึ้นตามประสบการณ์ มันคือระบบอัตโนมัติ ไม่ใช่ AI
ความผิดพลาดที่ใหญ่ที่สุดใน PPT เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์คือการแสร้งทำเป็นว่าวงจรนั้นสะอาด ในการผลิต เซ็นเซอร์จะเลื่อน มนุษย์จะเข้าไปยุ่ง และเมตริกจะต่อสู้กัน ระบบที่ยอดเยี่ยมคือระบบที่เสื่อมสภาพอย่างสง่างามเมื่อโลกสั่นคลอน
เจาะลึกอัลกอริทึม (โดยไม่มี Buzzword Sauce)
มาแอบดูอัลกอริทึมที่ผู้คนใช้จริงๆ ว่าพวกเขากำลังแก้อะไร พวกเขาล้มเหลวอย่างไร และพวกเขาโดดเด่นที่ไหน
Multi-Armed Bandits: การสำรวจโดยไม่มีดราม่า
เมื่อคุณต้องการสร้างสมดุลระหว่างการลองสิ่งใหม่ๆ กับการใช้ประโยชน์จากสิ่งที่ได้ผล เช่น การเลือกโฆษณา การปรับแต่งคำแนะนำ การทดลอง UI Multi-armed bandits จะเอาชนะการทดสอบ A/B เพื่อความเร็ว Thompson sampling เป็นที่ชื่นชอบในทางปฏิบัติ: Bayesian, simple, effective มันไม่ได้แสร้งทำเป็นว่าเป็นเอเจนต์ RL เต็มรูปแบบ มันดีกว่าสำหรับมัน
- ใช้สำหรับ: การตัดสินใจออนไลน์อย่างรวดเร็วพร้อมข้อเสนอแนะ
- อย่าใช้สำหรับ: กลยุทธ์ระยะยาว การพึ่งพาที่ซับซ้อน สิ่งที่สำคัญต่อความปลอดภัย
Monte Carlo Tree Search: เล่น Foresight ในงบประมาณ
MCTS สุ่มตัวอย่างอนาคต ไม่ใช่ทั้งหมด แค่เพียงพอของอนาคตที่เป็นไปได้ มันเทียบเท่ากับอัลกอริทึมของ "มาคิดเรื่องนี้ให้ดี แต่ไม่ใช่ทั้งบ่าย" ในเกมและการวางแผนที่มีโครงสร้าง มันชนะ ในความยุ่งเหยิงแบบเปิด มันจินตนาการถึงโครงสร้างที่ไม่มีอยู่จริง
- เหมาะสำหรับ: พื้นที่การตัดสินใจที่มีขอบเขตและสร้างแบบจำลองได้ดี (เกม, การวางแผนที่มีข้อจำกัด)
- ไม่ดีสำหรับ: ความโกลาหลที่ไม่ได้สร้างแบบจำลอง (มนุษย์, ตลาด, Twitter)
Dynamic Programming: Optimal With a Catch
Bellman equations, value iteration, policy iteration อัญมณีล้ำค่าของทฤษฎีการควบคุม ด้วยมงกุฎที่ทำจากการเติบโตแบบทวีคูณ หากพื้นที่สถานะระเบิด ความหวังของคุณก็จะระเบิดเช่นกัน
- เหมาะสำหรับ: โลก Markovian ขนาดเล็กถึงขนาดกลางที่มีพลวัตที่รู้จัก
- ไม่ดีสำหรับ: ทุกสิ่งทุกอย่าง เว้นแต่คุณจะประมาณ (ซึ่งหมายความว่าเสมอ)
Heuristics and Metaheuristics: The Unpretentious Workhorses
Simulated annealing, tabu search, genetic algorithms สิ่งเหล่านี้ได้รับการยกย่องว่า "ลองทำหลายๆ อย่าง เก็บสิ่งที่ดีที่สุด ทำต่อไป" นั่นไม่ใช่การดูถูก การตัดสินใจที่แท้จริงส่วนใหญ่ดูเหมือนสิ่งนี้ในวงกว้าง เพราะความเป็นจริงจะไม่ปล่อยให้คุณนั่งและแก้สมการที่แน่นอนในขณะที่เวลาหมดลง
- เหมาะสำหรับ: ปัญหา combinatorial ที่ยาก ซึ่ง optimal เป็นเรื่องเพ้อฝัน
- ไม่ดีสำหรับ: โดเมนที่การรับประกันมีความสำคัญมากกว่าความเร็ว
Causal Models: เพราะ Correlation เป็น Con Artist
Causal decision-making ใช่ Pearl, graphs, interventions ช่วยให้คุณถามได้ว่า "จะเกิดอะไรขึ้นถ้าเราเปลี่ยนบางสิ่งบางอย่างจริงๆ" แทนที่จะเป็น "เกิดอะไรขึ้นเมื่อครั้งที่แล้ว" หาก PPT เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ของคุณไม่ได้ระบุ causal inference แต่ผลิตภัณฑ์ของคุณทำการเลือกที่มีผลกระทบต่อผู้คน คุณกำลังสร้างเครื่องมือแนะนำสำหรับความเสียใจ
- เหมาะสำหรับ: นโยบาย, การแพทย์, การเปลี่ยนแปลงผลิตภัณฑ์ที่มีผลกระทบอันดับสอง
- ไม่ดีสำหรับ: งาน predictive อย่างหมดจดที่ counterfactuals ไม่มีความสำคัญ
The Two Hard Problems: Objectives and Constraints
การโกหกครั้งแรกในการตัดสินใจของ AI คือเรากำลังเพิ่มประสิทธิภาพ "ประสิทธิภาพ" เพิ่มประสิทธิภาพอะไรกันแน่ คลิก? เวลาทำงาน? รายได้? ความปลอดภัย? ความเป็นธรรม? เวลาแฝง? หากคุณไม่ได้สะกดมันออกมา คุณจะไม่มีระบบ คุณมีความปรารถนา ฟังก์ชันวัตถุประสงค์คือผลิตภัณฑ์ ปฏิบัติต่อมันเหมือน boilerplate ทางกฎหมาย แล้วมันจะกัดเหมือน boilerplate ทางกฎหมาย
- Multi-objective trade-offs ไม่ใช่ข้อบกพร่อง พวกมันคืองาน ชั่งน้ำหนักพวกมันอย่างชัดเจน วัดความเจ็บปวดอย่างซื่อสัตย์ และอย่าแสร้งทำเป็นว่า Pareto fronts เป็นเข็มทิศทางศีลธรรม
- ข้อจำกัดไม่ใช่ความคิดที่ตามมา พวกเขาคือวิธีที่คุณจำกัดอันตราย ข้อจำกัดที่ยาก (ไม่ ไม่เกิน X จริงๆ) แตกต่างจากบทลงโทษที่อ่อน (โปรดอย่าเกิน X เว้นแต่ว่ามันจะทำกำไร) เขียนพวกมันลงไปเหมือนว่าคุณตั้งใจ
การหลอกตัวเองที่ชื่นชอบของอุตสาหกรรมคือการคิดว่าข้อมูลที่มากขึ้นแก้ไขวัตถุประสงค์ที่ไม่ดี มันไม่ได้ผล มันทำให้สิ่งที่ผิดมีประสิทธิภาพมาก
Explainability ไม่ใช่ทางเลือก มันคือบริบท
การผลักดันให้ AI ที่อธิบายได้มักถูกมองว่าเป็นความรำคาญในการปฏิบัติตามข้อกำหนด นั่นมันผิด “Explainability” คือวิธีที่คุณสร้างความไว้วางใจกับผู้คนที่พึ่งพาการตัดสินใจ แม้ว่าพวกเขาจะเป็นวิศวกร คุณต้องรู้ว่าทำไมโมเดลถึงบอกว่า "เลี้ยวซ้าย" ไม่ใช่เพื่อเอาใจผู้ควบคุม แต่เพื่อแก้ไขข้อผิดพลาดก่อนที่มันจะเกิดขึ้นอีก
- Post-hoc explanations (saliency maps, SHAP) ดีกว่าไม่มีอะไรเลย แต่พวกมันคือลิปสติก ลิปสติกที่มีประโยชน์ บนหมูที่อาจเป็นม้าแข่ง
- Built-in interpretability (monotonic models, generalized additive models, rules with learned thresholds) แลกเปลี่ยนความแม่นยำดิบบางส่วนเพื่อพฤติกรรมที่คาดการณ์ได้ ในหลายโดเมน นั่นคือการต่อรองราคา
หาก PPT เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ของคุณแสดง heatmap ที่มีสีสันและเรียกมันว่าวัน คุณได้เรียนรู้อย่างถูกต้องว่าไม่ควรใช้งานระบบในการผลิตอย่างไร
Large Language Models และ Decision Mirage
ใช่ LLMs สามารถตัดสินใจได้ หรืออย่างน้อยพวกเขาสามารถเสนอการตัดสินใจด้วยความคล่องแคล่วที่น่าทึ่ง พวกเขาเก่งในการร่างพื้นที่ตัวเลือก การแสดงรายการ trade-offs แม้แต่การเขียน scaffolding รอบๆ วงจรการวางแผน แต่ส่วนที่น่าดึงดูดใจคือส่วนที่แย่ที่สุด: พวกเขาฟังดูมั่นใจแม้ในขณะที่พวกเขากำลังแต่งเรื่อง
รูปแบบที่ปลอดภัยไม่ใช่ "ปล่อยให้โมเดลตัดสินใจ" มันคือ: ปล่อยให้โมเดลแนะนำ จำกัดด้วยกฎ ตรวจสอบความถูกต้องด้วย planner หรือ optimizer และบันทึกทุกขั้นตอน ใส่ LLMs ไว้ในวงจร ไม่ใช่ที่พวงมาลัย คุณจะไม่ปล่อยให้ autocorrect ขับรถของคุณ
From Slides to Systems: What Actually Works in Production
ระบบการตัดสินใจที่ใช้งานได้ใน AI ไม่ได้มีลักษณะเหมือนสไลด์ มันมีลักษณะเหมือน:
- วัตถุประสงค์ที่ชัดเจนที่สะท้อนความเป็นจริง ไม่ใช่ความหวัง
- ข้อจำกัดที่ยากในที่ที่ต้องเป็น อ่อนในที่ที่สามารถเป็นได้
- Data pipeline ที่ยอมรับชิ้นส่วนที่ขาดหายไปของตัวเอง
- Decision engine ที่ผสมผสานวิธีการ: การรับรู้ที่เรียนรู้มา การอนุมานเชิงน่าจะเป็น และนโยบายที่สามารถพูดว่า "ฉันไม่แน่ใจ"
- Observability: tracing, explanations, และ rollback
- การกำกับดูแลของมนุษย์ที่มีอำนาจในการยกเลิก
ส่วนสุดท้ายนั้นถือว่าน่าอับอายในบางวงการ "AI ควรเป็นอิสระ" อาจจะ หรือบางทีความอ่อนน้อมถ่อมตนแบบมืออาชีพอาจเอาชนะความกล้าหาญในการแถลงข่าว
The Inevitable “Tools” Question
คุณสามารถรวบรวม decision stack นี้ด้วยกลุ่มของไลบรารีและบริการ มีมากมายที่ดี มีน้อยกว่าที่สอดคล้องกัน การตั้งค่าที่ดีที่สุดลดแรงเสียดทาน เช่น การเขียน prompt การตรวจสอบ output การเชื่อมโยงการให้เหตุผล การทดสอบ edge cases และทำให้ง่ายต่อการใส่ guardrails ในที่ที่สำคัญ
พิจารณา Sider.AI เป็นตัวอย่างที่เป็นประโยชน์ มันไม่ได้พยายามขายความเป็น sentient ให้คุณ มันคือเครื่องมือที่ช่วยจัดการกับช่วงกลางที่ยุ่งเหยิง: การร่าง reasoning chains การเปรียบเทียบ algorithmic options และการใส่ LLM assistance ในที่ที่มัน productive แทนที่จะเป็น performative มันเก่งในส่วนที่ไม่น่าดึงดูด เช่น iteration, inspection, และ "มีอะไรเปลี่ยนแปลงระหว่าง version 12 และ 13" ในโลกแห่ง hype "actually works" คือ superpower Common Myths from the Decision Making in AI PPT Circuit
- Myth: “ข้อมูลที่มากขึ้นเอาชนะโมเดลที่ดีกว่า” บางครั้ง บ่อยครั้งมันเอาชนะความคิดที่ไม่ดี วัตถุประสงค์ที่ชัดเจนพร้อมข้อมูลที่ไม่มากนักสามารถเหนือกว่า firehose ที่เล็งไปที่เมตริกที่ผิด
- Myth: “Black box เป็นสิ่งที่หลีกเลี่ยงไม่ได้” ไม่ มันสะดวกในบางครั้ง คุณสามารถสร้าง interpretable layers รอบๆ opaque cores คุณแค่ต้องใส่ใจ
- Myth: “การสำรวจมีความเสี่ยง” แน่นอน และความซบเซาก็เช่นกัน Bandits มีอยู่ด้วยเหตุผล
- Myth: “Autonomy คือเป้าหมาย” Autonomy คือวิธีการ Reliability คือเป้าหมาย
Caselets: Where the Rubber Meets the Road
- Logistics Routing: A* สำหรับความเป็นไปได้ MILP สำหรับต้นทุน heuristics สำหรับความโกลาหลใน last-mile โรยด้วยการคาดการณ์ความต้องการที่มีความไม่แน่นอน แล้วคุณจะได้ระบบที่แข็งแกร่ง ไม่ใช่ว่า deep net แบบ end-to-end เดียวจะทำได้ดีกว่าในสัปดาห์ที่สองเมื่อเมืองปิดสะพาน
- Medical Triage: กฎสำหรับความปลอดภัยที่ยาก โมเดลเชิงน่าจะเป็นสำหรับ risk scoring Human-in-the-loop สำหรับ outliers คุณธรรมของระบบไม่ใช่ความเร็ว มันคือการรู้ว่าเมื่อใดควรชะลอ
- Content Moderation: Classifier สำหรับการคัดกรอง กฎนโยบายสำหรับข้อจำกัดทางกฎหมาย การอุทธรณ์ต่อมนุษย์ คุณจะไม่ "แก้" สิ่งนี้ คุณจะจัดการมัน เหมือนกับการตัดหญ้าที่งอกด้านข้าง
How to Judge a Decision System (Not the Slide Deck)
ถามสามคำถาม:
- คุณกำลังเพิ่มประสิทธิภาพอะไรกันแน่ หากคำตอบใช้เวลามากกว่าหนึ่งประโยคหรือน้อยกว่าหนึ่งประโยค ให้กังวล
- จะเกิดอะไรขึ้นเมื่อโลกเปลี่ยนแปลง หากคำตอบคือ “retrain” พวกเขายังไม่ได้คิดถึง drift
- คุณจะรู้ได้อย่างไรว่าคุณผิด หากคำตอบคือความเงียบ ให้เดินจากไป
Building Your Own Deep Dive: A Practical Outline
หากคุณกำลังรวบรวม PPT เกี่ยวกับการตัดสินใจในปัญญาประดิษฐ์ของคุณเอง เพราะเราทุกคนมีความผิดในที่สุด สร้างมันขึ้นมาด้วยความซื่อสัตย์:
- เริ่มต้นด้วย decision loop และฟังก์ชันวัตถุประสงค์ของคุณ หนึ่งสไลด์ ข้อความธรรมดา
- แยก “learning” ออกจาก “deciding” สองสไลด์ ตัวอย่างเท่านั้น
- แสดงข้อจำกัดของคุณและเหตุผลที่พวกเขายาก หนึ่งสไลด์ ไม่มี euphemisms
- เลือกอัลกอริทึมสำหรับการรับรู้ การอนุมาน การวางแผน สำหรับแต่ละรายการ ให้ระบุ failure modes
- อธิบายการตรวจสอบ: drift, overrides, incident playbooks
- จบลงด้วยความเสี่ยงที่ยังไม่แก้ไข หากคุณไม่มี แสดงว่าคุณยังไม่เสร็จ
The Quiet Power of Saying “I Don’t Know”
ระบบ AI ควรจะสามารถงดออกเสียงได้ เรียกมันว่าการตัดสินใจที่ตระหนักถึงความไม่แน่นอน การคาดการณ์แบบเลือกสรร หรืออะไรก็ตาม ความสามารถในการพูดว่า “ไม่” คือความแตกต่างระหว่างเครื่องมือกับภาระติดพัน มนุษย์ทำสิ่งนี้โดยสัญชาตญาณ เราสร้างระบบที่ไม่สามารถทำได้มากเกินไป
สิ่งนี้ทิ้งเราไว้ที่ไหน
การตัดสินใจในปัญญาประดิษฐ์ไม่ใช่เวทมนตร์ และการเจาะลึกอัลกอริทึมไม่ควรอ่านเหมือนสไลด์นำเสนอสำหรับศาสนาใหม่ มันคืองานวิศวกรรม—วัตถุประสงค์ที่รอบคอบ ข้อจำกัดที่ชัดเจน ความไม่แน่นอนอย่างตรงไปตรงมา และความเต็มใจที่จะแลกความสง่างามกับความน่าเชื่อถือ ครั้งต่อไปที่มี PPT บอกคุณว่าระบบ “เรียนรู้ที่จะตัดสินใจ” ให้ถามว่าเกิดอะไรขึ้นเมื่อสะพานขาด เมตริกผิด หรือผู้ใช้ทำในสิ่งที่ไม่มีใครคาดการณ์
หากคำตอบคือลูกศรที่ใหญ่ขึ้น คุณก็มีการตัดสินใจของคุณแล้ว
ภาคผนวกที่คำนึงถึงคำหลัก (โดยไม่มีการยัดเยียดคำหลัก)
- การตัดสินใจในปัญญาประดิษฐ์: แนวทางการเลือกการกระทำภายใต้ความไม่แน่นอนโดยใช้วัตถุประสงค์และข้อจำกัดที่ชัดเจน
- เจาะลึกอัลกอริทึม: ไม่ใช่คำอุปมา—การค้นหา การเพิ่มประสิทธิภาพ การอนุมานเชิงความน่าจะเป็น การเรียนรู้เสริมกำลัง การวางแผน การสร้างแบบจำลองเชิงสาเหตุ ระบบไฮบริด
- ประเด็นสำคัญเชิงปฏิบัติ: ผสมผสานวิธีการ เสริมความแข็งแกร่งของข้อจำกัด ยอมรับความไม่แน่นอน ติดตั้งเครื่องมือทุกอย่าง และต่อต้านแรงกระตุ้นที่จะแสร้งว่าสไลด์คือระบบ
คำถามที่พบบ่อย
Q1: การตัดสินใจในปัญญาประดิษฐ์คืออะไรกันแน่?
มันคือการเลือกการกระทำภายใต้ความไม่แน่นอนด้วยวัตถุประสงค์และข้อจำกัดที่ชัดเจน—ไม่ใช่ความรู้สึก ส่วนที่น่าสนใจไม่ใช่แบบจำลอง แต่เป็นวิธีที่แบบจำลอง ข้อมูล และมาตรการป้องกันทำงานร่วมกันเมื่อโลกปฏิเสธที่จะตรงกับชุดการฝึกอบรม
Q2: อัลกอริทึมใดบ้างที่สำคัญสำหรับการเจาะลึกการตัดสินใจด้วย AI?
การค้นหา การเพิ่มประสิทธิภาพ การให้เหตุผลเชิงความน่าจะเป็น การเรียนรู้เสริมกำลัง การวางแผน และแบบจำลองเชิงสาเหตุเป็นกระดูกสันหลัง ระบบไฮบริดที่รวมการรับรู้ที่เรียนรู้เข้ากับกฎเชิงสัญลักษณ์คือสิ่งที่อยู่รอดได้จริงในการผลิต
Q3: แบบจำลองภาษาขนาดใหญ่เหมาะสำหรับการตัดสินใจหรือไม่?
พวกมันยอดเยี่ยมในการเสนอตัวเลือกและวางแผนโครงร่าง แต่แย่ในฐานะผู้มีอำนาจตัดสินใจที่ไม่มีการตรวจสอบ ใช้ LLM ในวงจร: เสนอ แนะแนว ตรวจสอบ—จากนั้นบันทึกทุกขั้นตอนราวกับว่าคุณจะต้องอธิบายให้ทนายความฟัง
Q4: ฉันจะหลีกเลี่ยงข้อผิดพลาดที่ใหญ่ที่สุดในการนำเสนอ PPT เรื่องการตัดสินใจในปัญญาประดิษฐ์ได้อย่างไร?
แยกการเรียนรู้ออกจากการตัดสินใจ กำหนดวัตถุประสงค์ และระบุข้อจำกัด แสดงโหมดความล้มเหลวและการตรวจสอบ—หากสไลด์ของคุณมีแต่ลูกศรและไม่มีการแลกเปลี่ยน มันคือละคร ไม่ใช่วิศวกรรม
Q5: Sider.AI เหมาะสมกับขั้นตอนการทำงานของการตัดสินใจด้วย AI ตรงไหน?
Sider.AI ช่วยในส่วนที่ยุ่งยากตรงกลาง—การเขียน การเปรียบเทียบ และการตรวจสอบขั้นตอนการให้เหตุผล—เพื่อให้คุณสามารถใส่ความช่วยเหลือจาก LLM ในที่ที่มันได้ผล แทนที่จะเป็นที่ที่ฝ่ายการตลาดหวังว่ามันจะได้ผล คิดถึงการทำซ้ำที่เป็นประโยชน์ ไม่ใช่ไม้กายสิทธิ์