บทนำ
เมื่อวันที่ 5 กุมภาพันธ์ 2026, OpenAI ได้ประกาศ GPT-5.3-Codex ซึ่งเป็นโมเดลการเขียนโค้ดเชิงเอเจนต์ที่ล้ำสมัยที่สุดเท่าที่เคยมีมา การเปิดตัวนี้ถือเป็นก้าวสำคัญในด้านปัญญาประดิษฐ์ ไม่เพียงแต่สำหรับความสามารถทางเทคนิคที่น่าประทับใจเท่านั้น แต่ยังเป็นเพราะมันเป็นโมเดลแรกที่มีบทบาทสำคัญในการสร้างตัวเอง
แสดงถึงการเปลี่ยนแปลงขั้นพื้นฐานจากเครื่องมือเขียนโค้ดไปสู่ผู้ทำงานร่วมกันด้าน AI แบบอินเทอร์แอกทีฟ ที่สามารถจัดการงานทางเทคนิคในโลกแห่งความเป็นจริงในระยะยาว ครอบคลุมสเปกตรัมทั้งหมดของงานคอมพิวเตอร์ระดับมืออาชีพ
อะไรที่ทำให้ แตกต่าง
โมเดลเชิงเอเจนต์อย่างแท้จริง
ต่างจากผู้ช่วยเขียนโค้ดแบบเดิมที่เพียงแค่สร้างส่วนย่อยของโค้ด ได้รับการออกแบบมาให้เป็นโมเดล "เชิงเอเจนต์" ซึ่งหมายความว่ามันสามารถ:
- รักษาบริบท ตลอดงานที่ใช้เวลานานหลายชั่วโมงหรือหลายวัน
- ใช้เครื่องมือโดยอัตโนมัติ รวมถึงอินเทอร์เฟซบรรทัดคำสั่ง ระบบไฟล์ และสภาพแวดล้อมการพัฒนา
- ปรับตัวและทำซ้ำ ตามความคิดเห็นแบบเรียลไทม์โดยไม่เสียตำแหน่ง
- จัดการเวิร์กโฟลว์แบบหลายขั้นตอนที่ซับซ้อน ที่ต้องใช้การวิจัย การวางแผน และการดำเนินการ
ความสำเร็จในการสร้างตัวเอง
สิ่งที่น่าทึ่งที่สุดเกี่ยวกับ คือทีม Codex ใช้โมเดลเวอร์ชันแรกเพื่อ:
- แก้ไขจุดบกพร่องในกระบวนการฝึกอบรมของตัวเอง
- จัดการการปรับใช้ของตัวเอง
- วินิจฉัยผลการทดสอบและการประเมิน
- เพิ่มประสิทธิภาพโครงสร้างพื้นฐานสำหรับการเปิดตัวครั้งสุดท้าย
วงจรการพัฒนาแบบอ้างอิงตนเองนี้แสดงให้เห็นว่า AI เริ่มเร่งการปรับปรุงตัวเองได้อย่างไร ซึ่งเป็นเหตุการณ์สำคัญที่นักวิจัยของ OpenAI อธิบายว่าทำให้พวกเขา "ทึ่งมากที่ Codex สามารถเร่งการพัฒนาของตัวเองได้มากขนาดไหน"
การปรับปรุงประสิทธิภาพ
25% 25% รุ่นก่อนหน้า (GPT-5.2-Codex) 25% เนื่องจากการปรับปรุงโครงสร้างพื้นฐานและสแต็กการอนุมานของ OpenAI การปรับปรุงความเร็วนี้ช่วยให้การทำงานร่วมกันแบบเรียลไทม์ตอบสนองได้ดีขึ้นและรอบการทำซ้ำเร็วขึ้น
ประสิทธิภาพเกณฑ์มาตรฐาน: ข้อมูล
บรรลุประสิทธิภาพที่ล้ำสมัยในเกณฑ์มาตรฐานหลักหลายประการที่วัดความสามารถในการเขียนโค้ด ความสามารถเชิงเอเจนต์ และการใช้คอมพิวเตอร์ในโลกแห่งความเป็นจริง
SWE-Bench Pro
SWE-Bench Pro คือการประเมินทางวิศวกรรมซอฟต์แวร์ในโลกแห่งความเป็นจริงอย่างเข้มงวด ซึ่งครอบคลุมภาษาโปรแกรมสี่ภาษา (Python, JavaScript, TypeScript และ Go) ต่างจากรุ่นก่อน (SWE-Bench Verified) ที่ทดสอบเฉพาะ Python ได้รับการออกแบบมาให้ทนทานต่อการปนเปื้อนและเกี่ยวข้องกับอุตสาหกรรมมากขึ้น
Terminal-Bench 2.0
การปรับปรุง GPT-5.3-Codex ใน Terminal-Bench 2.0 มีความสำคัญอย่างยิ่ง เกณฑ์มาตรฐานนี้วัดทักษะด้านเทอร์มินัลที่เอเจนต์การเขียนโค้ดต้องการ เช่น การนำทางระบบไฟล์ การดำเนินการคำสั่ง และการจัดการเวิร์กโฟลว์การพัฒนา สิ่งที่น่าสังเกตคือ GPT-5.3-Codex ทำได้โดยใช้โทเค็นน้อยกว่าโมเดลก่อนหน้า ทำให้มีประสิทธิภาพมากขึ้น
OSWorld-Verified
การกระโดด GPT-5.3-Codex บน OSWorld-Verified แสดงให้เห็นถึงความสามารถในการใช้คอมพิวเตอร์ที่ดีขึ้นอย่างมาก OSWorld เป็นเกณฑ์มาตรฐานการใช้คอมพิวเตอร์เชิงเอเจนต์ที่เอเจนต์ต้องทำงานด้านประสิทธิภาพในสภาพแวดล้อมเดสก์ท็อปแบบเห็นภาพ การปรับปรุงครั้งใหญ่นี้แสดงให้เห็นว่า GPT-5.3-Codex สามารถนำทางอินเทอร์เฟซในโลกแห่งความเป็นจริงได้ดีกว่าโมเดลก่อนหน้ามาก
เหนือกว่าโค้ด: เอเจนต์อเนกประสงค์
ในขณะที่ มีความโดดเด่นในการเขียนโปรแกรม ความสามารถของมันขยายออกไปไกลกว่าการสร้างโค้ด OpenAI วางตำแหน่งให้เป็นเอเจนต์ที่สามารถจัดการ "เกือบทุกอย่างที่นักพัฒนาและผู้เชี่ยวชาญสามารถทำได้บนคอมพิวเตอร์"
การสนับสนุนวงจรชีวิตซอฟต์แวร์
โมเดลนี้สร้างขึ้นเพื่อรองรับวงจรการพัฒนาซอฟต์แวร์ทั้งหมด:
- การแก้ไขข้อบกพร่อง - การระบุและการแก้ไขข้อบกพร่อง
- การปรับใช้ - การจัดการรุ่นและโครงสร้างพื้นฐาน
- การตรวจสอบ - การติดตามประสิทธิภาพและเมตริก
- การเขียน PRD - เอกสารข้อกำหนดผลิตภัณฑ์
- การแก้ไขสำเนา - เอกสารประกอบและข้อความทางการตลาด
- การวิจัยผู้ใช้ - การวิเคราะห์ความคิดเห็นของผู้ใช้
- การทดสอบ - การเขียนและการรันชุดทดสอบ
- การวิเคราะห์เมตริก - การตัดสินใจโดยใช้ข้อมูล
ความสามารถในการทำงานด้านความรู้
ใน GPT-5.3-Codex (การประเมินของ OpenAI ในปี 2025 ที่วัดประสิทธิภาพของงานด้านความรู้ใน 44 อาชีพ) GPT-5.3-Codex ตรงกับประสิทธิภาพของ GPT-5.2 ซึ่งรวมถึงงานต่างๆ เช่น:
- การสร้างสไลด์และงานนำเสนอ
- การวิเคราะห์ข้อมูลในสเปรดชีต
- การจัดการและจัดระเบียบเอกสาร
ตัวอย่างการพัฒนาเว็บ
เพื่อแสดงให้เห็นถึงความสามารถของโมเดล OpenAI ขอให้ สร้างเกมสองเกมที่สมบูรณ์ตั้งแต่เริ่มต้น:
- เกมแข่งรถ (เวอร์ชัน 2 ของเกมเปิดตัวแอป Codex)
โดยใช้เพียงทักษะ "พัฒนาเกมบนเว็บ" และข้อความแจ้งติดตามผลทั่วไป เช่น "แก้ไขข้อบกพร่อง" หรือ "ปรับปรุงเกม" ทำซ้ำโดยอัตโนมัติมากกว่าล้านโทเค็น สร้างเกมที่ใช้งานได้และขัดเกลาอย่างมาก
ความเข้าใจเจตนาที่ดีขึ้น
เมื่อเทียบกับ GPT-5.2-Codex โมเดลใหม่เข้าใจเจตนาของผู้ใช้ได้ดีขึ้นเมื่อสร้างเว็บไซต์ ข้อความแจ้งที่เรียบง่ายหรือไม่เฉพาะเจาะจงในขณะนี้จะเริ่มต้นด้วยไซต์ที่มี:
- ฟังก์ชันการทำงานที่มากขึ้น
- คุณสมบัติที่พร้อมใช้งานจริง
ตัวอย่างเช่น เมื่อขอให้สร้างหน้า Landing Page สำหรับราคา จะแสดงแผนรายปีเป็นราคารายเดือนที่ลดแล้วโดยอัตโนมัติ (ทำให้ส่วนลดชัดเจน) และสร้างวงล้อคำรับรองที่เปลี่ยนผ่านโดยอัตโนมัติพร้อมคำพูดของผู้ใช้ที่แตกต่างกันสามคำ ทำให้ได้การออกแบบที่สมบูรณ์และขัดเกลามากขึ้น
การทำงานร่วมกันแบบอินเทอร์แอกทีฟ
หนึ่งในการปรับปรุงประสบการณ์ผู้ใช้ที่สำคัญที่สุดคือความสามารถในการ ชี้นำโมเดลในขณะที่มันทำงาน
การโต้ตอบแบบเรียลไทม์
แทนที่จะรอผลลัพธ์สุดท้าย ผู้ใช้สามารถ:
- ถามคำถามระหว่างการดำเนินการ
- หารือเกี่ยวกับแนวทางที่แตกต่างกัน
Settings > General > Follow-up behavior พูดถึงสิ่งที่กำลังทำ ตอบสนองต่อข้อเสนอแนะ และแจ้งให้ผู้ใช้ทราบตั้งแต่ต้นจนจบ สิ่งนี้สามารถเปิดใช้งานได้ในแอป Codex ผ่านทาง Settings > General > Follow-up behavior
สิ่งนี้เปลี่ยนประสบการณ์จากการให้คำสั่งกับเครื่องจักรเป็นการทำงานร่วมกันกับเพื่อนร่วมทีม ซึ่งเป็นการเปลี่ยนแปลงขั้นพื้นฐานในวิธีที่มนุษย์โต้ตอบกับระบบ AI
ความสามารถด้านความปลอดภัยทางไซเบอร์และความปลอดภัย
โมเดลแรกที่ OpenAI จัดประเภทเป็น "ความสามารถสูง" สำหรับงานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์ เป็น โมเดลแรกที่ OpenAI จัดประเภทเป็น "ความสามารถสูง" สำหรับงานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์ ภายใต้ Preparedness Framework นอกจากนี้ยังเป็นโมเดลแรกที่ได้รับการฝึกอบรมโดยตรงเพื่อระบุช่องโหว่ของซอฟต์แวร์
ลักษณะการใช้งานสองทาง
เนื่องจากความปลอดภัยทางไซเบอร์มีลักษณะการใช้งานสองทางโดยธรรมชาติ (มีประโยชน์ทั้งสำหรับการป้องกันและการโจมตี) OpenAI จึงใช้แนวทางป้องกันไว้ก่อน:
- ไม่มีหลักฐานที่แน่ชัด ว่าสามารถโจมตีทางไซเบอร์แบบอัตโนมัติตั้งแต่ต้นจนจบได้
- การปรับใช้สแต็กความปลอดภัยทางไซเบอร์ที่ครอบคลุม
- การนำการฝึกอบรมด้านความปลอดภัยและการตรวจสอบอัตโนมัติมาใช้
- การกำหนดให้เข้าถึงความสามารถขั้นสูงได้อย่างน่าเชื่อถือ
การเข้าถึงที่เชื่อถือได้สำหรับ Cyber
OpenAI กำลังเปิดตัว Trusted Access for Cyber ซึ่งเป็นโครงการนำร่องเพื่อ:
- เร่งการวิจัยด้านการป้องกันทางไซเบอร์
- ให้เครื่องมือแก่ผู้ป้องกันก่อน
- สนับสนุนความยืดหยุ่นของระบบนิเวศ
ความมุ่งมั่น 10 ล้านดอลลาร์
จากการสร้างโปรแกรมให้ทุนด้านความปลอดภัยทางไซเบอร์ 1 ล้านดอลลาร์ในปี 2023 OpenAI กำลังให้คำมั่นสัญญา เครดิต API มูลค่า 10 ล้านดอลลาร์ เพื่อเร่งการป้องกันทางไซเบอร์ โดยเฉพาะอย่างยิ่งสำหรับ:
- ระบบโครงสร้างพื้นฐานที่สำคัญ
- การวิจัยด้านความปลอดภัยโดยสุจริต
Aardvark Security Agent
OpenAI กำลังขยายรุ่นเบต้าส่วนตัวของ Aardvark ซึ่งเป็นเอเจนต์การวิจัยด้านความปลอดภัย ซึ่งเป็นข้อเสนอแรกในชุดผลิตภัณฑ์และเครื่องมือ Codex Security นอกจากนี้พวกเขายังร่วมมือกับผู้ดูแลโอเพนซอร์สเพื่อให้การสแกนฐานรหัสฟรีสำหรับโครงการที่ใช้กันอย่างแพร่หลายเช่น Next.js
OpenAI ใช้ Codex สร้าง Codex ได้อย่างไร
การพัฒนา เป็นกรณีศึกษาที่น่าสนใจในการวิจัยที่เร่งด้วย AI
กรณีการใช้งานของทีมวิจัย
ทีมวิจัยใช้ เวอร์ชันแรกเพื่อ:
- ตรวจสอบและแก้ไขข้อบกพร่อง การรันการฝึกอบรมสำหรับการเปิดตัว
- ติดตามรูปแบบ ตลอดระยะเวลาการฝึกอบรม
- ให้การวิเคราะห์เชิงลึก เกี่ยวกับคุณภาพการโต้ตอบ
- เสนอการแก้ไข และสร้างแอปพลิเคชันที่หลากหลายสำหรับนักวิจัยที่เป็นมนุษย์
- ทำความเข้าใจอย่างแม่นยำว่าพฤติกรรมของโมเดลแตกต่างจากโมเดลก่อนหน้าอย่างไร
กรณีการใช้งานของทีมวิศวกรรม
ทีมวิศวกรรมใช้ Codex เพื่อ:
- เพิ่มประสิทธิภาพและปรับ สายรัดสำหรับ GPT-5.3-Codex
- ระบุข้อบกพร่องในการแสดงบริบท ที่ส่งผลกระทบต่อผู้ใช้
- หาสาเหตุหลักของอัตราการเข้าชมแคชน้อย
- ปรับขนาดคลัสเตอร์ GPU แบบไดนามิก เพื่อปรับให้เข้ากับการใช้งานที่เพิ่มขึ้น
- รักษาเวลาแฝงให้คงที่ระหว่างการเปิดตัว
กรณีการใช้งานวิทยาศาสตร์ข้อมูล
ในระหว่างการทดสอบอัลฟ่า นักวิทยาศาสตร์ข้อมูลทำงานร่วมกับ เพื่อ:
- สร้างตัวจำแนก regex เพื่อประมาณความถี่ของการชี้แจง การตอบสนองของผู้ใช้ และความคืบหน้าของงาน
- เรียกใช้ตัวจำแนกเหล่านี้ได้อย่างยืดหยุ่นผ่านบันทึกเซสชันทั้งหมด
- สร้างไปป์ไลน์ข้อมูลใหม่และแสดงภาพผลลัพธ์ที่หลากหลายกว่าเครื่องมือแดชบอร์ดมาตรฐาน
- ร่วมวิเคราะห์ผลลัพธ์ โดย Codex สรุปข้อมูลเชิงลึกที่สำคัญจากจุดข้อมูลนับพันในเวลาไม่ถึงสามนาที
ผลผลิตที่เพิ่มขึ้น
ผลลัพธ์ที่ได้คือ ผู้คนที่สร้างด้วย Codex มีความสุขมากขึ้นในขณะที่เอเจนต์:
- เข้าใจเจตนาของพวกเขาได้ดีขึ้น
- มีความคืบหน้ามากขึ้นต่อรอบ
- ถามคำถามที่ต้องอธิบายเพิ่มเติมน้อยลง
ความพร้อมใช้งานและราคา
วิธีการเข้าถึง
พร้อมใช้งานทันที พร้อมใช้งานทันที สำหรับผู้ใช้ ChatGPT ที่ชำระเงินในทุกพื้นผิวของ Codex:
- แอปเดสก์ท็อป (macOS และ Windows)
- อินเทอร์เฟซบรรทัดคำสั่ง (CLI)
- ส่วนขยาย IDE (VS Code, JetBrains ฯลฯ)
แผนการสมัครสมาชิก
ในช่วงเวลาจำกัด แผนการชำระเงินจะได้รับ อัตราขีดจำกัดปกติเป็นสองเท่า
ราคา API
ณ วันที่เปิดตัว GPT-5.3-Codex สำหรับ GPT-5.3-Codex การเข้าถึง API อธิบายว่า "กำลังทยอยเปิดตัวเร็วๆ นี้" และ "จะมาในอีกไม่กี่สัปดาห์ข้างหน้า"
สำหรับการอ้างอิง ราคา API ปัจจุบันสำหรับรุ่นก่อนหน้า (GPT-5.2-Codex) คือ:
โครงสร้างพื้นฐาน
ระบบ NVIDIA GB200 NVL72 ได้รับการออกแบบร่วม ฝึกอบรม และให้บริการบน ระบบ NVIDIA GB200 NVL72 ซึ่งเป็นข้อพิสูจน์ถึงความร่วมมืออย่างใกล้ชิดระหว่าง OpenAI และ NVIDIA ในการผลักดันขอบเขตความสามารถของ AI
การเปรียบเทียบกับคู่แข่ง
การเปิดตัว Claude Opus 4.6 เกิดขึ้นเพียงไม่กี่นาทีหลังจากการประกาศ Claude Opus 4.6 ของ Anthropic ทำให้เกิดการเปรียบเทียบระหว่างทั้งสองรุ่นในทันที
จุดแข็งของ GPT-5.3-Codex
- Terminal-Bench 2.0: 77.3 เทียบกับ 65.4 ของ Opus 4.6 (ข้อได้เปรียบ +18.6%)</a2>
- ปรัชญาการออกแบบ "ความน่าเชื่อถือสูง ความแปรปรวนต่ำ"</a2>
- ความสามารถในการสร้างตัวเอง (ช่วยสร้างตัวเอง)
- การจัดประเภทความปลอดภัยทางไซเบอร์ "ความสามารถสูง" ครั้งแรก
จุดแข็งของ Claude Opus 4.6
- หน้าต่างบริบท 1 ล้านโทเค็น (ใหญ่กว่ามาก)
- ฟังก์ชันการทำงานร่วมกันของ Agent Teams</a2>
- ความเก่งกาจที่กว้างกว่า ในสถานการณ์การทำงานด้านความรู้
- อุณหภูมิความคิดสร้างสรรค์ที่สูงขึ้น (บุคลิกภาพมากขึ้น)
ความแตกต่างของปรัชญาการออกแบบ
ภาพรวมที่ใหญ่กว่า
เอเจนต์อเนกประสงค์ที่สามารถให้เหตุผล สร้าง และดำเนินการ แสดงให้เห็นถึงมากกว่าการอัปเกรดเพิ่มเติม แต่เป็นการเปลี่ยนแปลงครั้งใหญ่ไปสู่ เอเจนต์อเนกประสงค์ที่สามารถให้เหตุผล สร้าง และดำเนินการ ในสเปกตรัมทั้งหมดของงานทางเทคนิคในโลกแห่งความเป็นจริง
จาก Code Agent สู่ Computer Agent
OpenAI วางกรอบวิวัฒนาการนี้อย่างชัดเจน: "Codex กำลังก้าวข้ามการเขียนโค้ดไปสู่การใช้มันเป็นเครื่องมือในการใช้งานคอมพิวเตอร์และทำงานให้เสร็จสิ้นตั้งแต่ต้นจนจบ"
นี่เป็นการเปลี่ยนแปลงที่ลึกซึ้ง สิ่งที่เริ่มต้นจากการมุ่งเน้นไปที่การเป็น "เอเจนต์การเขียนโค้ดที่ดีที่สุด" ได้กลายเป็นรากฐานสำหรับผู้ทำงานร่วมกันทั่วไปบนคอมพิวเตอร์ ซึ่งขยายทั้งผู้ที่สามารถสร้างและสิ่งที่เป็นไปได้ด้วย AI
การเร่งการพัฒนา AI
ข้อเท็จจริงที่ว่า ช่วยสร้างตัวเองเป็นตัวอย่างของสิ่งที่กำลังจะมาถึง ดังที่นักวิจัยของ OpenAI ตั้งข้อสังเกตว่า "นักวิจัยและวิศวกรจำนวนมากที่ OpenAI อธิบายว่างานของพวกเขาในปัจจุบันแตกต่างไปจากเมื่อสองเดือนที่แล้วอย่างสิ้นเชิง"
สิ่งนี้ชี้ให้เห็นว่าเรากำลังเข้าสู่ช่วงเวลาแห่ง ผลตอบแทนที่เร่งตัวขึ้น ในการพัฒนา AI ซึ่งโมเดลแต่ละรุ่นช่วยสร้างรุ่นต่อไป ซึ่งอาจบีบอัดไทม์ไลน์จากปีเป็นเดือน
ผลกระทบสำหรับนักพัฒนา
สำหรับนักพัฒนาซอฟต์แวร์ ผลกระทบมีความสำคัญ:
- รอบการพัฒนาที่เร็วขึ้น - AI จัดการงานประจำมากขึ้น
- การนามธรรมระดับสูงขึ้น - นักพัฒนาสามารถมุ่งเน้นไปที่สถาปัตยกรรมและการออกแบบ
- การทำงานร่วมกันแบบอินเทอร์แอกทีฟ - ไม่เหมือนการใช้เครื่องมือ แต่เหมือนการทำงานกับเพื่อนร่วมทีมมากกว่า
- ความสามารถใหม่ๆ - งานที่ต้องใช้ความรู้เฉพาะทางก่อนหน้านี้ ตอนนี้เข้าถึงได้แล้ว
ผลกระทบสำหรับธุรกิจ
สำหรับธุรกิจ แสดงถึง:
- ผลผลิตที่เพิ่มขึ้น - ทำงานได้มากขึ้นในเวลาที่น้อยลง
- อุปสรรคลดลง - ทักษะเฉพาะทางที่จำเป็นสำหรับงานบางอย่างน้อยลง
- ข้อควรพิจารณาด้านความปลอดภัยใหม่ - การจัดประเภทความปลอดภัยทางไซเบอร์ "ความสามารถสูง" ต้องมีการกำกับดูแลอย่างรอบคอบ
- ความได้เปรียบในการแข่งขัน - การนำ AI เชิงเอเจนต์ที่ทรงพลังมาใช้ก่อนใคร
สรุป
เป็นความสำเร็จที่สำคัญในด้านปัญญาประดิษฐ์ มันรวมเอา:
- ประสิทธิภาพการเขียนโค้ดที่ล้ำสมัย
- ความสามารถเชิงเอเจนต์ขั้นสูง
- การทำงานร่วมกันแบบอินเทอร์แอกทีฟ
- การปรับปรุงตัวเอง (ช่วยสร้างตัวเอง)
- การใช้คอมพิวเตอร์ในโลกแห่งความเป็นจริง
ข้อเท็จจริงที่ว่ามันมีส่วนสำคัญในการสร้างตัวเอง ถือเป็นทั้งความสำเร็จทางเทคนิคและอุปมาสำหรับทิศทางที่ AI กำลังมุ่งหน้าไป ในขณะที่โมเดลมีความสามารถมากขึ้น พวกมันไม่ได้เป็นเพียงเครื่องมือที่เราใช้ แต่พวกเขากำลังกลายเป็นหุ้นส่วนในกระบวนการสร้างสรรค์และการพัฒนา
การเปิดตัวพร้อมกันกับ Claude Opus 4.6 ในเวลาห่างกันเพียงไม่กี่นาที ตอกย้ำถึงความเข้มข้นของการแข่งขันในพื้นที่ AI แต่ที่สำคัญกว่านั้นคือ มันส่งสัญญาณว่าเราได้เข้าสู่ขั้นตอนใหม่ของความสามารถของ AI ซึ่งเอเจนต์สามารถจัดการงานที่ซับซ้อนและระยะยาวได้อย่างน่าเชื่อถือในสเปกตรัมทั้งหมดของงานคอมพิวเตอร์ระดับมืออาชีพ
ดังที่ OpenAI กล่าวว่า "สิ่งที่เริ่มต้นจากการมุ่งเน้นไปที่การเป็นเอเจนต์การเขียนโค้ดที่ดีที่สุด ได้กลายเป็นรากฐานสำหรับผู้ทำงานร่วมกันทั่วไปบนคอมพิวเตอร์มากขึ้น"
คำถามในตอนนี้ไม่ใช่แค่ว่าโมเดลเหล่านี้ทำอะไรได้บ้าง แต่เราจะเลือกสร้างอะไรด้วยพวกมัน
แหล่งที่มา
ข้อจำกัดความรับผิดชอบ: บทความนี้อิงตามข้อมูลที่มี ณ วันที่ 6 กุมภาพันธ์ 2026 ข้อมูลจำเพาะ ราคา และความพร้อมใช้งานอาจเปลี่ยนแปลง โปรดอ้างอิงเอกสารอย่างเป็นทางการของ OpenAI สำหรับข้อมูลที่เป็นปัจจุบันที่สุด