เมื่อ Anthropic พัฒนาโมเดล AI ภายในที่ชื่อว่า Mythos จนถึงจุดที่มันสามารถค้นพบและเชื่อมโยงช่องโหว่ Zero-day ได้ด้วยตัวเองโดยไม่ต้องมีคนแนะนำ พวกเขาตัดสินใจว่ามันอันตรายเกินไปที่จะปล่อยสู่สาธารณะ แต่เมื่อไม่นานมานี้ Anthropic นำโมเดลเดิมนั้นมาใส่ระบบ Safety Classifier เพิ่มเข้าไป แล้วปล่อยออกมาในชื่อ Claude Fable 5 Zinho จากช่อง Zinho Automates ได้ทดสอบโมเดลนี้อย่างละเอียดและแชร์วิธีใช้ที่ได้ผลจริง ซึ่งเป็นที่มาของบทความนี้
นี่ไม่ใช่แค่การอัปเกรดเล็กน้อยจาก Opus 4.8 Fable ทำงานอยู่ในลีกที่ต่างออกไปโดยสิ้นเชิงบนงานที่ซับซ้อนพอ และคำถามที่สำคัญกว่าว่า "มันเจ๋งแค่ไหน?" คือ "จะใช้มันให้คุ้มได้อย่างไร?"
- SWE-bench Verified (ทดสอบ GitHub issues จริง): Fable ทำได้ 95% เทียบกับ Opus 88.6%
- วิธีใช้ที่ถูกต้อง: ตั้งเป้าหมายเดียว แล้วปล่อยให้ Fable วางแผนและ execute เอง ไม่ต้อง handoff ทีละ step
- งานที่แตะ cybersecurity, biology, chemistry ถูก route ไป Opus 4.8 โดยอัตโนมัติ ไม่มีแจ้งเตือน
- ใช้ฟรีถึง 22 มิ.ย. สำหรับ Pro/Max/Team/Enterprise — หลังจากนั้นแพงกว่า Opus 2 เท่า
ทำไม Fable ถึงถูกล็อกไว้นานขนาดนั้น
โมเดลที่กลายมาเป็น Fable มีชื่อโค้ดเดิมว่า Mythos ถูกพัฒนาและทดสอบภายใน Anthropic แต่ไม่เคยถูกปล่อยออกมา เหตุผลคือในระหว่างการทดสอบ มันแสดงความสามารถที่น่ากังวล: สามารถค้นพบช่องโหว่ Zero-day และเชื่อมโยงช่องโหว่หลายตัวเข้าด้วยกันโดยไม่ต้องมีคนชี้แนะ สิ่งที่ปกติต้องใช้ Senior Security Engineer หลายสัปดาห์ Mythos ทำให้เสร็จภายในไม่กี่ชั่วโมง
เมื่อตัดสินใจปล่อยโมเดลนี้ Anthropic เพิ่ม Safety Classifier เข้าไปทำงานคู่กัน ผลที่ได้คือทุก Request ที่เกี่ยวข้องกับ cybersecurity, biology, หรือ chemistry จะถูก route ไปยัง Opus 4.8 แทนโดยอัตโนมัติและเงียบๆ คิดเป็นน้อยกว่า 5% ของ Session ทั้งหมด แต่ทุกอย่างนอกเหนือจากนั้นยังคงรันด้วยพลังของ Mythos เต็มๆ
ตัวเลข Benchmark ที่อธิบายความต่าง
บน SWE-bench Verified ชุดทดสอบที่ใช้ GitHub issues จริงซึ่งบริษัทเทคโนโลยีใช้ในกระบวนการ Hiring วัดความสามารถแก้ปัญหาโค้ดในสภาพแวดล้อมจริง Fable ทำได้ 95% เทียบกับ Opus ที่ 88.6% ส่วน Senior Engineer Benchmark โดยรวม Fable ได้ 91/100 เทียบกับ Opus ที่ 63/100 ซึ่งเป็นช่องว่างที่ใหญ่มาก
สิ่งที่น่าสังเกตคือ pattern เดิมที่ซ้ำกันในทุกการทดสอบ: งานง่าย ช่องว่างระหว่าง Fable กับ Opus แคบมาก แต่พองานยากขึ้นและซับซ้อนขึ้น Fable ห่างออกอย่างชัดเจน Stripe พิสูจน์เรื่องนี้ในโลกจริง พวกเขาเอา Fable ไปจัดการ Ruby codebase ขนาด 50 ล้านบรรทัด และ Fable ทำ migration เสร็จภายในวันเดียว งานที่ทีม Engineering ปกติต้องใช้เวลา 2 เดือน
ความต่างระหว่าง Fable กับ Opus บนงานซับซ้อนไม่ใช่ "ดีกว่าเล็กน้อย" — มันคือการทำงานคนละประเภทกันโดยสิ้นเชิง
วิธีใช้ Fable ใน Claude Code — ตั้งเป้าแล้วปล่อย
การเปลี่ยนแปลงที่สำคัญที่สุดในการใช้ Fable คือ วิธีคิดเรื่อง Workflow มากกว่าทักษะการเขียน Prompt ด้วย Opus หรือโมเดลรุ่นก่อน เราต้องแตกงานออกเป็น 10 Step แล้วส่งทีละขั้น แต่ Fable ออกแบบมาให้รับ เป้าหมายเดียว แล้วจัดการทุกอย่างเอง นี่คือ Fundamental Shift ที่แท้จริง
ขั้นตอนที่ได้ผลจริงเมื่อใช้กับ Claude Code: เปิด Session แล้วอย่าสั่งงานทันที แทนที่จะอธิบายว่าต้องการอะไร ให้บอกว่า "นี่คือ Idea — ถามทุกอย่างที่จำเป็นก่อนเริ่ม" Fable จะไม่ถามแค่คำถามเดียว แต่จะ interrogate เหมือน Senior Engineer ที่ต้องการเข้าใจงานอย่างถ่องแท้ ครอบคลุมตั้งแต่ Visual Style, Data Structure, Feature Interaction ไปจนถึง User Experience ก่อนที่จะเขียนโค้ดบรรทัดแรก การทำแบบนี้ทำให้ Architecture งานถูกคิดล่วงหน้า แทนที่จะปรับแก้ระหว่างทาง
ผลที่ได้จริงในการทดสอบ: Productivity App ครบวงจรมี To-do List, Kanban Board, Calendar, Notes, Pomodoro Timer, และ Stats ที่ integrate กันทั้งหมด Tasks จาก To-do List ขึ้น Calendar อัตโนมัติ Pomodoro Timer attach กับ specific task ได้ สร้างเสร็จใน 30 นาที ทำงานใน Run แรกโดยไม่มี Bug ให้แก้ งานระดับนี้ในรูปแบบปกติต้องใช้เวลาพัฒนาเป็นเดือน ตัวอย่างอีกอัน: Interactive 3D World ที่รันในเบราว์เซอร์ได้เลย มี Lighting, Environment, และ Navigation ครบ จาก Prompt เดียว ระดับความซับซ้อนที่ Developer มีประสบการณ์ต้องใช้เวลาหลายวัน
Fable กับ Automation Pipeline
สำหรับคนที่ทำงานด้าน Automation หรือสร้าง AI Pipeline ความสามารถที่แตกต่างที่สุดของ Fable คือการจัดการ Multi-step Workflow แบบ Autonomous โดยไม่ต้องการคน handoff ระหว่างขั้นตอน
ตัวอย่างที่เห็นได้ชัดคือ Content Production Pipeline: Idea เข้ามา → Research → Outline → Script → Thumbnail Brief → Description → Social Posts ทุกขั้นตอนนี้ด้วย Opus ต้องเขียน System Instruction เป็นหน้าๆ ระบุทุก Step อธิบาย Format ของทุก Deliverable และ Anticipate Edge Case ล่วงหน้า แม้ทำทั้งหมดนั้นแล้ว โมเดลก็ยังมีโอกาส Drift หลังจาก Session ยาวพอ
กับ Fable สิ่งที่ต้องให้คือ "คำอธิบายชัดเจนของ Pipeline และลักษณะ Output ที่ดี" เท่านั้น โมเดลจะ pick up โครงสร้างเอง เข้าใจลำดับงาน adapt ไปกับ Workflow โดยไม่ต้อง Micromanage ทุก Transition และที่สำคัญ เมื่อเกิดข้อผิดพลาดระหว่างทาง Fable จัดการ Recovery เองแทนที่จะหยุดรอคำสั่ง แค่ตั้งเป้าหมาย สตาร์ท Loop แล้วกลับมาดูเมื่องานเสร็จ
ข้อจำกัดและการเลือกโมเดลให้ถูกงาน
ข้อจำกัดแรกที่ต้องทำความเข้าใจก่อนใช้: Topic Downgrade งาน cybersecurity, biology, chemistry ถูก route ไป Opus 4.8 เงียบๆ ไม่มีแจ้งเตือน คิดเป็นน้อยกว่า 5% ของ Session แต่ถ้าอยู่ในสายงานเหล่านี้จะรู้สึกได้ชัดเจน ข้อจำกัดที่สองคือ Token Cost Fable แพงกว่า Opus 2 เท่าเมื่อใช้ที่ Reasoning Level สูง และสามารถเผา Credit หมดเร็วมากถ้า Session ยาวหรืองานซับซ้อน
กรอบการเลือกโมเดลที่ใช้ได้จริง:
| โมเดล | เหมาะกับ | ราคา |
|---|---|---|
| Fable 5 | งานซับซ้อน, Autonomous Session หลายชั่วโมง, Build ใหญ่, Deep Research | 2× Opus |
| Opus 4.8 | งานประจำวัน, เร็ว, ผลลัพธ์ดี, ครอบคลุมส่วนใหญ่ที่ทำ | Baseline |
| Sonnet | Volume, Bulk Task, งาน Cost-sensitive | ต่ำกว่า Opus |
ความผิดพลาดที่เจอบ่อยคือ Default ไปใช้ Fable กับทุกงานเพราะตอนนี้ยังฟรี ผลที่ตามมาคือ Credit หมดก่อนที่จะได้ใช้กับงานที่ Fable แสดงผลได้จริง Prompt ง่ายๆ ที่ Opus ทำได้ดีอยู่แล้ว ไม่ได้ดีขึ้นมากเมื่อสลับมาใช้ Fable
บทสรุป
Claude Fable 5 น่าสนใจไม่ใช่เพราะตัวเลข Benchmark แต่เพราะมันเปลี่ยนวิธีที่เราทำงานกับ AI แทนที่จะเป็น Co-pilot ที่ต้องบอกทุกขั้นตอน มันทำหน้าที่เหมือนทีมที่รับเป้าหมายแล้วจัดการเส้นทางเอง งานที่จะได้ประโยชน์สูงสุดคืองานที่ซับซ้อน มีหลายส่วนที่ต้อง integrate กัน หรือต้องการ Autonomous Session ยาวโดยไม่ต้องการคนดู ส่วนงานทั่วไปที่ Opus ทำได้ดีอยู่แล้ว ไม่มีเหตุผลต้องเปลี่ยน ช่วงก่อน 22 มิถุนายนเป็นโอกาสที่จะเอางานซับซ้อนที่สุดที่ค้างมานานมาลองจริงๆ ว่า Fable จะจัดการได้แค่ไหน




