Claude Fable 5 ต่างจาก Opus 4.8 อย่างไร

Fable พัฒนาจาก Mythos โมเดลที่ทรงพลังกว่าและเคยถูกล็อกเพราะความสามารถด้าน cybersecurity ที่น่ากังวล ทำ SWE-bench Verified ได้ 95% เทียบกับ Opus ที่ 88.6% และ Senior Benchmark ได้ 91/100 เทียบกับ 63/100 ความต่างชัดเจนที่สุดในงานซับซ้อน

Fable 5 ใช้ได้กับ Plan ไหนบ้าง

Pro, Max, Team, และ Enterprise ใช้ได้ฟรีถึง 22 มิถุนายน หลังจากนั้นจะเป็น Usage Credits เท่านั้น และราคาจะแพงกว่า Opus 2 เท่า

ทำไมงาน cybersecurity ถึงใช้ Fable ไม่ได้

Anthropic ใส่ Safety Classifier เพื่อป้องกันการนำ Mythos ไปใช้ในด้านที่น่ากังวล ทุก Request ที่แตะ cybersecurity, biology, หรือ chemistry จะถูก route ไปยัง Opus 4.8 โดยอัตโนมัติ ไม่มีแจ้งเตือน

ควรใช้ Fable กับงานประเภทไหน

งานที่คุ้มค่าที่สุดคืองานซับซ้อนที่ต้องการ Autonomous Session ยาวหลายชั่วโมง เช่น build ขนาดใหญ่ multi-step automation pipeline หรือ deep research งานง่ายๆ ที่ Opus ทำได้ดีอยู่แล้วไม่ควรสิ้นเปลือง Credit Fable

Claude Fable 5 คืออะไร และวิธีใช้ให้คุ้มค่า

Claude Fable 5 พัฒนาจาก Mythos โมเดลที่ถูกล็อกเพราะอันตรายเกินไป — ใส่ Safety Classifier แล้วปล่อยใช้ได้ ทำ SWE-bench ได้ 95% ทิ้ง Opus ห่าง แต่ต้องรู้วิธีใช้ให้ถูกงาน

เมื่อ Anthropic พัฒนาโมเดล AI ภายในที่ชื่อว่า Mythos จนถึงจุดที่มันสามารถค้นพบและเชื่อมโยงช่องโหว่ Zero-day ได้ด้วยตัวเองโดยไม่ต้องมีคนแนะนำ พวกเขาตัดสินใจว่ามันอันตรายเกินไปที่จะปล่อยสู่สาธารณะ แต่เมื่อไม่นานมานี้ Anthropic นำโมเดลเดิมนั้นมาใส่ระบบ Safety Classifier เพิ่มเข้าไป แล้วปล่อยออกมาในชื่อ Claude Fable 5 Zinho จากช่อง Zinho Automates ได้ทดสอบโมเดลนี้อย่างละเอียดและแชร์วิธีใช้ที่ได้ผลจริง ซึ่งเป็นที่มาของบทความนี้

นี่ไม่ใช่แค่การอัปเกรดเล็กน้อยจาก Opus 4.8 Fable ทำงานอยู่ในลีกที่ต่างออกไปโดยสิ้นเชิงบนงานที่ซับซ้อนพอ และคำถามที่สำคัญกว่าว่า "มันเจ๋งแค่ไหน?" คือ "จะใช้มันให้คุ้มได้อย่างไร?"

SWE-bench Verified (ทดสอบ GitHub issues จริง): Fable ทำได้ 95% เทียบกับ Opus 88.6%
วิธีใช้ที่ถูกต้อง: ตั้งเป้าหมายเดียว แล้วปล่อยให้ Fable วางแผนและ execute เอง ไม่ต้อง handoff ทีละ step
งานที่แตะ cybersecurity, biology, chemistry ถูก route ไป Opus 4.8 โดยอัตโนมัติ ไม่มีแจ้งเตือน
ใช้ฟรีถึง 22 มิ.ย. สำหรับ Pro/Max/Team/Enterprise — หลังจากนั้นแพงกว่า Opus 2 เท่า

ทำไม Fable ถึงถูกล็อกไว้นานขนาดนั้น

โมเดลที่กลายมาเป็น Fable มีชื่อโค้ดเดิมว่า Mythos ถูกพัฒนาและทดสอบภายใน Anthropic แต่ไม่เคยถูกปล่อยออกมา เหตุผลคือในระหว่างการทดสอบ มันแสดงความสามารถที่น่ากังวล: สามารถค้นพบช่องโหว่ Zero-day และเชื่อมโยงช่องโหว่หลายตัวเข้าด้วยกันโดยไม่ต้องมีคนชี้แนะ สิ่งที่ปกติต้องใช้ Senior Security Engineer หลายสัปดาห์ Mythos ทำให้เสร็จภายในไม่กี่ชั่วโมง

เมื่อตัดสินใจปล่อยโมเดลนี้ Anthropic เพิ่ม Safety Classifier เข้าไปทำงานคู่กัน ผลที่ได้คือทุก Request ที่เกี่ยวข้องกับ cybersecurity, biology, หรือ chemistry จะถูก route ไปยัง Opus 4.8 แทนโดยอัตโนมัติและเงียบๆ คิดเป็นน้อยกว่า 5% ของ Session ทั้งหมด แต่ทุกอย่างนอกเหนือจากนั้นยังคงรันด้วยพลังของ Mythos เต็มๆ

ตัวเลข Benchmark ที่อธิบายความต่าง

บน SWE-bench Verified ชุดทดสอบที่ใช้ GitHub issues จริงซึ่งบริษัทเทคโนโลยีใช้ในกระบวนการ Hiring วัดความสามารถแก้ปัญหาโค้ดในสภาพแวดล้อมจริง Fable ทำได้ 95% เทียบกับ Opus ที่ 88.6% ส่วน Senior Engineer Benchmark โดยรวม Fable ได้ 91/100 เทียบกับ Opus ที่ 63/100 ซึ่งเป็นช่องว่างที่ใหญ่มาก

สิ่งที่น่าสังเกตคือ pattern เดิมที่ซ้ำกันในทุกการทดสอบ: งานง่าย ช่องว่างระหว่าง Fable กับ Opus แคบมาก แต่พองานยากขึ้นและซับซ้อนขึ้น Fable ห่างออกอย่างชัดเจน Stripe พิสูจน์เรื่องนี้ในโลกจริง พวกเขาเอา Fable ไปจัดการ Ruby codebase ขนาด 50 ล้านบรรทัด และ Fable ทำ migration เสร็จภายในวันเดียว งานที่ทีม Engineering ปกติต้องใช้เวลา 2 เดือน

ความต่างระหว่าง Fable กับ Opus บนงานซับซ้อนไม่ใช่ "ดีกว่าเล็กน้อย" — มันคือการทำงานคนละประเภทกันโดยสิ้นเชิง

วิธีใช้ Fable ใน Claude Code — ตั้งเป้าแล้วปล่อย

การเปลี่ยนแปลงที่สำคัญที่สุดในการใช้ Fable คือ วิธีคิดเรื่อง Workflow มากกว่าทักษะการเขียน Prompt ด้วย Opus หรือโมเดลรุ่นก่อน เราต้องแตกงานออกเป็น 10 Step แล้วส่งทีละขั้น แต่ Fable ออกแบบมาให้รับ เป้าหมายเดียว แล้วจัดการทุกอย่างเอง นี่คือ Fundamental Shift ที่แท้จริง

ขั้นตอนที่ได้ผลจริงเมื่อใช้กับ Claude Code: เปิด Session แล้วอย่าสั่งงานทันที แทนที่จะอธิบายว่าต้องการอะไร ให้บอกว่า "นี่คือ Idea — ถามทุกอย่างที่จำเป็นก่อนเริ่ม" Fable จะไม่ถามแค่คำถามเดียว แต่จะ interrogate เหมือน Senior Engineer ที่ต้องการเข้าใจงานอย่างถ่องแท้ ครอบคลุมตั้งแต่ Visual Style, Data Structure, Feature Interaction ไปจนถึง User Experience ก่อนที่จะเขียนโค้ดบรรทัดแรก การทำแบบนี้ทำให้ Architecture งานถูกคิดล่วงหน้า แทนที่จะปรับแก้ระหว่างทาง

ผลที่ได้จริงในการทดสอบ: Productivity App ครบวงจรมี To-do List, Kanban Board, Calendar, Notes, Pomodoro Timer, และ Stats ที่ integrate กันทั้งหมด Tasks จาก To-do List ขึ้น Calendar อัตโนมัติ Pomodoro Timer attach กับ specific task ได้ สร้างเสร็จใน 30 นาที ทำงานใน Run แรกโดยไม่มี Bug ให้แก้ งานระดับนี้ในรูปแบบปกติต้องใช้เวลาพัฒนาเป็นเดือน ตัวอย่างอีกอัน: Interactive 3D World ที่รันในเบราว์เซอร์ได้เลย มี Lighting, Environment, และ Navigation ครบ จาก Prompt เดียว ระดับความซับซ้อนที่ Developer มีประสบการณ์ต้องใช้เวลาหลายวัน

Fable กับ Automation Pipeline

สำหรับคนที่ทำงานด้าน Automation หรือสร้าง AI Pipeline ความสามารถที่แตกต่างที่สุดของ Fable คือการจัดการ Multi-step Workflow แบบ Autonomous โดยไม่ต้องการคน handoff ระหว่างขั้นตอน

ตัวอย่างที่เห็นได้ชัดคือ Content Production Pipeline: Idea เข้ามา → Research → Outline → Script → Thumbnail Brief → Description → Social Posts ทุกขั้นตอนนี้ด้วย Opus ต้องเขียน System Instruction เป็นหน้าๆ ระบุทุก Step อธิบาย Format ของทุก Deliverable และ Anticipate Edge Case ล่วงหน้า แม้ทำทั้งหมดนั้นแล้ว โมเดลก็ยังมีโอกาส Drift หลังจาก Session ยาวพอ

กับ Fable สิ่งที่ต้องให้คือ "คำอธิบายชัดเจนของ Pipeline และลักษณะ Output ที่ดี" เท่านั้น โมเดลจะ pick up โครงสร้างเอง เข้าใจลำดับงาน adapt ไปกับ Workflow โดยไม่ต้อง Micromanage ทุก Transition และที่สำคัญ เมื่อเกิดข้อผิดพลาดระหว่างทาง Fable จัดการ Recovery เองแทนที่จะหยุดรอคำสั่ง แค่ตั้งเป้าหมาย สตาร์ท Loop แล้วกลับมาดูเมื่องานเสร็จ

ข้อจำกัดและการเลือกโมเดลให้ถูกงาน

ข้อจำกัดแรกที่ต้องทำความเข้าใจก่อนใช้: Topic Downgrade งาน cybersecurity, biology, chemistry ถูก route ไป Opus 4.8 เงียบๆ ไม่มีแจ้งเตือน คิดเป็นน้อยกว่า 5% ของ Session แต่ถ้าอยู่ในสายงานเหล่านี้จะรู้สึกได้ชัดเจน ข้อจำกัดที่สองคือ Token Cost Fable แพงกว่า Opus 2 เท่าเมื่อใช้ที่ Reasoning Level สูง และสามารถเผา Credit หมดเร็วมากถ้า Session ยาวหรืองานซับซ้อน

กรอบการเลือกโมเดลที่ใช้ได้จริง:

โมเดล	เหมาะกับ	ราคา
Fable 5	งานซับซ้อน, Autonomous Session หลายชั่วโมง, Build ใหญ่, Deep Research	2× Opus
Opus 4.8	งานประจำวัน, เร็ว, ผลลัพธ์ดี, ครอบคลุมส่วนใหญ่ที่ทำ	Baseline
Sonnet	Volume, Bulk Task, งาน Cost-sensitive	ต่ำกว่า Opus

ความผิดพลาดที่เจอบ่อยคือ Default ไปใช้ Fable กับทุกงานเพราะตอนนี้ยังฟรี ผลที่ตามมาคือ Credit หมดก่อนที่จะได้ใช้กับงานที่ Fable แสดงผลได้จริง Prompt ง่ายๆ ที่ Opus ทำได้ดีอยู่แล้ว ไม่ได้ดีขึ้นมากเมื่อสลับมาใช้ Fable

บทสรุป

Claude Fable 5 น่าสนใจไม่ใช่เพราะตัวเลข Benchmark แต่เพราะมันเปลี่ยนวิธีที่เราทำงานกับ AI แทนที่จะเป็น Co-pilot ที่ต้องบอกทุกขั้นตอน มันทำหน้าที่เหมือนทีมที่รับเป้าหมายแล้วจัดการเส้นทางเอง งานที่จะได้ประโยชน์สูงสุดคืองานที่ซับซ้อน มีหลายส่วนที่ต้อง integrate กัน หรือต้องการ Autonomous Session ยาวโดยไม่ต้องการคนดู ส่วนงานทั่วไปที่ Opus ทำได้ดีอยู่แล้ว ไม่มีเหตุผลต้องเปลี่ยน ช่วงก่อน 22 มิถุนายนเป็นโอกาสที่จะเอางานซับซ้อนที่สุดที่ค้างมานานมาลองจริงๆ ว่า Fable จะจัดการได้แค่ไหน