.webp)
Agentic AI สำหรับการวิเคราะห์ข้อมูลหลายขั้นตอน [White Paper]
1. บทนำ
ในยุคปัจจุบันที่การวิเคราะห์ข้อมูลมีการเปลี่ยนแปลงและพัฒนาอย่างรวดเร็ว ความต้องการระบบ AI ที่สามารถทำงานอย่างอัตโนมัติและเข้าใจคำถามที่ซับซ้อนก็ยิ่งเพิ่มขึ้นอย่างมีนัยสำคัญ โดยเฉพาะอย่างยิ่ง AI ที่สามารถเข้าถึงแหล่งข้อมูลที่หลากหลาย วิเคราะห์คำถามในเชิงลึก และสร้างข้อมูลเชิงลึก (insights) ที่ถูกต้องแม่นยำเพื่อช่วยในการตัดสินใจเชิงธุรกิจ
อย่างไรก็ตาม ระบบ AI ที่ใช้งานกันอยู่ในปัจจุบันจำนวนมากยังคงทำงานภายใต้กรอบของ “Single-Agent” หรือระบบที่มี Agent เพียงตัวเดียวในการรับผิดชอบทุกขั้นตอนของการวิเคราะห์ ซึ่งส่งผลให้ระบบเหล่านี้มักประสบปัญหาเมื่อต้องเผชิญกับโจทย์ที่ซับซ้อน เช่น การวิเคราะห์ที่มีหลายขั้นตอน หรือการปรับใช้เครื่องมือและฐานข้อมูลแบบไดนามิก
Whitepaper นี้จึงขอเสนอแนวทางใหม่ในรูปแบบ “Multi-Agent Architecture” หรือโครงสร้างระบบที่ประกอบด้วย Agent หลายตัว ซึ่งแต่ละตัวมีบทบาทและความเชี่ยวชาญเฉพาะด้าน ระบบนี้แบ่งการทำงานออกเป็น 3 ส่วนที่ทำงานร่วมกันอย่างเป็นระบบ ได้แก่
- Planner (ตัววางแผน)
- Executor (ตัวดำเนินการ)
- Feedbacker (ตัวประเมินและให้ข้อเสนอแนะ)
การออกแบบที่เป็นโมดูล (modular design) เช่นนี้ ทำให้ทุกขั้นตอน ตั้งแต่การแยกคำถามของผู้ใช้ไปจนถึงการตรวจสอบความถูกต้องของคำตอบ มีความชัดเจน โปร่งใส และสามารถตรวจสอบย้อนกลับได้ทุกขั้นตอน
จากการทดสอบเบื้องต้น เราพบว่า architecture ใหม่นี้สามารถทำผลงานได้อย่างยอดเยี่ยมเมื่อเทียบกับระบบอื่น ๆ โดยสามารถทำคะแนนได้สูงจากชุดข้อมูลมาตรฐาน และสร้างมาตรฐานใหม่ให้กับวงการวิเคราะห์ข้อมูลด้วย AI
ความท้าทาย: การก้าวข้ามข้อจำกัดของระบบ Agent เดี่ยว
โลกของข้อมูลในปัจจุบันเต็มไปด้วยความซับซ้อน ความหลากหลาย และการเปลี่ยนแปลงอยู่ตลอดเวลา แม้แต่คำถามทางธุรกิจที่ดูเรียบง่าย เช่น “ตลาดใดที่มีธุรกรรมฉ้อโกงมากที่สุดในขณะนี้?”
เบื้องหลังของคำถามนี้ จำเป็นต้องอาศัยการวิเคราะห์ที่มีหลายขั้นตอน ตั้งแต่การตีความเจตนาของผู้ใช้ การค้นหาและเลือกใช้ตารางข้อมูลหรือฟิลด์ที่เกี่ยวข้อง การสร้างคำสั่งค้นหาข้อมูล (query) ที่ถูกต้องแม่นยำ การประมวลผลข้อมูล และการแปลผลลัพธ์ให้เป็นคำตอบที่ชัดเจนและใช้งานได้จริง
ระบบ AI แบบ Single-Agent ซึ่งรวมทุกหน้าที่ไว้ใน agent เพียงตัวเดียว เช่น การวางแผน การประมวลผล และการให้เหตุผล อาจจะดูสะดวกในเชิงการออกแบบเบื้องต้น แต่ในทางปฏิบัติกลับสร้างปัญหาเรื่องความโปร่งใสของกระบวนการ ยากต่อการตรวจสอบ และไม่สามารถเจาะลึกหรือปรับเปลี่ยนแต่ละส่วนของกระบวนการได้อย่างยืดหยุ่น
เพื่อตอบโจทย์นี้ เราจึงพัฒนาแนวคิดใหม่ที่อาศัยหลักการ “แบ่งงานตามความเชี่ยวชาญ” โดยให้แต่ละ agent ทำหน้าที่ในส่วนที่ตนถนัดอย่างชัดเจน ผลลัพธ์ที่ได้คือระบบที่ทำงานได้แม่นยำขึ้น ตรวจสอบได้ง่ายขึ้น และรองรับการวิเคราะห์ข้อมูลที่ซับซ้อนได้ดีกว่าเดิมอย่างมีนัยสำคัญ
2. โครงสร้าง Multi-Agent ที่เราออกแบบ
โครงสร้างของเรามุ่งเน้นการแยกกระบวนการวิเคราะห์ข้อมูลออกเป็นบทบาทเฉพาะ 3 ส่วน โดยแต่ละ agent จะมีหน้าที่ที่ชัดเจนและเชี่ยวชาญในงานของตนเองอย่างแท้จริง การแยกความรับผิดชอบในลักษณะนี้ ช่วยให้แต่ละส่วนทำงานได้อย่างมีประสิทธิภาพสูงสุด ทั้งในแง่ของความแม่นยำ ความเร็ว และความสามารถในการตรวจสอบย้อนกลับเมื่อเกิดปัญหา
โครงสร้างการทำงานโดยรวมถูกออกแบบให้อยู่ในรูปแบบของ “Pipeline” หรือกระบวนการที่เป็นลำดับขั้นอย่างชัดเจน ตั้งแต่การรับคำถามของผู้ใช้ ไปจนถึงการส่งมอบคำตอบที่ผ่านการตรวจสอบแล้ว เพื่อให้แน่ใจว่าทุกขั้นตอนมีตรรกะที่ต่อเนื่อง โปร่งใส และสามารถควบคุมได้อย่างเป็นระบบ

2.1 The Planner
เมื่อผู้ใช้ส่งคำถามเข้ามา จุดเริ่มต้นแรกที่ระบบจะทำงานคือผ่าน Agent ตัวแรกที่เรียกว่า Planner ซึ่งไม่ได้มีหน้าที่ตอบคำถามโดยตรงแต่จะวางแผนกลยุทธ์แบบเป็นขั้นเป็นตอน โดยมีองค์ประกอบหลัก 4 ขั้นตอน ดังนี้:
- การแยกย่อยคำถาม (Deconstruct the Question)
แยกคำถามของผู้ใช้ให้เป็นปัญหาย่อยที่สามารถจัดการได้ง่ายขึ้น ช่วยให้ระบบเข้าใจแต่ละองค์ประกอบของคำถามได้อย่างแม่นยำ - ระบุคำสำคัญในคำถาม (Extract Entities)
ตรวจจับและดึงข้อมูลสำคัญจากคำถาม เช่น คีย์เวิร์ด ตัวแปร หรือเงื่อนไขที่ต้องวิเคราะห์ (เช่น ip_country, fraud) - การสำรวจและกำหนดขอบเขต (Explore and Constrain)
สำรวจโครงสร้างของข้อมูล (Data Schema) เพื่อเข้าใจรูปแบบและข้อจำกัดของข้อมูลที่ใช้ ซึ่งช่วยหลีกเลี่ยงการสร้าง query ที่ผิดพลาดหรือไม่มีประสิทธิภาพในขั้นตอนต่อไป - การวางแนวทางการแก้ปัญหา (Outline the Solution Approach)
สร้างแผนการที่ชัดเจนว่าควรใช้เครื่องมือใด ในลำดับแบบใด เพื่อให้ได้คำตอบที่ถูกต้อง โดย Planner สามารถเลือกจากเครื่องมือหลากหลาย เช่น:
- Text-to-SQL Engine: ใช้แปลงข้อความให้เป็นคำสั่ง SQL เพื่อดึงข้อมูลจากฐานข้อมูล
- Code Interpreter: ใช้เขียนและรันโค้ด Python เพื่อคำนวณหรือแปลงข้อมูลขั้นสูง
- Search Engine: ใช้ค้นหาข้อมูลภายนอกเพื่อเสริมบริบท
- MCP Server (Model Context Protocol Server): ใช้เชื่อมต่อกับแหล่งข้อมูลเฉพาะขององค์กร
2.2 The Executor
หลังจากที่ได้แผนการจาก Planner แล้ว Agent ถัดไปคือ Executor ซึ่งมีหน้าที่นำแผนไปปฏิบัติอย่างเป็นขั้นตอน โดยใช้หลักการที่เรียกว่า ReAct (Reasoning and Action) ซึ่งเป็นการสลับระหว่าง “การคิดวิเคราะห์” และ “การลงมือทำ” ในแต่ละขั้นแบบต่อเนื่อง
Executor ไม่ได้ทำงานแบบครั้งเดียวจบ แต่เป็นกระบวนการหลายขั้นตอนที่เชื่อมโยงกัน ยกตัวอย่างเช่น:
- ขั้นแรก: ดึงรายการสินค้าที่ขายดีที่สุด
- ขั้นถัดมา: ใช้ผลลัพธ์จากขั้นแรกมาเป็นบริบท เพื่อวิเคราะห์กลุ่มลูกค้าที่ซื้อสินค้านั้น
รูปแบบการทำงานแบบวนซ้ำเช่นนี้ ช่วยให้ Executor สามารถวิเคราะห์ปัญหาที่ซับซ้อนได้ แก้ไขข้อผิดพลาดได้ระหว่างทาง และสามารถปรับกลยุทธ์แบบไดนามิกโดยยังคงอยู่ในกรอบของแผนเดิมที่วางไว้ หากระบบเจอ query ที่ผิดพลาดหรือผลลัพธ์ไม่เป็นไปตามคาด Executor จะสามารถวิเคราะห์สาเหตุและเปลี่ยนแนวทางการปฏิบัติได้อย่างชาญฉลาด โดยไม่หลุดจากโครงสร้างหลักของแผนที่วางไว้
2.3 The Feedbacker
เมื่อ Executor ส่งมอบคำตอบสุดท้ายแล้ว Agent ตัวที่สามคือ Feedbacker จะเข้ามามีบทบาทในขั้นตอนสุดท้าย โดยทำหน้าที่เหมือน “ระบบควบคุมคุณภาพอัตโนมัติ”
Feedbacker จะดูทั้งคำถามต้นฉบับและคำตอบที่ระบบสร้างขึ้น เพื่อตรวจสอบว่า:
- คำตอบถูกต้องหรือไม่
- รูปแบบของคำตอบเหมาะสมหรือไม่
- ตรงกับเจตนาของคำถามหรือไม่
จากนั้นจะให้ “คะแนน” (Reward Score) กับแต่ละคำตอบ โดยใช้เกณฑ์เหล่านี้ ซึ่งมีบทบาทสำคัญในการ:
- ประเมินประสิทธิภาพของระบบโดยรวม
- เก็บข้อมูลเพื่อการเรียนรู้ของระบบ (Reinforcement Learning)
- วิเคราะห์และพัฒนาระบบให้ดีขึ้นในอนาคต
3. ประสิทธิภาพและการเปรียบเทียบกับระบบอื่น
เราได้นำโครงสร้างนี้ไปทดสอบกับ DABStep benchmark ซึ่งเป็นชุดทดสอบที่ออกแบบมาเพื่อวัดความสามารถของ AI ในการวิเคราะห์ข้อมูลแบบหลายขั้นตอน จากแหล่งข้อมูลที่หลากหลาย
ผลลัพธ์ที่ได้ชี้ชัดว่าแนวทาง Multi-Agent นี้ทำงานได้อย่างยอดเยี่ยม ไม่ใช่แค่ในแง่ของประสิทธิภาพโดยรวมเท่านั้น แต่ยังสามารถแข่งขันกับระบบ AI ชั้นนำอื่น ๆ ในอุตสาหกรรมได้อย่างสูสีหรือเหนือกว่า
ตารางเปรียบเทียบประสิทธิภาพของ AI Agents ในระดับโจทย์ง่ายและยาก


การเปรียบเทียบประสิทธิภาพในมาตรฐาน DABstep
Agent ของเราทำคะแนนได้สูงที่สุดทั้งในกลุ่มโจทย์ระดับง่ายและระดับยาก ซึ่งสะท้อนถึงศักยภาพในการวิเคราะห์ที่เหนือกว่าอย่างชัดเจน โดยเฉพาะในกลุ่มโจทย์ที่มีความซับซ้อน Agent ของเราทำความแม่นยำได้ถึง 41.01% ซึ่งสูงกว่าผู้เข้าแข่งขันรายอื่นอย่างมีนัยสำคัญ เป็นข้อพิสูจน์ถึงประสิทธิภาพของสถาปัตยกรรมแบบ Planner – Executor – Feedbacker ที่ถูกออกแบบมาเพื่อรองรับงานวิเคราะห์ที่มีหลายขั้นตอนและต้องใช้เหตุผลแบบลำดับชั้น
แม้ว่า Agent จาก Mphasis จะสามารถทำคะแนนได้เท่ากับเราบนโจทย์ระดับง่าย แต่เมื่อความซับซ้อนของโจทย์เพิ่มขึ้น สถาปัตยกรรมของเรากลับแสดงให้เห็นถึงข้อได้เปรียบที่ชัดเจนมากขึ้น
สามารถดูรายละเอียดผลการทดสอบของเราได้ที่นี่

4. สรุปและแนวทางการพัฒนาต่อ
โครงสร้างแบบ Planner – Executor – Feedbacker ที่เราออกแบบมานี้ ถือเป็นก้าวสำคัญของการพัฒนา Agent ด้านการวิเคราะห์ข้อมูลที่มีความฉลาด เชื่อถือได้ และโปร่งใสในกระบวนการทำงาน การแบ่งบทบาทอย่างชัดเจนในแต่ละส่วนช่วยให้แต่ละองค์ประกอบทำหน้าที่ได้อย่างมีประสิทธิภาพสูงสุด ส่งผลให้ได้ผลลัพธ์ในระดับ State-of-the-Art ซึ่งสามารถแข่งขันกับระบบชั้นนำในอุตสาหกรรมได้อย่างเต็มที่
ในอนาคต เราจะมุ่งเน้นการพัฒนาเพิ่มเติมใน 2 ด้านหลัก ดังนี้:
- เพิ่มศักยภาพด้านการวางกลยุทธ์ของ Planner
โดยจะปรับปรุงความสามารถของ Planner ให้สามารถจัดการกับโจทย์ที่ซับซ้อนยิ่งขึ้น ด้วยการสังเคราะห์และปรับจูนโมเดลผ่านเทคนิค GRPO และ Test-Time Reinforcement Learning โดยใช้ Grader ซึ่งพัฒนาขึ้นจากข้อมูลจริงของนักวิเคราะห์ข้อมูลมืออาชีพ (อ้างอิง Ref1, Ref2) - ขยายความสามารถของ Executor
ให้รองรับเครื่องมือเพิ่มเติม เช่น ไลบรารีการวิเคราะห์เชิงสถิติขั้นสูง และเครื่องมือสร้าง Visualization เพื่อให้สามารถนำเสนอข้อมูลในรูปแบบที่เข้าใจง่ายและลึกซึ้งยิ่งขึ้น
ดาวน์โหลด PDF: link
สนใจร่วมเป็นส่วนหนึ่งกับ AI Labs ของเราได้ที่นี่