Generative AI

Wachiravit Modecrua

นาที อ่าน

June 23, 2025

Agentic AI สำหรับการวิเคราะห์ข้อมูลหลายขั้นตอน [White Paper]

1. บทนำ

ในยุคปัจจุบันที่การวิเคราะห์ข้อมูลมีการเปลี่ยนแปลงและพัฒนาอย่างรวดเร็ว ความต้องการระบบ AI ที่สามารถทำงานอย่างอัตโนมัติและเข้าใจคำถามที่ซับซ้อนก็ยิ่งเพิ่มขึ้นอย่างมีนัยสำคัญ โดยเฉพาะอย่างยิ่ง AI ที่สามารถเข้าถึงแหล่งข้อมูลที่หลากหลาย วิเคราะห์คำถามในเชิงลึก และสร้างข้อมูลเชิงลึก (insights) ที่ถูกต้องแม่นยำเพื่อช่วยในการตัดสินใจเชิงธุรกิจ

อย่างไรก็ตาม ระบบ AI ที่ใช้งานกันอยู่ในปัจจุบันจำนวนมากยังคงทำงานภายใต้กรอบของ “Single-Agent” หรือระบบที่มี Agent เพียงตัวเดียวในการรับผิดชอบทุกขั้นตอนของการวิเคราะห์ ซึ่งส่งผลให้ระบบเหล่านี้มักประสบปัญหาเมื่อต้องเผชิญกับโจทย์ที่ซับซ้อน เช่น การวิเคราะห์ที่มีหลายขั้นตอน หรือการปรับใช้เครื่องมือและฐานข้อมูลแบบไดนามิก

Whitepaper นี้จึงขอเสนอแนวทางใหม่ในรูปแบบ “Multi-Agent Architecture” หรือโครงสร้างระบบที่ประกอบด้วย Agent หลายตัว ซึ่งแต่ละตัวมีบทบาทและความเชี่ยวชาญเฉพาะด้าน ระบบนี้แบ่งการทำงานออกเป็น 3 ส่วนที่ทำงานร่วมกันอย่างเป็นระบบ ได้แก่

Planner (ตัววางแผน)
Executor (ตัวดำเนินการ)
Feedbacker (ตัวประเมินและให้ข้อเสนอแนะ)

การออกแบบที่เป็นโมดูล (modular design) เช่นนี้ ทำให้ทุกขั้นตอน ตั้งแต่การแยกคำถามของผู้ใช้ไปจนถึงการตรวจสอบความถูกต้องของคำตอบ มีความชัดเจน โปร่งใส และสามารถตรวจสอบย้อนกลับได้ทุกขั้นตอน

จากการทดสอบเบื้องต้น เราพบว่า architecture ใหม่นี้สามารถทำผลงานได้อย่างยอดเยี่ยมเมื่อเทียบกับระบบอื่น ๆ โดยสามารถทำคะแนนได้สูงจากชุดข้อมูลมาตรฐาน และสร้างมาตรฐานใหม่ให้กับวงการวิเคราะห์ข้อมูลด้วย AI

ความท้าทาย: การก้าวข้ามข้อจำกัดของระบบ Agent เดี่ยว

โลกของข้อมูลในปัจจุบันเต็มไปด้วยความซับซ้อน ความหลากหลาย และการเปลี่ยนแปลงอยู่ตลอดเวลา แม้แต่คำถามทางธุรกิจที่ดูเรียบง่าย เช่น “ตลาดใดที่มีธุรกรรมฉ้อโกงมากที่สุดในขณะนี้?”
เบื้องหลังของคำถามนี้ จำเป็นต้องอาศัยการวิเคราะห์ที่มีหลายขั้นตอน ตั้งแต่การตีความเจตนาของผู้ใช้ การค้นหาและเลือกใช้ตารางข้อมูลหรือฟิลด์ที่เกี่ยวข้อง การสร้างคำสั่งค้นหาข้อมูล (query) ที่ถูกต้องแม่นยำ การประมวลผลข้อมูล และการแปลผลลัพธ์ให้เป็นคำตอบที่ชัดเจนและใช้งานได้จริง

ระบบ AI แบบ Single-Agent ซึ่งรวมทุกหน้าที่ไว้ใน agent เพียงตัวเดียว เช่น การวางแผน การประมวลผล และการให้เหตุผล อาจจะดูสะดวกในเชิงการออกแบบเบื้องต้น แต่ในทางปฏิบัติกลับสร้างปัญหาเรื่องความโปร่งใสของกระบวนการ ยากต่อการตรวจสอบ และไม่สามารถเจาะลึกหรือปรับเปลี่ยนแต่ละส่วนของกระบวนการได้อย่างยืดหยุ่น

เพื่อตอบโจทย์นี้ เราจึงพัฒนาแนวคิดใหม่ที่อาศัยหลักการ “แบ่งงานตามความเชี่ยวชาญ” โดยให้แต่ละ agent ทำหน้าที่ในส่วนที่ตนถนัดอย่างชัดเจน ผลลัพธ์ที่ได้คือระบบที่ทำงานได้แม่นยำขึ้น ตรวจสอบได้ง่ายขึ้น และรองรับการวิเคราะห์ข้อมูลที่ซับซ้อนได้ดีกว่าเดิมอย่างมีนัยสำคัญ

2. โครงสร้าง Multi-Agent ที่เราออกแบบ

โครงสร้างของเรามุ่งเน้นการแยกกระบวนการวิเคราะห์ข้อมูลออกเป็นบทบาทเฉพาะ 3 ส่วน โดยแต่ละ agent จะมีหน้าที่ที่ชัดเจนและเชี่ยวชาญในงานของตนเองอย่างแท้จริง การแยกความรับผิดชอบในลักษณะนี้ ช่วยให้แต่ละส่วนทำงานได้อย่างมีประสิทธิภาพสูงสุด ทั้งในแง่ของความแม่นยำ ความเร็ว และความสามารถในการตรวจสอบย้อนกลับเมื่อเกิดปัญหา

โครงสร้างการทำงานโดยรวมถูกออกแบบให้อยู่ในรูปแบบของ “Pipeline” หรือกระบวนการที่เป็นลำดับขั้นอย่างชัดเจน ตั้งแต่การรับคำถามของผู้ใช้ ไปจนถึงการส่งมอบคำตอบที่ผ่านการตรวจสอบแล้ว เพื่อให้แน่ใจว่าทุกขั้นตอนมีตรรกะที่ต่อเนื่อง โปร่งใส และสามารถควบคุมได้อย่างเป็นระบบ

แผนผังขั้นตอนการทำงานที่แสดงสถาปัตยกรรม Planner, Executor และ Feedbacker พร้อมเอเจนต์ AI และเครื่องมือต่างๆ รวมถึง SQL NLQ Engine, Search Engine, Code Interpreter และ MCP Server — ภาพรวมของโครงสรา้งระบบวางแผน ดำเนินการ และให้ข้อมูลป้อนกลับ

2.1 The Planner

เมื่อผู้ใช้ส่งคำถามเข้ามา จุดเริ่มต้นแรกที่ระบบจะทำงานคือผ่าน Agent ตัวแรกที่เรียกว่า Planner ซึ่งไม่ได้มีหน้าที่ตอบคำถามโดยตรงแต่จะวางแผนกลยุทธ์แบบเป็นขั้นเป็นตอน โดยมีองค์ประกอบหลัก 4 ขั้นตอน ดังนี้:

การแยกย่อยคำถาม (Deconstruct the Question)
แยกคำถามของผู้ใช้ให้เป็นปัญหาย่อยที่สามารถจัดการได้ง่ายขึ้น ช่วยให้ระบบเข้าใจแต่ละองค์ประกอบของคำถามได้อย่างแม่นยำ
ระบุคำสำคัญในคำถาม (Extract Entities)
ตรวจจับและดึงข้อมูลสำคัญจากคำถาม เช่น คีย์เวิร์ด ตัวแปร หรือเงื่อนไขที่ต้องวิเคราะห์ (เช่น ip_country, fraud)
การสำรวจและกำหนดขอบเขต (Explore and Constrain)
สำรวจโครงสร้างของข้อมูล (Data Schema) เพื่อเข้าใจรูปแบบและข้อจำกัดของข้อมูลที่ใช้ ซึ่งช่วยหลีกเลี่ยงการสร้าง query ที่ผิดพลาดหรือไม่มีประสิทธิภาพในขั้นตอนต่อไป
การวางแนวทางการแก้ปัญหา (Outline the Solution Approach)
สร้างแผนการที่ชัดเจนว่าควรใช้เครื่องมือใด ในลำดับแบบใด เพื่อให้ได้คำตอบที่ถูกต้อง โดย Planner สามารถเลือกจากเครื่องมือหลากหลาย เช่น:
- Text-to-SQL Engine: ใช้แปลงข้อความให้เป็นคำสั่ง SQL เพื่อดึงข้อมูลจากฐานข้อมูล
- Code Interpreter: ใช้เขียนและรันโค้ด Python เพื่อคำนวณหรือแปลงข้อมูลขั้นสูง
- Search Engine: ใช้ค้นหาข้อมูลภายนอกเพื่อเสริมบริบท
- MCP Server (Model Context Protocol Server): ใช้เชื่อมต่อกับแหล่งข้อมูลเฉพาะขององค์กร

2.2 The Executor

หลังจากที่ได้แผนการจาก Planner แล้ว Agent ถัดไปคือ Executor ซึ่งมีหน้าที่นำแผนไปปฏิบัติอย่างเป็นขั้นตอน โดยใช้หลักการที่เรียกว่า ReAct (Reasoning and Action) ซึ่งเป็นการสลับระหว่าง “การคิดวิเคราะห์” และ “การลงมือทำ” ในแต่ละขั้นแบบต่อเนื่อง

Executor ไม่ได้ทำงานแบบครั้งเดียวจบ แต่เป็นกระบวนการหลายขั้นตอนที่เชื่อมโยงกัน ยกตัวอย่างเช่น:

ขั้นแรก: ดึงรายการสินค้าที่ขายดีที่สุด
ขั้นถัดมา: ใช้ผลลัพธ์จากขั้นแรกมาเป็นบริบท เพื่อวิเคราะห์กลุ่มลูกค้าที่ซื้อสินค้านั้น

รูปแบบการทำงานแบบวนซ้ำเช่นนี้ ช่วยให้ Executor สามารถวิเคราะห์ปัญหาที่ซับซ้อนได้ แก้ไขข้อผิดพลาดได้ระหว่างทาง และสามารถปรับกลยุทธ์แบบไดนามิกโดยยังคงอยู่ในกรอบของแผนเดิมที่วางไว้ หากระบบเจอ query ที่ผิดพลาดหรือผลลัพธ์ไม่เป็นไปตามคาด Executor จะสามารถวิเคราะห์สาเหตุและเปลี่ยนแนวทางการปฏิบัติได้อย่างชาญฉลาด โดยไม่หลุดจากโครงสร้างหลักของแผนที่วางไว้

2.3 The Feedbacker

เมื่อ Executor ส่งมอบคำตอบสุดท้ายแล้ว Agent ตัวที่สามคือ Feedbacker จะเข้ามามีบทบาทในขั้นตอนสุดท้าย โดยทำหน้าที่เหมือน “ระบบควบคุมคุณภาพอัตโนมัติ”

Feedbacker จะดูทั้งคำถามต้นฉบับและคำตอบที่ระบบสร้างขึ้น เพื่อตรวจสอบว่า:

คำตอบถูกต้องหรือไม่
รูปแบบของคำตอบเหมาะสมหรือไม่
ตรงกับเจตนาของคำถามหรือไม่

จากนั้นจะให้ “คะแนน” (Reward Score) กับแต่ละคำตอบ โดยใช้เกณฑ์เหล่านี้ ซึ่งมีบทบาทสำคัญในการ:

ประเมินประสิทธิภาพของระบบโดยรวม
เก็บข้อมูลเพื่อการเรียนรู้ของระบบ (Reinforcement Learning)
วิเคราะห์และพัฒนาระบบให้ดีขึ้นในอนาคต

3. ประสิทธิภาพและการเปรียบเทียบกับระบบอื่น

เราได้นำโครงสร้างนี้ไปทดสอบกับ DABStep benchmark ซึ่งเป็นชุดทดสอบที่ออกแบบมาเพื่อวัดความสามารถของ AI ในการวิเคราะห์ข้อมูลแบบหลายขั้นตอน จากแหล่งข้อมูลที่หลากหลาย

ผลลัพธ์ที่ได้ชี้ชัดว่าแนวทาง Multi-Agent นี้ทำงานได้อย่างยอดเยี่ยม ไม่ใช่แค่ในแง่ของประสิทธิภาพโดยรวมเท่านั้น แต่ยังสามารถแข่งขันกับระบบ AI ชั้นนำอื่น ๆ ในอุตสาหกรรมได้อย่างสูสีหรือเหนือกว่า

ตารางเปรียบเทียบประสิทธิภาพของ AI Agents ในระดับโจทย์ง่ายและยาก

ตารางเปรียบเทียบประสิทธิภาพที่แสดงเอเจนต์ AI และโมเดลต่างๆ พร้อมเปอร์เซ็นต์ความแม่นยำในระดับง่ายและระดับยากในมาตรฐาน DABstep — การเปรียบเทียบประสิทธิภาพในมาตรฐาน DABstep

กราฟแท่งเปรียบเทียบประสิทธิภาพเอเจนต์หลายขั้นตอนของโมเดล AI ต่างๆ แสดงเปอร์เซ็นต์ความแม่นยำระดับง่าย (เขียว) และระดับยาก (แดง) — *การเปรียบเทียบประสิทธิภาพในมาตรฐาน DABstep*

การเปรียบเทียบประสิทธิภาพในมาตรฐาน DABstep

Agent ของเราทำคะแนนได้สูงที่สุดทั้งในกลุ่มโจทย์ระดับง่ายและระดับยาก ซึ่งสะท้อนถึงศักยภาพในการวิเคราะห์ที่เหนือกว่าอย่างชัดเจน โดยเฉพาะในกลุ่มโจทย์ที่มีความซับซ้อน Agent ของเราทำความแม่นยำได้ถึง 41.01% ซึ่งสูงกว่าผู้เข้าแข่งขันรายอื่นอย่างมีนัยสำคัญ เป็นข้อพิสูจน์ถึงประสิทธิภาพของสถาปัตยกรรมแบบ Planner – Executor – Feedbacker ที่ถูกออกแบบมาเพื่อรองรับงานวิเคราะห์ที่มีหลายขั้นตอนและต้องใช้เหตุผลแบบลำดับชั้น

แม้ว่า Agent จาก Mphasis จะสามารถทำคะแนนได้เท่ากับเราบนโจทย์ระดับง่าย แต่เมื่อความซับซ้อนของโจทย์เพิ่มขึ้น สถาปัตยกรรมของเรากลับแสดงให้เห็นถึงข้อได้เปรียบที่ชัดเจนมากขึ้น

สามารถดูรายละเอียดผลการทดสอบของเราได้ที่นี่

ภาพหน้าจอส่วนติดต่อฐานข้อมูลที่แสดงการส่งข้อมูลของ Amity DA Agent v0.1 พร้อม ID งาน คำตอบของเอเจนต์ และคอลัมน์ข้อมูลเมตาต่างๆ — *ข้อมูลอ้างอิงของผลลัพธ์ DABStep ของเรา*

4. สรุปและแนวทางการพัฒนาต่อ

โครงสร้างแบบ Planner – Executor – Feedbacker ที่เราออกแบบมานี้ ถือเป็นก้าวสำคัญของการพัฒนา Agent ด้านการวิเคราะห์ข้อมูลที่มีความฉลาด เชื่อถือได้ และโปร่งใสในกระบวนการทำงาน การแบ่งบทบาทอย่างชัดเจนในแต่ละส่วนช่วยให้แต่ละองค์ประกอบทำหน้าที่ได้อย่างมีประสิทธิภาพสูงสุด ส่งผลให้ได้ผลลัพธ์ในระดับ State-of-the-Art ซึ่งสามารถแข่งขันกับระบบชั้นนำในอุตสาหกรรมได้อย่างเต็มที่

ในอนาคต เราจะมุ่งเน้นการพัฒนาเพิ่มเติมใน 2 ด้านหลัก ดังนี้:

เพิ่มศักยภาพด้านการวางกลยุทธ์ของ Planner
โดยจะปรับปรุงความสามารถของ Planner ให้สามารถจัดการกับโจทย์ที่ซับซ้อนยิ่งขึ้น ด้วยการสังเคราะห์และปรับจูนโมเดลผ่านเทคนิค GRPO และ Test-Time Reinforcement Learning โดยใช้ Grader ซึ่งพัฒนาขึ้นจากข้อมูลจริงของนักวิเคราะห์ข้อมูลมืออาชีพ (อ้างอิง Ref1, Ref2)
ขยายความสามารถของ Executor
ให้รองรับเครื่องมือเพิ่มเติม เช่น ไลบรารีการวิเคราะห์เชิงสถิติขั้นสูง และเครื่องมือสร้าง Visualization เพื่อให้สามารถนำเสนอข้อมูลในรูปแบบที่เข้าใจง่ายและลึกซึ้งยิ่งขึ้น

‍

ดาวน์โหลด PDF: link

‍

สนใจร่วมเป็นส่วนหนึ่งกับ AI Labs ของเราได้ที่นี่

สอบถามพนักงานขาย

Agentic AI สำหรับการวิเคราะห์ข้อมูลหลายขั้นตอน [White Paper]

1. บทนำ

ความท้าทาย: การก้าวข้ามข้อจำกัดของระบบ Agent เดี่ยว