AI มีความสามารถในการเรียนรู้และเข้าใจข้อมูลได้ดี แต่ข้อจำกัดหลักของโมเดลทั่วไปคือ การไม่สามารถโต้ตอบ หรือ ปฏิสัมพันธ์ กับโลกภายนอกได้โดยตรง เช่น การค้นหาข้อมูลแบบเรียลไทม์ หรือ การส่งข้อมูลทางธุรกิจไปยังบริษัท Partner ด้วยเหตุนี้ “Agents” จึงถูกพัฒนาเพื่อทำให้ AI สามารถคิด วิเคราะห์ และลงมือทำโดยอัตโนมัติได้ โดยใช้ชุดเครื่องมือ (Tools) ที่มีอยู่เพื่อให้ AI ตอบสนองต่อสถานการณ์ต่าง ๆ ได้อย่างมีประสิทธิภาพมากขึ้น มาลองเข้าใจรายละเอียดเพื่อปรับตัวเข้ากับเทรนด์ใหม่ของ AI กันครับ
Agents คืออะไร?
Agents เป็นซอฟต์แวร์ที่ใช้ AI ในการรับข้อมูล วิเคราะห์ และกระทำการตามเป้าหมายที่กำหนด สามารถทำงานได้อย่างอิสระโดยไม่ต้องมีการแทรกแซงจากมนุษย์ และสามารถเรียนรู้และวางแผนการทำงานของตัวเองได้อย่างชาญฉลาด
องค์ประกอบหลักของ Agents ได้แก่:
- Model: ใช้โมเดลภาษาขั้นสูงในการตัดสินใจ
- Tools: เครื่องมือที่ช่วยให้ Agents โต้ตอบกับโลกภายนอก เช่น API
- Orchestration Layer: กระบวนการที่ช่วยควบคุมการตัดสินใจและการกระทำของ AI

โครงสร้างของ Agents
AI Agents มีระบบการทำงานที่ซับซ้อนโดยอาศัย Cognitive Architecture ที่สามารถวางแผนและดำเนินการได้เป็นลำดับขั้นตอน โดยแนวคิดการทำงานสามารถเปรียบเทียบกับ “เชฟ” ในครัวที่ต้องวางแผน ทำอาหาร และปรับสูตรตามสถานการณ์
แนวทางการคิดของ Agents มีหลายรูปแบบ เช่น:
- ReAct (Reasoning + Acting): คิด วิเคราะห์ และเลือกใช้เครื่องมือที่เหมาะสม
- Chain-of-Thought (CoT): แยกขั้นตอนการคิดเป็นลำดับเพื่อช่วยให้ AI ให้คำตอบที่ซับซ้อนได้ดีขึ้น
- Tree-of-Thoughts (ToT): ขยายแนวคิดจาก CoT ให้ AI สามารถสำรวจหลายแนวทางพร้อมกันเพื่อหาทางเลือกที่ดีที่สุด

ความแตกต่างระหว่าง Agents และ AI Models (Models คือตัวเก็บสิ่งที่ AI เรียนรู้)
| AI Models | Agents |
|---|---|
| ข้อมูลจำกัดอยู่ที่ข้อมูลการฝึก | สามารถเข้าถึงข้อมูลภายนอกแบบเรียลไทม์ผ่าน Tools |
| ตอบสนองต่อคำถามแต่ละครั้งแบบแยกส่วน | มีความต่อเนื่องของข้อมูล สนทนาได้หลายรอบ |
| ไม่สามารถโต้ตอบกับ API โดยตรง | มีการเชื่อมต่อกับ API เพื่อดำเนินการ |
| ไม่มีการคิดวิเคราะห์เชิงลึก | มีการใช้โครงสร้างการคิด เช่น ReAct และ Chain-of-Thought |
เครื่องมือที่ช่วยให้ Agents ทำงานได้ดีขึ้น
เครื่องมือ (Tools) เป็นกุญแจสำคัญที่ช่วยให้ Agents สามารถเข้าถึงข้อมูลใหม่และทำงานได้หลากหลายขึ้น ประเภทของ Tools ได้แก่:
- Extensions – เครื่องมือที่ช่วยให้ AI เชื่อมต่อกับ API เช่น Google Flights เพื่อดึงข้อมูลการเดินทาง
- Functions – ฟังก์ชันที่ช่วยให้ AI ทำงานได้เหมือนโค้ดที่มนุษย์เขียน เช่น คำนวณตัวเลข หรือตรวจสอบข้อมูล
- Data Stores – ระบบจัดเก็บข้อมูลเพื่อให้ AI ดึงข้อมูลที่เกี่ยวข้องมาใช้ได้ เช่น ฐานข้อมูลเอกสารและเว็บไซต์
ตัวอย่างการใช้งาน:
- AI ผู้ช่วยแนะนำการเดินทางสามารถใช้ Extensions ในการค้นหาตั๋วเครื่องบิน
- Functions สามารถช่วยแปลงข้อมูลที่ AI ได้รับให้อยู่ในรูปแบบที่เข้าใจง่ายขึ้น
- Data Stores ช่วยให้ AI สามารถเข้าถึงข้อมูลเชิงลึกได้โดยไม่ต้องฝึกโมเดลใหม่
และในปัจจุบัน เริ่มมีการนำเอา AI มาควบคุมคอมพิวเตอร์ หรือ Browser เพื่อให้ทำงานแทนเราได้มากขึ้นกว่าการทำงานผ่าน API
เช่น Claude Computer Use หรือ OpenAI Operator
ซึ่งจะทำให้ AI สามารถ ลงมือทำงานแทนเราได้ง่ายขึ้น เช่นแทนที่จะหาข้อมูลตั๋ว ก็สามารถจองได้เลย (ลองอ่าน AI ในปี 2025 กับอดีตในการพัฒนาการ)



สรุป
- Agents เป็น AI ที่สามารถทำงานได้อัตโนมัติ โดยใช้โมเดลภาษา + เครื่องมือ + โครงสร้างการคิด
- ความแตกต่างจาก AI Models ทั่วไป คือ Agents สามารถใช้เครื่องมือภายนอก วางแผน และตัดสินใจได้เอง (และจะควบคุมบางส่วนของคอมพิวเตอร์ได้ในอนาคต)
- เครื่องมือสำคัญของ Agents ได้แก่ Extensions, Functions และ Data Stores ที่ช่วยให้ AI มีความสามารถในการปฏิบัติงานที่ซับซ้อนได้
อนาคตของ Agents กำลังเปิดกว้าง และด้วยการผสานรวมเครื่องมือที่ดีขึ้น AI จะสามารถทำงานที่ซับซ้อนและสร้างสรรค์ได้มากขึ้น ซึ่งจะเป็นการเปลี่ยนแปลงวิธีที่เราทำงานและใช้ชีวิตในโลกดิจิตอล
สรุปย่อข้อมูลจากไฟล์ : https://www.kaggle.com/whitepaper-agents

ใส่ความเห็น