ASHIFT AI

เทรนด์ใหม่ของ AI – Agents คืออะไร สรุปจากไฟล์ White Paper ของ Google

AI Agents

AI มีความสามารถในการเรียนรู้และเข้าใจข้อมูลได้ดี แต่ข้อจำกัดหลักของโมเดลทั่วไปคือ การไม่สามารถโต้ตอบ หรือ ปฏิสัมพันธ์ กับโลกภายนอกได้โดยตรง เช่น การค้นหาข้อมูลแบบเรียลไทม์ หรือ การส่งข้อมูลทางธุรกิจไปยังบริษัท Partner ด้วยเหตุนี้ “Agents” จึงถูกพัฒนาเพื่อทำให้ AI สามารถคิด วิเคราะห์ และลงมือทำโดยอัตโนมัติได้ โดยใช้ชุดเครื่องมือ (Tools) ที่มีอยู่เพื่อให้ AI ตอบสนองต่อสถานการณ์ต่าง ๆ ได้อย่างมีประสิทธิภาพมากขึ้น มาลองเข้าใจรายละเอียดเพื่อปรับตัวเข้ากับเทรนด์ใหม่ของ AI กันครับ

Agents คืออะไร?

Agents เป็นซอฟต์แวร์ที่ใช้ AI ในการรับข้อมูล วิเคราะห์ และกระทำการตามเป้าหมายที่กำหนด สามารถทำงานได้อย่างอิสระโดยไม่ต้องมีการแทรกแซงจากมนุษย์ และสามารถเรียนรู้และวางแผนการทำงานของตัวเองได้อย่างชาญฉลาด

องค์ประกอบหลักของ Agents ได้แก่:

  • Model: ใช้โมเดลภาษาขั้นสูงในการตัดสินใจ
  • Tools: เครื่องมือที่ช่วยให้ Agents โต้ตอบกับโลกภายนอก เช่น API
  • Orchestration Layer: กระบวนการที่ช่วยควบคุมการตัดสินใจและการกระทำของ AI

โครงสร้างของ Agents

AI Agents มีระบบการทำงานที่ซับซ้อนโดยอาศัย Cognitive Architecture ที่สามารถวางแผนและดำเนินการได้เป็นลำดับขั้นตอน โดยแนวคิดการทำงานสามารถเปรียบเทียบกับ “เชฟ” ในครัวที่ต้องวางแผน ทำอาหาร และปรับสูตรตามสถานการณ์

แนวทางการคิดของ Agents มีหลายรูปแบบ เช่น:

  • ReAct (Reasoning + Acting): คิด วิเคราะห์ และเลือกใช้เครื่องมือที่เหมาะสม
  • Chain-of-Thought (CoT): แยกขั้นตอนการคิดเป็นลำดับเพื่อช่วยให้ AI ให้คำตอบที่ซับซ้อนได้ดีขึ้น
  • Tree-of-Thoughts (ToT): ขยายแนวคิดจาก CoT ให้ AI สามารถสำรวจหลายแนวทางพร้อมกันเพื่อหาทางเลือกที่ดีที่สุด

ความแตกต่างระหว่าง Agents และ AI Models (Models คือตัวเก็บสิ่งที่ AI เรียนรู้)

AI ModelsAgents
ข้อมูลจำกัดอยู่ที่ข้อมูลการฝึกสามารถเข้าถึงข้อมูลภายนอกแบบเรียลไทม์ผ่าน Tools
ตอบสนองต่อคำถามแต่ละครั้งแบบแยกส่วนมีความต่อเนื่องของข้อมูล สนทนาได้หลายรอบ
ไม่สามารถโต้ตอบกับ API โดยตรงมีการเชื่อมต่อกับ API เพื่อดำเนินการ
ไม่มีการคิดวิเคราะห์เชิงลึกมีการใช้โครงสร้างการคิด เช่น ReAct และ Chain-of-Thought

เครื่องมือที่ช่วยให้ Agents ทำงานได้ดีขึ้น

เครื่องมือ (Tools) เป็นกุญแจสำคัญที่ช่วยให้ Agents สามารถเข้าถึงข้อมูลใหม่และทำงานได้หลากหลายขึ้น ประเภทของ Tools ได้แก่:

  1. Extensions – เครื่องมือที่ช่วยให้ AI เชื่อมต่อกับ API เช่น Google Flights เพื่อดึงข้อมูลการเดินทาง
  2. Functions – ฟังก์ชันที่ช่วยให้ AI ทำงานได้เหมือนโค้ดที่มนุษย์เขียน เช่น คำนวณตัวเลข หรือตรวจสอบข้อมูล
  3. Data Stores – ระบบจัดเก็บข้อมูลเพื่อให้ AI ดึงข้อมูลที่เกี่ยวข้องมาใช้ได้ เช่น ฐานข้อมูลเอกสารและเว็บไซต์

ตัวอย่างการใช้งาน:

  • AI ผู้ช่วยแนะนำการเดินทางสามารถใช้ Extensions ในการค้นหาตั๋วเครื่องบิน
  • Functions สามารถช่วยแปลงข้อมูลที่ AI ได้รับให้อยู่ในรูปแบบที่เข้าใจง่ายขึ้น
  • Data Stores ช่วยให้ AI สามารถเข้าถึงข้อมูลเชิงลึกได้โดยไม่ต้องฝึกโมเดลใหม่

และในปัจจุบัน เริ่มมีการนำเอา AI มาควบคุมคอมพิวเตอร์ หรือ Browser เพื่อให้ทำงานแทนเราได้มากขึ้นกว่าการทำงานผ่าน API

เช่น Claude Computer Use หรือ OpenAI Operator

ซึ่งจะทำให้ AI สามารถ ลงมือทำงานแทนเราได้ง่ายขึ้น เช่นแทนที่จะหาข้อมูลตั๋ว ก็สามารถจองได้เลย (ลองอ่าน AI ในปี 2025 กับอดีตในการพัฒนาการ)



สรุป

  • Agents เป็น AI ที่สามารถทำงานได้อัตโนมัติ โดยใช้โมเดลภาษา + เครื่องมือ + โครงสร้างการคิด
  • ความแตกต่างจาก AI Models ทั่วไป คือ Agents สามารถใช้เครื่องมือภายนอก วางแผน และตัดสินใจได้เอง (และจะควบคุมบางส่วนของคอมพิวเตอร์ได้ในอนาคต)
  • เครื่องมือสำคัญของ Agents ได้แก่ Extensions, Functions และ Data Stores ที่ช่วยให้ AI มีความสามารถในการปฏิบัติงานที่ซับซ้อนได้

อนาคตของ Agents กำลังเปิดกว้าง และด้วยการผสานรวมเครื่องมือที่ดีขึ้น AI จะสามารถทำงานที่ซับซ้อนและสร้างสรรค์ได้มากขึ้น ซึ่งจะเป็นการเปลี่ยนแปลงวิธีที่เราทำงานและใช้ชีวิตในโลกดิจิตอล

สรุปย่อข้อมูลจากไฟล์ : https://www.kaggle.com/whitepaper-agents


Discover more from ASHIFT AI

Subscribe to get the latest posts sent to your email.

Comments

ใส่ความเห็น