ถ้าเทียบการพัฒนาของ AI
AI ในปี 2022-2023 คือปีของการให้ลองพูด เราได้ ChatGPT 3.5 – GPT-4 มา
AI ในปี 2024 พูดเก่งแล้ว ให้เริ่มมองเห็น ฟังเสียง และ เริ่มหัดคิด ได้ 4o และ o1 / o1 pro มา
AI ในปี 2025 พอคิดพอได้ (รอดู o3) ก็ให้เริ่มลงมือทำงานง่ายๆ และ ยังพัฒนาให้คิดได้ดีขึ้น
ต่อจากนี้คือ AI จะวางแผนงาน ลงมือทำ และ ใช้ร่างกาย (Robot) ทำงานแทนมนุษย์บางส่วนได้
ปี 2024 – 2025 เป็นต้นมาเริ่มมองเห็น AI ที่พัฒนามาลงมือทำงานง่ายๆ บางอย่างได้ (แต่ยังไม่แม่นมาก)
.
2025 น่าจะเห็น Agent มาเป็นโขยง
.
ก่อนหน้านี้ OpenAI เปิดตัว Tasks ให้เราตั้งเวลา ให้ AI ทำงานตามตารางที่เราตั้งได้
.
ล่าสุด OpenAI เปิดตัว Operator ก็คือเอา GPT-4o ที่เริ่มมองเห็น สามารถลงมือทำอะไรที่มีหลายขึ้นขึ้นเช่น สั่งอาหาร จองตั๋ว ฯลฯ (ยังลองไม่ได้เพราะต้องจ่าย Pro และ อยู่ใน US ซึ่งส่วนใหญ่บริการที่ AI พอทำได้จะหนักไปทาง US เช่น Doordash)

.
Perplexity เปิดตัว Assistant ที่จะทำงานบางส่วนได้บน Android (เช่นอ่านหน้าจอ แล้วแนะนำผ่านระบบ Perplexity) อนาคตน่าจะคุมแอพเราได้ (แอพธนาคารไม่น่ายอม) ผมลองแล้วน่าสนใจดี

เมื่อวานได้ลอง Claude Computer Action อย่างจริงๆ จังๆ ก็รู้สึกว่า ยังมีข้อจำกัดค่อนข้างมาก (ช้าและไม่ค่อยแม่น) น่าจะต้องพัฒนาอีกเยอะ และ balance ดีๆ ว่าเราจำเป็นต้องให้ agent เห็นทุกอย่างเหมือนเรามั้ย หรือจริงๆ Agent ควรจะมีระบบ Data กับ UI เฉพาะไปเลย

ใส่ความเห็น