AI Agents: Sức Mạnh Mới Hay Đau Đầu Cũ? Mổ Xẻ 3 Giao Thức Đỉnh Cao Định Hình Tương Lai!

Lê Lân

14/06/2025

Tiêu Chuẩn Mới Trong Kiến Trúc AI Agents: Function Calling, MCP và A2A

Mở Đầu

Trong thế giới phát triển AI hiện nay, AI Agents không còn chỉ là những chatbot đơn giản mà đã trở thành các chương trình tự động hoàn chỉnh, có khả năng sử dụng công cụ, gọi API và hợp tác với nhau. Tuy nhiên, một bài toán lớn đặt ra là làm sao để các agent làm việc hiệu quả với công cụ và với nhau khi chưa có chuẩn mực chung.

Bài viết này sẽ phân tích chi tiết ba tiêu chuẩn chính đang định hình tương lai kiến trúc AI Agents: Function Calling, MCP (Model Context Protocol) và A2A (Agent-to-Agent Protocol). Qua đó, bạn đọc sẽ hiểu rõ điểm mạnh, hạn chế của từng phương án và cách ứng dụng phù hợp để xây dựng hệ thống AI linh hoạt và mở rộng.

1. Function Calling: Người Tiên Phong Với Những Hạn Chế Phát Triển

1.1 Khái quát Function Calling

Function Calling là phương pháp do OpenAI khởi xướng, hiện cũng được Meta, Google và nhiều bên áp dụng, cho phép mô hình ngôn ngữ lớn (LLM) học cách gọi các hàm API dựa trên câu hỏi từ người dùng.

Ví dụ, khi user hỏi “Thời tiết ở Seattle thế nào?”, LLM sẽ:

Nhận ra cần dữ liệu bên ngoài

Chọn hàm API thích hợp trong danh sách định nghĩa sẵn

Định dạng tham số theo JSON Schema như sau:

{
  "location": "Seattle",
  "unit": "celsius"
}

Ứng dụng sẽ thực thi API gọi

LLM kết hợp dữ liệu trả về vào câu trả lời

Function Calling giống như việc cung cấp cho AI một cuốn “cookbook” API để nó biết cách gọi đúng hàm theo yêu cầu tự nhiên. Đơn giản, nhanh chóng và phù hợp cho các ứng dụng sử dụng một mô hình duy nhất.

1.2 Hạn chế của Function Calling

Thiếu chuẩn chung: Mỗi nhà cung cấp LLM implement function calling khác nhau, gây khó khăn khi dùng đa mô hình (ví dụ: hỗ trợ GPT và Claude đồng thời).

Quản lý đa bước: Không hỗ trợ chuỗi gọi hàm phức tạp tự động; việc phối hợp các bước phải do lập trình viên xử lý thủ công.

M×N problem: Với M nhà cung cấp mô hình và N công cụ, bạn sẽ phải viết lại N định nghĩa hàm cho M mô hình, gây lãng phí tài nguyên và khó bảo trì.

2. MCP (Model Context Protocol): Bộ Phiên Dịch Chuẩn Cho AI Và Công Cụ

2.1 Tổng quan về MCP

MCP, hỗ trợ bởi Anthropic và được nhiều mô hình như Claude, GPT, Llama ủng hộ, lấy ý tưởng tạo ra một chuẩn giao diện chung giúp các mô hình AI có thể sử dụng các công cụ và nguồn dữ liệu bên ngoài một cách thống nhất và tự động.

2.2 Cách MCP vận hành

MCP được ví như “chuẩn USB cho công cụ AI”:

Các công cụ quảng bá khả năng bằng định dạng chuẩn: các hành động sẵn có, dữ liệu đầu vào và đầu ra dự kiến

Mô hình AI đọc mô tả và hiểu cách sử dụng công cụ mà không cần lập trình riêng

Ứng dụng chỉ cần tích hợp một lần và tương thích với mọi mô hình MCP

Kiến trúc MCP gồm:

MCP Hosts: Nơi người dùng tương tác với AI, ví dụ Claude Desktop

MCP Clients: Bộ kết nối giữa hosts với servers

MCP Servers: Công cụ theo chuẩn MCP, expose chức năng

Data Sources: Dữ liệu gốc như API, database

MCP giúp giảm đáng kể độ phức tạp tích hợp, từ bài toán M×N thành M+N, tiết kiệm công sức phát triển và duy trì.

3. A2A (Agent-to-Agent Protocol): Người Điều Phối Đội Nhóm AI Agents

3.1 Tổng quan A2A

Khác với Function Calling và MCP tập trung vào giao tiếp model-công cụ, A2A do Google giới thiệu hướng tới:

Cho phép nhiều agent chuyên biệt giao tiếp, phối hợp

Định nghĩa giao thức mở, nhẹ giúp agent:

Tìm kiếm, quảng bá năng lực lẫn nhau

Phân công nhiệm vụ linh hoạt

Cập nhật trạng thái theo thời gian thực

3.2 Ví dụ ứng dụng A2A

Một hệ thống tuyển dụng tự động gồm:

Agent quản lý tìm kiếm ứng viên theo tiêu chí

Agent chuyên đặt lịch phỏng vấn

Agent thực hiện kiểm tra thông tin lý lịch

Mỗi agent làm nhiệm vụ riêng, phối hợp mềm dẻo qua A2A, gia tăng hiệu quả và mở rộng dễ dàng.

A2A làm cho các agent không phải là những cá thể đơn độc mà có thể hợp tác như một đội nhóm.

4. So Sánh Nhanh Function Calling, MCP Và A2A

Tiêu Chí	Function Calling	MCP	A2A
Mục đích	Gọi API từ mô hình đơn	Chuẩn hóa giao tiếp model - công cụ	Định nghĩa giao tiếp giữa các agent
Đối tượng tương tác	Model → API	Model ↔ Công cụ	Agent ↔ Agent
Phạm vi công việc	Đơn giản, thời gian thực	Mở rộng, đa mô hình, công cụ chuẩn	Phối hợp đa agent, quy trình phức tạp
Ưu điểm	Dễ sử dụng, nhanh	Tính mở rộng, chuẩn hóa cao	Hỗ trợ tổ chức workflows đa nhân tố
Nhược điểm	Không chuẩn dùng đa model, khó mở rộng	Cần đầu tư server và setup	Còn mới, hạn chế hỗ trợ trên diện rộng
Ví dụ thực tế	AI biết gọi API thời tiết	Ứng dụng tương thích nhiều model công cụ	Hệ thống AI phối hợp người dùng và DB đa agent

Nhìn chung, MCP giải quyết bài toán “AI dùng công cụ gì?”, còn A2A trả lời câu “Các AI agent làm thế nào để phối hợp cùng nhau?”.

5. Hướng Dẫn Ứng Dụng Cho Nhà Phát Triển AI

Ứng dụng đơn giản, một mô hình: Dùng Function Calling để tiết kiệm thời gian phát triển.

Hệ thống cần đa mô hình, mở rộng công cụ: Ưu tiên MCP để tái sử dụng định nghĩa và giảm chi phí bảo trì.

Xây dựng hệ sinh thái agent phức tạp, đa nhiệm: Tìm hiểu và áp dụng A2A để quản lý nhiệm vụ phân tán hiệu quả.

Một chiến lược khôn ngoan là kết hợp ba phương pháp: prototyping nhanh với Function Calling, mở rộng với MCP và tổ chức luồng agent với A2A.

Kết Luận

Việc chuẩn hóa giao tiếp giữa AI agents với công cụ và nhau là yếu tố quyết định tương lai của hệ sinh thái AI. Function Calling, MCP và A2A đại diện cho các bước tiến quan trọng, mỗi phương án giải quyết bài toán khác biệt nhưng bổ trợ lẫn nhau.

Hiểu và ứng dụng đúng cách các chuẩn này sẽ giúp nhà phát triển tạo ra hệ thống AI agent mạnh mẽ, dễ mở rộng và sẵn sàng cho kỷ nguyên AI tự động. Hãy bắt đầu tìm hiểu sâu và tích hợp sớm để không bị bỏ lại phía sau!

Tham Khảo

Function Calling và Luồng làm việc - Google Cloud

MCP: Mô hình chuẩn cho AI và công cụ - Anthropic

A2A: Giao thức tương tác Agent-to-Agent - Google Developers

Giải thích về AI Agents và cuộc tranh luận của OpenAI - LangChain

Top 10 AI Agents đáng chú ý 2025