Viên Ngọc Ẩn o3-mini: Liệu Có Phải Là "Chiến Thần" Mới Cho AI Native Development?

Lê Lân

14/06/2025

Đánh Giá o3-mini và GPT-4.5 Trong Phát Triển AI Native: Góc Nhìn Từ Tessl.io

Mở Đầu

Việc phát triển các mô-đun và gói phần mềm AI phức tạp chưa bao giờ là điều đơn giản, nhưng công nghệ hiện nay đang đưa chúng ta đến gần hơn bao giờ hết với tương lai của AI Native development — phát triển ứng dụng dựa hoàn toàn trên AI.

Trong bài viết này, chúng ta sẽ cùng tìm hiểu về công việc của Amy Heineike, kỹ sư AI tại Tessl.io, người đã đánh giá và so sánh hai mô hình AI nổi bật — o3-mini và GPT-4.5 — trong việc xây dựng các hệ thống đa tầng phức tạp. Các phát hiện ban đầu từ đội ngũ AI Engineering tại Tessl cho thấy o3-mini nổi bật hơn trong nhiều khía cạnh của quy trình phát triển AI Native, đồng thời đặt ra câu hỏi về cách khai thác sức mạnh tổng hợp của nhiều mô hình khác nhau thay vì phụ thuộc vào một mô hình duy nhất.

Thách Thức Trong Phát Triển AI Native

Khái Niệm AI Native Development

Phát triển AI Native đòi hỏi một quy trình đặc biệt, đòi hỏi sự chính xác và đồng bộ giữa nhiều bước:

Hiểu và phân tích mã nguồn

Dịch yêu cầu chi tiết thành mã lệnh cụ thể

Tạo mã thông minh, tối ưu cho từng tầng của hệ thống

Tự động kiểm thử và sửa lỗi dựa trên các kịch bản thử nghiệm

Độ Phức Tạp và Khó Khăn

Điểm khác biệt lớn của AI Native development so với phương pháp truyền thống là khả năng tích hợp sâu sắc các bước tự động hóa và khả năng tự điều chỉnh mã trong quá trình phát triển các mô-đun phức tạp.

Điều này đòi hỏi mô hình AI không chỉ tạo ra code đúng chức năng, mà còn cần hiểu cấu trúc liên kết giữa các mô-đun, thích nghi với yêu cầu thay đổi và thực hiện việc debug thông minh.

Tiến Bộ Trong Mô Hình Lý Luận

Giai đoạn đầu của mô hình "chain-of-thought" đã được cải tiến thành các mô hình hybrid reasoning như Claude 3.7, giúp xử lý các vấn đề phức tạp với khả năng suy luận tốt hơn – mở ra triển vọng mới cho phát triển AI Native.

So Sánh o3-mini và GPT-4.5: Phương Pháp Đánh Giá Của Tessl

Bối Cảnh và Động Lực So Sánh

Tessl từng sử dụng GPT-4o làm mô hình chính cho quy trình phát triển AI Native, nhưng sau đó chuyển sang dùng o3-mini nhờ hiệu suất vượt trội của nó trên các bài toán đa tầng.

Với sự xuất hiện của GPT-4.5, được quảng bá là có phản hồi chính xác hơn và giảm hiện tượng hallucination, đội ngũ đã tiến hành so sánh trực tiếp hiệu quả của 2 mô hình trong nhiệm vụ xây dựng các gói phần mềm đa mô-đun.

Quy Trình Đánh Giá Mô Hình

Các bài test bao gồm:

Hiểu mã nguồn

Dịch yêu cầu đặc tả thành mã lệnh

Tạo mã mới

Tìm và sửa lỗi (debug)

Sinh test cases để kiểm thử tự động

Ban đầu, mô hình được phép tự sinh test cases riêng. o3-mini thể hiện tỷ lệ vượt qua kiểm thử cao hơn hẳn. Để công bằng, đội ngũ Tessl chuẩn hoá việc sử dụng bộ test do o3-mini tạo ra cho cả hai mô hình. Kết quả so sánh này cũng cho thấy o3-mini mạnh hơn đáng kể.

Kết Quả và Ý Nghĩa

Mô hình	Tỷ lệ pass trong bài test chuẩn hoá	Ghi chú
o3-mini	Cao hơn rất nhiều	Thích ứng tốt trong AI Native
GPT-4.5	Thấp hơn	Mạnh về viết và phân tích tổng thể
GPT-4o	Tương đương GPT-4.5	Cao chi phí, không cải thiện nhiều

Điều đáng lưu ý là Tessl không thấy bằng chứng cho thấy GPT-4.5 vượt trội hơn GPT-4o, dù GPT-4.5 có chi phí sử dụng cao hơn nhiều.

Ngoài ra, OpenAI đã ghi nhận GPT-4.5 thích hợp với những tác vụ đa bước ("multi-step workflows"), nhưng trong AI Native development, sức mạnh lớn nhất vẫn thuộc về o3-mini.

Những Phát Hiện Thú Vị Không Nên Bỏ Qua

Vai Trò Riêng Biệt Của Các Mô Hình

GPT-4.5 sinh ra nhiều test cases hơn tự nhiên, đặt ra câu hỏi liệu nó có đang mạnh ở khả năng tạo test hơn là tạo code?

o3-mini lại cho ra mã nguồn ít lỗi, tránh được các lỗi nhỏ tích tụ – điều quan trọng trong phát triển AI Native.

Mỗi mô hình AI có điểm mạnh và điểm yếu khác nhau — không tồn tại mô hình "one-size-fits-all". Đây là chìa khóa để xây dựng hệ thống AI Native hiệu quả.

Ý Tưởng Kết Hợp Mô Hình (Model Stacking)

Tessl đề xuất phát triển hệ thống kết hợp nhiều mô hình:

Lấy o3-mini đảm nhiệm việc xây dựng cấu trúc hệ thống chính.

Dùng GPT-4.5 tinh chỉnh, giải thích, hoặc tạo các đoạn văn bản tự nhiên.

Giống như việc sử dụng cả búa và tua vít để hoàn thành một chiếc máy, việc kết hợp mô hình giúp tận dụng ưu thế riêng biệt của từng AI.

Tác Động Đối Với Tương Lai Của Phát Triển AI Native

Mô Hình Thay Đổi Quy Trình Phát Triển

Sự tiến bộ của các mô hình như o3-mini đang làm thay đổi căn bản quy trình viết mã truyền thống, giúp các công cụ phát triển phủ sóng AI sâu hơn trong từng giai đoạn từ hiểu code, tạo code đến test.

Cơ Hội và Thách Thức

Amy Heineike nhận định:

“o3-mini đã thay đổi cuộc chơi cho chúng tôi. Nó tránh được nhiều lỗi nhỏ tích tụ – thứ mà các mô hình khác dễ mắc phải – khiến việc phát triển AI Native trở nên thực tế hơn bao giờ hết.”

Điều đặc biệt là bước tiến này đến từ việc tinh chỉnh sau khi huấn luyện (post-training), mở ra tiềm năng cải tiến lớn trong tương lai.

Kêu Gọi Cộng Đồng AI Native Phát Triển

Tessl kêu gọi các nhà phát triển:

Khám phá và thử nghiệm các mô hình kết hợp

Chia sẻ các đánh giá, test case, và kết quả thực nghiệm

Tham gia sự kiện 2025 AI Native DevCon

Tham gia cộng đồng Discord AI Native Development của Tessl: https://tessl.co/4hEUVYI

Kết Luận

Phát triển AI Native đang ở giai đoạn đầu nhưng đầy hứa hẹn. Tessl.io đã cung cấp những phân tích sâu sắc về hiệu suất của o3-mini và GPT-4.5, qua đó chứng minh rằng việc tận dụng sức mạnh kết hợp của nhiều mô hình sẽ là hướng đi chiến lược trong tương lai.

Nếu bạn là nhà phát triển, đừng ngần ngại thử nghiệm và đóng góp ý kiến để cùng cộng đồng tiến gần hơn tới một môi trường phát triển phần mềm AI Native hiệu quả và toàn diện.

Tham Khảo

OpenAI - Giới thiệu GPT-4.5

OpenAI o3-mini Coding Performance

Simon Willison, đánh giá sức mạnh o3-mini:

Blog: https://arcprize.org/blog/oai-o3-pub-breakthrough

Gist: https://gist.github.com/simonw/4a13c4b10176d7b8e3d1260f5dcc9de3

The Verge - GPT-4.5 Release and Capabilities: https://www.theverge.com/news/620021/openai-gpt-4-5-orion-ai-model-release

Tessl AI Native DevCon 2025: https://tessl.co/41upVVk

Tessl Discord Community: https://tessl.co/4hEUVYI