Phân Tích Code Tự Động: Khi AI "Săm Soi" Từng Dòng Code GitHub của Bạn!

Lê Lân

09/07/2025

Ứng Dụng AI Phân Tích Code Tự Động Với AWS Bedrock và DeepSeek R1 LLM

Mở Đầu

Trong bối cảnh phát triển phần mềm ngày càng phức tạp, chất lượng và cấu trúc mã nguồn trở thành yếu tố then chốt để giảm thiểu chi phí bảo trì và tránh nợ kỹ thuật. AI hiện đại đã mở ra khả năng phân tích code thông minh giúp kiểm tra, đánh giá và đề xuất cải tiến tự động.

Bài viết này giới thiệu một ứng dụng serverless, sử dụng AWS Bedrock kết hợp với mô hình ngôn ngữ lớn DeepSeek R1 LLM, để phân tích các commit trên GitHub. Ứng dụng không chỉ phát hiện lỗi tiềm ẩn mà còn đề xuất giải pháp dựa trên nguyên tắc Domain-Driven Design (DDD) và Clean Code, giúp mã nguồn luôn bền vững và dễ bảo trì.

Thêm vào đó, kiến trúc serverless trên AWS giúp triển khai giải pháp với hiệu suất cao, tối ưu chi phí và đảm bảo độ tin cậy trong môi trường sản xuất.

Giới Thiệu Dự Án

Tổng Quan Dự Án

Ứng dụng tự động phân tích mã nguồn trong kho GitHub mỗi khi có commit mới. Cụ thể:

Khi một developer đẩy commit lên GitHub, một webhook gửi sự kiện đến API Gateway.

API Gateway kích hoạt Lambda function xử lý sự kiện và gọi DeepSeek R1 LLM để phân tích.

Kết quả đánh giá và đề xuất được lưu trữ trong DynamoDB để tham chiếu sau này.

Công Nghệ Chính

Serverless Framework: Quản lý và triển khai tài nguyên AWS (Lambda, API Gateway, DynamoDB).

AWS Lambda: Xử lý webhook và gọi AI phân tích.

DeepSeek R1 LLM: Mô hình AI phân tích thay đổi code, đưa ra góp ý chất lượng.

DynamoDB: Lưu trữ siêu dữ liệu commit và đề xuất từ AI.

CloudWatch: Giám sát và ghi log Lambda functions.

GitHub Webhooks: Tự động gửi dữ liệu commit tới API.

Việc tích hợp này giúp tạo ra quy trình đánh giá code tự động, nhanh chóng và chuẩn xác dựa trên AI, thúc đẩy phát triển phần mềm hiện đại.

Cấu Trúc Dự Án

Thư Mục / File	Mô Tả
`layers/common/requirements.txt`	Định nghĩa các thư viện Python dùng chung
`src/functions/commit_analyzer.py`	Lambda function xử lý dữ liệu commit và gửi đến AI
`src/helpers/lambda_payload.py`	Xử lý payload webhook
`src/helpers/lambda_response.py`	Xử lý phản hồi Lambda
`src/infrastructure/resources.yml`	Cấu hình triển khai tài nguyên AWS
`src/services/bedrock.py`	Tương tác với AWS Bedrock
`src/services/dynamodb.py`	Giao tiếp với DynamoDB
`src/services/github.py`	Xử lý cấu trúc dữ liệu GitHub
`.env.example`	Ví dụ file cấu hình môi trường
`serverless.yml`	Cấu hình dự án Serverless Framework
`deploy-example.sh`	Script triển khai dễ dàng

Cấu trúc rõ ràng giúp mở rộng, bảo trì và tối ưu phát triển trong dự án.

Cách Thức Hoạt Động

Developer thực hiện commit mã nguồn trên GitHub.

GitHub gửi sự kiện webhook thông qua API Gateway.

API Gateway kích hoạt Lambda function phân tích commit.

Code thay đổi được trích xuất và gửi đến DeepSeek R1 LLM.

AI đề xuất các cải tiến dựa trên nguyên tắc DDD và Clean Code.

Kết quả ghi vào DynamoDB để theo dõi.

Developer nhận phản hồi chi tiết để cải thiện code.

Quy trình này giúp phát hiện sớm lỗi, góp phần nâng cao chất lượng phần mềm mà không làm gián đoạn flow phát triển.

Ví Dụ Kiểm Thử API

Để kích hoạt thủ công phân tích commit qua API, ta dùng lệnh cURL sau:

curl --location --request POST 'https://example.com/commit/analyze' \
--header 'Content-Type: application/json' \
--data-raw '{ 
  "ref": "refs/heads/develop",
  "before": "a1b2c3d4e5f678901234567890abcdef12345678", 
  "after": "f1e2d3c4b5a678901234567890abcdef98765432",
  "repository": {
    "id": 123456789,
    "name": "fake-repo",
    "full_name": "johnDoe/fake-repo",
    "owner": {
      "name": "johnDoe",
      "email": "[email protected]",
      "login": "johnDoe"
    }
  },
  "commits": [{
    "id": "f1e2d3c4b5a678901234567890abcdef98765432",
    "message": "fix: updated authentication logic",
    "added": ["src/auth.js"],
    "modified": ["src/index.js"]
  }]
}'

Thực hiện lệnh trên sẽ nhận được phản hồi JSON chứa đề xuất cải tiến và phân tích chất lượng code từ AI.

Hướng Dẫn Cấu Hình GitHub Webhooks

Truy cập kho mã nguồn trên GitHub.

Vào Settings > Webhooks.

Chọn "Add Webhook".

Nhập Payload URL: https://example.com/commit/analyze

Chọn Content Type: application/json .

Bật sự kiện Push events.

Lưu cấu hình.

Sau khi thiết lập, mỗi commit mới tự động gửi dữ liệu và kích hoạt quy trình phân tích AI.

Việc tích hợp webhook mở ra cơ hội áp dụng kiểm thử tự động ngay ở vòng commit, nâng cao hiệu quả phát triển.

Kết Luận

Dự án minh họa cách AI thế hệ mới, cụ thể là DeepSeek R1 LLM trên AWS Bedrock, có thể cách mạng hóa quy trình phát triển phần mềm bằng cách cung cấp phản hồi tự động, chính xác và kịp thời về chất lượng mã nguồn. Giải pháp serverless giúp triển khai dễ dàng, mở rộng và vận hành linh hoạt với chi phí hợp lý.

Đây là bước tiến quan trọng để thực hiện phân tích mã nguồn chuẩn mực theo DDD và Clean Code, giảm thiểu lỗi, cải thiện khả năng bảo trì và tăng tốc độ phát triển.

Để tìm hiểu sâu hơn, bạn có thể truy cập dự án tại: GitHub IA - Code Validation

Lưu ý: Mô hình DeepSeek R1 LLM hiện còn non trẻ, có thể hạn chế về độ chính xác với một số ngôn ngữ ngoài tiếng Anh và tiếng Trung.

Tham Khảo

AWS Bedrock Documentation

DeepSeek R1 LLM Marketplace

Evans, E. (2003). Domain-Driven Design: Tackling Complexity in the Heart of Software. Addison-Wesley.

Martin, R.C. (2008). Clean Code: A Handbook of Agile Software Craftsmanship. Prentice Hall.

GitHub Docs: Creating Webhooks

March 20, 2025