Skip to content
Nhận tư vấn kỹ thuật & giải pháp AI

Giải pháp AI Tiên phong &
Dẫn dắt kỹ thuật

Thiết kế môi trường Multi-Agent thực chiến, kiến trúc RAG nâng cao và hạ tầng đám mây tối ưu. Kết hợp hài hòa giữa nghiên cứu Học máy chuyên sâu và kỹ nghệ hệ thống thực tế.

5+
Năm kinh nghiệm AI
12+
Giải pháp Doanh nghiệp
20+
Mã nguồn mở đã chạy
250M+
Tokens đã xử lý

Dự án nổi bật

Các hệ thống AI thực chiến, kiến trúc hiệu năng cao và thư viện hỗ trợ lập trình viên.

Enterprise Multi-Agent Orchestrator

Thiết kế và triển khai framework bảo mật điều phối hơn 20 agent LLM chuyên biệt, tự động hóa quy trình viết mã nguồn quy mô lớn, kiểm tra an toàn phụ thuộc và kiểm định dữ liệu tổng hợp.

Astro-Agents Claude-3.5 FastAPI VectorDB
20+ Agent • Tích hợp vLLM Chi tiết

Scalable SaaS Chatbot Platform

Thiết kế và triển khai nền tảng SaaS Chatbot đa người thuê (multi-tenant) có khả năng co giãn lớn, hỗ trợ các plugin mô-đun hóa, phục vụ hàng ngàn cuộc hội thoại doanh nghiệp đồng thời.

SaaS LLMs WebSocket React
Multi-Tenant • Plugin Linh hoạt Chi tiết

Ultra Low-Latency RAG Pipeline

Xây dựng hệ thống tìm kiếm kết hợp ngữ nghĩa và từ khóa (hybrid search) trên hơn 5 triệu tài liệu kỹ thuật, sử dụng kỹ thuật phân đoạn ngữ nghĩa và mô hình xếp hạng lại (reranking). Tối ưu tốc độ tìm kiếm tới 45%.

Qdrant Cohere Rerank LlamaIndex Python
5M+ Tài liệu • Độ trễ <120ms Chi tiết

High-Scale Warehouse Microservices

Xây dựng hệ thống microservices kho hàng hiệu năng cao đáp ứng hàng triệu người dùng truy cập liên tục bằng .NET 10 và Angular 21. Tích hợp gRPC tốc độ cao, hàng đợi thông điệp Kafka (event-driven) và cơ chế Hybrid Cache (Redis + Memory) tối ưu hóa thực thể database.

.NET 10 Kafka Hybrid Cache gRPC
Triệu Users • Uptime 99.99% Chi tiết

Enterprise Kubernetes Microservices

Dẫn dắt quá trình thiết kế, container hóa và điều phối các microservices cốt lõi trong môi trường Kubernetes (AWS EKS / GKE). Tích hợp các đường ống CI/CD, DevSecOps và hệ thống giám sát/đọc log ELK / Grafana.

Kubernetes DevSecOps ELK Stack CI/CD
Quản lý 8 Kỹ sư • Zero Downtime Chi tiết

Real-Time AI Inference Gateway

Lập trình API gateway độ trễ thấp điều phối lượng lớn prompt đầu vào, tích hợp tường lửa ứng dụng web (WAF) nâng cao, giới hạn tần suất (rate limiting) thuật toán sliding-window, định tuyến dự phòng động và các lớp đệm hybrid caching.

WAF Rate Limiting Golang Redis
10,000 req/phút • Dự phòng động Chi tiết

Astro-Agent Interactive Dashboard

Phát triển và phát hành mã nguồn mở dashboard giao diện trực quan giúp lập trình viên giám sát luồng bộ nhớ multi-agent, pipeline thực thi, chạy tool và phân tích vết trace thời gian thực.

Astro TailwindCSS TypeScript D3.js
Mã nguồn Mở • Thư viện Npm Chi tiết

Python LLM Evaluation Toolkit

Sáng lập thư viện tiện ích mạnh mẽ giúp phát hiện ảo giác (hallucination) của LLM, đo lường điểm thiên kiến và kiểm thử đầu ra JSON/YAML nghiêm ngặt trước khi deploy.

Python Pydantic Pytest CI/CD
50k+ Tải xuống • SDK Nguồn mở Chi tiết

Kỹ năng & năng lực chuyên môn

Trực quan hóa tương tác giữa nhóm kỹ năng và mạng lưới liên kết công nghệ.

Bản đồ năng lực cốt lõi

Biểu đồ Radar thể hiện Trình độ chuyên môn, Độ tự tin thực chiến và Khả năng học hỏi nhanh.

Cấp độ Kỹ năng (%) Độ tự tin (%) Khả năng tự học (%)

Bản đồ liên kết kỹ năng tương tác

Mô hình lực động học

Di chuột vào nhóm cốt lõi để làm nổi bật công nghệ liên quan. Kéo nút để tương tác. Cuộn chuột để phóng to/thu nhỏ.

Nhóm Cốt lõi Công nghệ liên quan

Hành trình sự nghiệp

Các mốc thời gian đánh giá dấu ấn kỹ thuật và quản lý của tôi.

Lead AI Engineer & Part-time Tech Lead

2024 - HIỆN TẠI

TechsphereX Solutions

Quản lý kiến trúc cho các framework multi-agent thế hệ mới và hàng rào bảo mật. Định hướng chuyên môn cho 8 kỹ sư phát triển, điều phối các chu kỳ sprint agile và cố vấn đối tác về bảo vệ tài sản trí tuệ khi tích hợp AI.

  • Kiến trúc hóa hạ tầng đám mây lai (hybrid cloud) hỗ trợ luồng công việc multi-agent.
  • Tiết kiệm hơn 30% chi phí hạ tầng GPU nhờ triển khai các lớp đệm inference (caching).
  • Tiên phong triển khai hệ thống tinh chỉnh mô hình on-premise bảo mật cao.

Senior AI Engineer

2022 - 2024

FutureMind Laboratories

Thiết kế các pipeline RAG (tăng cường truy xuất) bền bỉ, tích hợp công cụ agentic phức tạp và triển khai mô hình tùy biến. Dẫn dắt quy trình đánh giá thiên kiến và ảo giác mô hình.

  • Xây dựng pipeline nhúng vector tùy chỉnh xử lý hơn 5 triệu bản ghi.
  • Tích hợp cơ chế bộ đệm mô hình giúp giảm độ trễ xuống dưới 120ms.
  • Định hướng các chiến lược lượng tử hóa (quantization) để chạy trên phần cứng cấu hình thấp.

AI / ML Engineer

2020 - 2022

Aether Analytics

Phát triển các mô hình dự báo chuỗi thời gian (time-series) và thuật toán học máy có giám sát cổ điển cho khách hàng mảng sản xuất và chuỗi cung ứng.

  • Phát triển mô hình dự báo nhu cầu với độ chính xác đạt 94%.
  • Quản lý các luồng công việc phức tạp thông qua Apache Airflow.
  • Xây dựng các pipeline tự động làm sạch dữ liệu và loại bỏ ngoại lệ (outlier).

Hãy cùng kiến tạo giải pháp thông minh

Bạn đang tìm kiếm một part-time Technical Lead, Cố vấn AI hay Kiến trúc sư hệ thống LLM chuyên biệt? Hãy kết nối để cùng phân tích các giới hạn dữ liệu và kiến tạo môi trường Agent thế hệ mới.

Telegram Zalo Facebook Messenger