Routing thông minh
Chọn model tối ưu theo ngữ cảnh, A/B nhanh, fallback khi lỗi/quá tải.
- Cost/Latency/Quality-first
 - Rule & weight linh hoạt
 
A/BFallbackCanary
      AI Gateway là giải pháp AI định tuyến thông minh, giúp định tuyến truy vấn đến các mô hình AI chuyên dụng (LLM, Embedding, Vision) để tối ưu kết quả, chi phí và nâng cao trải nghiệm người dùng. Chuẩn hoá API, A/B testing & fallback, quan sát tập trung và bảo mật theo chuẩn doanh nghiệp.
Định tuyến theo intent/chi phí/độ trễ, A/B & canary, fallback tự động; quản trị khoá & policy theo team; quan sát tập trung token/latency/error; hỗ trợ LLM/Embedding/Vision.
Chọn model tối ưu theo ngữ cảnh, A/B nhanh, fallback khi lỗi/quá tải.
RBAC, quota, key rotation, audit log, data boundary & IP allowlist.
Metrics, tracing, alert; export Prometheus/Grafana/Datadog.
// POST /v1/ai-gateway/chat
{
  "prompt": "Tóm tắt hồ sơ khách hàng",
  "strategy": "latency-first",
  "fallback": true,
  "constraints": {"max_latency_ms": 1200}
}
// → Gateway định tuyến: embed→rerank, hoặc LLM-4-mini; lỗi → fallback sang LLM-3.5