Models

Truy cập 100+ model AI qua 1 API. So sánh giá, context window, tốc độ.

Lọc:|
89 model

Auto (Smart Route)

Smart Hot

Futrix API tự động chọn model tốt nhất dựa trên độ phức tạp của request. Câu đơn giản → model rẻ, câu khó → model mạnh. Tiết kiệm 40-60% chi phí.

6.812đ/1M
input/1M

GPT-5.4

Trung Mới Hot

Model flagship mới nhất của OpenAI. Vượt trội về reasoning, code, sáng tạo. Context 256K, hỗ trợ vision và tools.

85.150đ/1M
input/1M

Claude Sonnet 4.6

Trung Mới Hot

Model cân bằng mới nhất của Anthropic. Xuất sắc với code, phân tích, và viết nội dung dài. Context 200K tokens.

102.180đ/1M
input/1M

DeepSeek V3

Rẻ Hot

Model open-weight mạnh ngang GPT-4o với giá cực rẻ. Cache hit giảm giá 10x. Tốt cho code và reasoning.

9.537đ/1M
input/1M

Gemini 2.5 Flash

Rẻ Hot

Model nhanh với khả năng thinking từ Google. Context 1M tokens, giá rẻ, hỗ trợ vision và grounding.

10.218đ/1M
input/1M

Gemini 2.5 Pro

Trung Hot

Model mạnh nhất của Google. Context 1M tokens, thinking sâu, xuất sắc cho coding và phân tích phức tạp.

42.575đ/1M
input/1M

DeepSeek R1

Rẻ Hot

Model reasoning chuyên sâu. Tự suy luận step-by-step. Xuất sắc với math, logic, code phức tạp.

9.537đ/1M
input/1M

Groq Llama 3.3 70B

Rẻ Hot

Llama 3.3 70B chạy trên Groq LPU — tốc độ inference cực nhanh (>300 tok/s). Giá rẻ.

20.095đ/1M
input/1M

O4 Mini

Trung Hot

Model reasoning mới nhất từ OpenAI. Nhanh, rẻ hơn O3, tốt cho math và logic.

37.466đ/1M
input/1M

Claude Opus 4.6

Premium Mới Hot

Model mạnh nhất của Anthropic. Xuất sắc cho tác vụ phức tạp, nghiên cứu, phân tích sâu.

170.300đ/1M
input/1M

Groq Compound

Miễn phí

Agent tổng hợp từ Groq với khả năng search web, chạy code, truy cập Wikipedia. Miễn phí.

Free
input/1M

Groq Compound Mini

Miễn phí

Phiên bản nhẹ của Compound agent. Nhanh hơn, phù hợp tác vụ đơn giản. Miễn phí.

Free
input/1M

GPT-5.4 Nano

Rẻ Mới

Model siêu nhẹ dòng GPT-5.4. Cực rẻ và nhanh, phù hợp phân loại, trích xuất, chatbot đơn giản.

1.703đ/1M
input/1M

GPT-5 Nano

Rẻ

Model siêu nhẹ dòng GPT-5. Giá thấp nhất, tốc độ nhanh, phù hợp tác vụ đơn giản hàng loạt.

1.703đ/1M
input/1M

Groq Llama 3.1 8B

Rẻ

Model nhỏ chạy trên Groq LPU. Tốc độ cực nhanh, giá thấp nhất. Phù hợp tác vụ đơn giản.

1.703đ/1M
input/1M

Groq GPT-OSS 20B

Rẻ

OpenAI GPT open-source 20B chạy trên Groq. Nhanh và rẻ, chất lượng tốt cho tác vụ trung bình.

2.384đ/1M
input/1M

GPT-4.1 Nano

Rẻ

Model nhỏ nhất dòng GPT-4.1. Cực nhanh, rẻ, phù hợp xử lý text đơn giản, embedding, phân loại.

3.406đ/1M
input/1M

Gemini 2.5 Flash Lite

Rẻ

Phiên bản nhẹ nhất của Gemini Flash. Context 1M tokens, cực nhanh, giá rẻ nhất dòng Gemini.

3.406đ/1M
input/1M

Gemini 2.0 Flash

Rẻ

Model nhanh từ Google với context 1M tokens. Hỗ trợ vision, grounding, code execution.

3.406đ/1M
input/1M

Groq Llama 4 Scout

Rẻ

Meta Llama 4 Scout 17B chạy trên Groq. Nhanh, rẻ, hỗ trợ vision.

3.747đ/1M
input/1M

Groq GPT-OSS 120B

Rẻ

OpenAI GPT open-source 120B trên Groq. Mạnh, nhanh, giá rẻ hơn model closed-source.

5.109đ/1M
input/1M

GPT-4o Mini

Rẻ

Phiên bản nhẹ của GPT-4o. Cực rẻ, nhanh, phù hợp chatbot, phân loại, tóm tắt.

5.109đ/1M
input/1M

GPT-5.4 Mini

Rẻ Mới

Phiên bản nhẹ GPT-5.4. Cân bằng tốt giữa chất lượng và chi phí, nhanh, hỗ trợ tools.

8.515đ/1M
input/1M

GPT-5 Mini

Rẻ

Phiên bản nhẹ GPT-5. Tốc độ nhanh, giá rẻ, phù hợp tác vụ hàng ngày.

8.515đ/1M
input/1M

Groq Qwen3 32B

Rẻ

Qwen3 32B chạy trên Groq. Hỗ trợ reasoning, code tốt, tốc độ nhanh.

9.877đ/1M
input/1M

GPT-4.1 Mini

Rẻ

Phiên bản nhẹ GPT-4.1. Nhanh, rẻ, hỗ trợ function calling và JSON mode tốt.

13.624đ/1M
input/1M

Gemini 3 Flash

Rẻ Mới

Gemini thế hệ 3 phiên bản Flash. Nhanh, mạnh hơn 2.5, context 1M tokens.

17.030đ/1M
input/1M

Gemini 3.1 Flash

Rẻ Mới

Gemini 3.1 Flash — nâng cấp mới nhất dòng Flash. Nhanh, mạnh, context 1M tokens.

17.030đ/1M
input/1M

Groq Kimi K2

Trung

Moonshot Kimi K2 chạy trên Groq. Mạnh với reasoning và code, tốc độ inference nhanh.

34.060đ/1M
input/1M

Groq ALLAM 2 7B

Miễn phí Mới

ALLAM 2 7B trên Groq — model chuyên tiếng Ả Rập và tiếng Anh. Miễn phí, tốc độ nhanh.

Free
input/1M

Claude Haiku 4.5

Trung

Model nhanh và rẻ nhất dòng Claude. Phù hợp cho chatbot, phân loại, tóm tắt.

34.060đ/1M
input/1M

O3 Mini

Trung

Model reasoning nhẹ. Giá hợp lý, tốt cho coding và math.

37.466đ/1M
input/1M

GPT-5

Trung

GPT-5 — bước nhảy lớn từ OpenAI. Mạnh hơn GPT-4o đáng kể, giá hợp lý.

42.575đ/1M
input/1M

GPT-5.1

Trung

Nâng cấp từ GPT-5. Cải thiện reasoning và code, giá tương đương GPT-5.

42.575đ/1M
input/1M

GPT-5.2

Trung

GPT-5.2 — cải thiện đáng kể về code và reasoning so với 5.1. Context 256K.

59.605đ/1M
input/1M

GPT-4.1

Trung

Nâng cấp từ GPT-4o. Mạnh hơn với code, instruction following tốt hơn, context 1M tokens.

68.120đ/1M
input/1M

O3

Trung

Model reasoning mạnh nhất dòng O. Xuất sắc cho math, science, coding phức tạp.

68.120đ/1M
input/1M

Gemini 3 Pro

Trung Mới

Gemini thế hệ 3 Pro. Mạnh hơn 2.5 Pro đáng kể, context 1M, thinking sâu.

68.120đ/1M
input/1M

Gemini 3.1 Pro

Trung Mới

Gemini 3.1 Pro — mới nhất từ Google. Nâng cấp reasoning và code, context 1M tokens.

68.120đ/1M
input/1M

GPT-4o

Trung

Model đa năng mạnh của OpenAI. Hỗ trợ text, vision, audio. Tốc độ nhanh, chất lượng cao.

85.150đ/1M
input/1M

Claude Sonnet 4.5

Trung

Claude Sonnet 4.5. Mạnh với code và sáng tạo, hỗ trợ extended thinking.

102.180đ/1M
input/1M

Claude Sonnet 4

Trung

Claude Sonnet 4. Model cân bằng tốt, giá hợp lý, xuất sắc cho code và phân tích.

102.180đ/1M
input/1M

Claude Opus 4.5

Premium

Claude Opus 4.5. Rất mạnh cho reasoning phức tạp, viết sáng tạo, phân tích chuyên sâu.

170.300đ/1M
input/1M

Claude Opus 4.1

Premium

Claude Opus 4.1. Mạnh cho tác vụ phức tạp, agentic workflows.

170.300đ/1M
input/1M

Claude Opus 4

Premium

Claude Opus 4. Model flagship đầu tiên dòng Opus 4, mạnh cho agentic coding.

170.300đ/1M
input/1M

O1

Premium

Model reasoning cao cấp. Suy luận sâu, phù hợp cho nghiên cứu, math, science.

510.900đ/1M
input/1M

GPT-5.2 Pro

Premium

Phiên bản Pro của GPT-5.2. Reasoning cực mạnh, output dài, dành cho tác vụ chuyên sâu.

715.260đ/1M
input/1M

GPT-5.4 Pro

Premium Mới

Model mạnh nhất của OpenAI. Reasoning cấp độ expert, dành cho tác vụ khó nhất.

1.021.800đ/1M
input/1M

GPT-5 Pro

Premium

Phiên bản Pro của GPT-5. Reasoning mạnh, output dài, dành cho tác vụ chuyên sâu.

510.900đ/1M
input/1M

GPT-5.3 Codex

Trung Mới

Codex mới nhất — chuyên code, tối ưu cho agentic coding tasks, multi-file editing.

59.605đ/1M
input/1M

GPT-5.2 Codex

Trung

Codex 5.2 — chuyên code, refactoring, debugging. Hỗ trợ multi-file editing.

59.605đ/1M
input/1M

GPT-5.1 Codex

Trung

Codex 5.1 — model code chuyên dụng. Tốt cho refactoring và debugging.

42.575đ/1M
input/1M

GPT-5.1 Codex Max

Premium Mới

Codex Max — model code mạnh nhất, context khổng lồ, xử lý codebase lớn và refactor phức tạp.

340.600đ/1M
input/1M

GPT-5 Codex

Trung

GPT-5 Codex — chuyên code, giá hợp lý.

42.575đ/1M
input/1M

GPT-5.1 Codex Mini

Rẻ

Codex Mini — nhẹ, nhanh, rẻ, phù hợp autocomplete và code tasks đơn giản.

8.515đ/1M
input/1M

GPT-5 Search

Trung

GPT-5 với khả năng search web realtime. Trả lời kèm sources, thông tin mới nhất.

102.180đ/1M
input/1M

GPT-4o Search

Trung

GPT-4o với web search. Tìm kiếm thông tin realtime, trả lời kèm nguồn trích dẫn.

85.150đ/1M
input/1M

Imagen 4

Trung Mới

Google Imagen 4 — tạo ảnh chất lượng cao, photorealistic, hỗ trợ text trong ảnh.

681đ/1M
input/1M

Imagen 4 Fast

Trung Mới

Imagen 4 phiên bản nhanh — tạo ảnh nhanh hơn, phù hợp prototype và batch.

341đ/1M
input/1M

GPT Image 1.5

Trung Mới

Model tạo ảnh mới nhất từ OpenAI. Hiểu ngữ cảnh tốt, tạo ảnh chất lượng cao.

341đ/1M
input/1M

GPT Image 1

Trung

OpenAI GPT Image — tạo ảnh từ text, chỉnh sửa ảnh, hỗ trợ text trong ảnh.

341đ/1M
input/1M

GPT Image 1 Mini

Rẻ

Phiên bản nhẹ GPT Image. Tạo ảnh nhanh, rẻ hơn, phù hợp prototype.

170đ/1M
input/1M

DALL-E 3

Trung

Model tạo ảnh kinh điển của OpenAI. Sáng tạo, phong cách đa dạng.

1.362đ/1M
input/1M

Sora 2

Premium

Model tạo video từ OpenAI. Tạo video chất lượng cao từ text prompt.

17.030đ/1M
input/1M

Sora 2 Pro

Premium

Sora 2 Pro — video chất lượng cao nhất, độ phân giải lớn, thời lượng dài hơn.

34.060đ/1M
input/1M

GPT Audio 1.5

Trung Mới

Model audio mới nhất — hiểu và tạo giọng nói, phiên dịch, tóm tắt audio.

102.180đ/1M
input/1M

GPT Audio

Trung

Model audio của OpenAI — hiểu và tạo giọng nói, phân tích audio.

85.150đ/1M
input/1M

GPT Audio Mini

Rẻ

Model audio nhẹ. Nhanh, rẻ, phù hợp voice chat đơn giản.

17.030đ/1M
input/1M

GPT Realtime 1.5

Premium Mới

Model realtime mới nhất — hội thoại giọng nói hai chiều, độ trễ cực thấp.

170.300đ/1M
input/1M

GPT Realtime

Premium

Model realtime — hội thoại giọng nói hai chiều realtime qua WebSocket.

170.300đ/1M
input/1M

GPT Realtime Mini

Trung

Model realtime nhẹ. Giá rẻ hơn, phù hợp voice chat đơn giản.

34.060đ/1M
input/1M

TTS-1

Rẻ

Text-to-Speech từ OpenAI. 6 giọng đọc tự nhiên, hỗ trợ nhiều ngôn ngữ.

510.900đ/1M
input/1M

Whisper-1

Rẻ

Speech-to-Text từ OpenAI. Nhận dạng giọng nói chính xác, hỗ trợ 99+ ngôn ngữ.

204.360đ/1M
input/1M

Together Qwen3.5 397B

Trung Mới

Qwen3.5 397B MoE trên Together AI. Model open-source cực mạnh, ngang GPT-5.

34.060đ/1M
input/1M

Together Qwen3 Coder 480B

Trung Mới

Qwen3 Coder 480B — model code open-source lớn nhất. Xuất sắc cho programming.

51.090đ/1M
input/1M

Together Qwen3 Coder Next

Trung Mới

Qwen3 Coder Next — phiên bản mới nhất, nâng cấp từ 480B, code tốt hơn.

51.090đ/1M
input/1M

Together Qwen3 235B

Rẻ

Qwen3 235B MoE — cân bằng tốt giữa chất lượng và giá. Reasoning mạnh.

17.030đ/1M
input/1M

Together DeepSeek R1

Trung

DeepSeek R1 trên Together AI. Reasoning mạnh, giá cạnh tranh, tốc độ tốt.

51.090đ/1M
input/1M

Together DeepSeek V3.1

Rẻ Mới

DeepSeek V3.1 trên Together AI. Nâng cấp từ V3, mạnh hơn, nhanh hơn.

17.030đ/1M
input/1M

Together Llama 4 Maverick

Rẻ

Meta Llama 4 Maverick MoE trên Together. Mạnh, nhanh, hỗ trợ vision.

9.196đ/1M
input/1M

Together Cogito 671B

Trung

DeepCogito 671B — model reasoning mạnh, cạnh tranh với DeepSeek R1.

68.120đ/1M
input/1M

Together MiniMax M2.5

Rẻ

MiniMax M2.5 — model từ MiniMax, mạnh với context dài và reasoning.

9.196đ/1M
input/1M

Together Kimi K2.5

Trung Mới

Moonshot Kimi K2.5 trên Together AI. Reasoning mạnh, tốt với code và math.

34.060đ/1M
input/1M

Together Qwen3.5 9B

Rẻ Mới

Qwen3.5 9B — model nhẹ, rẻ, nhanh. Phù hợp chatbot và tác vụ đơn giản.

2.725đ/1M
input/1M

Together Llama 3.3 70B

Rẻ

Llama 3.3 70B trên Together AI. Đa năng, giá rẻ, tốc độ tốt.

9.196đ/1M
input/1M

Together Apriel 1.6 15B Thinker

Miễn phí Mới

ServiceNow Apriel 1.6 15B Thinker — model reasoning miễn phí, hỗ trợ chain-of-thought tốt.

Free
input/1M

Together Apriel 1.5 15B Thinker

Miễn phí Mới

ServiceNow Apriel 1.5 15B Thinker — phiên bản trước, reasoning miễn phí.

Free
input/1M

Together GLM-4.5 Air

Rẻ Mới

Zhipu GLM-4.5 Air trên Together AI. Rẻ, hỗ trợ tiếng Trung và tiếng Anh tốt.

6.812đ/1M
input/1M

Together Qwen3 VL 8B

Rẻ Mới

Qwen3 Vision-Language 8B — model vision rẻ nhất, hỗ trợ phân tích hình ảnh.

6.131đ/1M
input/1M

200+ Models via Pass-through

Tất cả providers

Ngoài 89 curated models ở trên, bạn có thể gọi bất kỳ model nào từ 11 providers bằng cách dùng format provider/model-id. Giá tự động tính theo markup.

OpenAI
20+ models
Anthropic
6+ models
Google
10+ models
DeepSeek
5+ models
Meta
10+ models
Groq
8+ models
Together AI
100+ models
Mistral
8+ models
C
Cohere
5+ models
P
Perplexity
4+ models
F
Fireworks
30+ models

OpenAI

gpt-4o-2024-08-06gpt-4-turboo1-previewo1-minio3-minigpt-4o-mini-2024-07-18...

Anthropic

claude-opus-4-6claude-3-haiku-20240307claude-3-opus-20240229...

Google

gemini-1.5-flashgemini-progemma-2-27b-it...

Mistral

mistral-large-latestmistral-mediumcodestral-latestmistral-small-latest...

Together AI

Qwen/Qwen2.5-72B-InstructNousResearch/Hermes-3-Llama-3.1-405Bdatabricks/dbrx-instruct...

Cohere

command-r-pluscommand-rembed-english-v3.0...

Perplexity

sonar-prosonarsonar-reasoning...

Fireworks

accounts/fireworks/models/llama-v3p1-405b-instructaccounts/fireworks/models/mixtral-8x22b-instruct...
Ví dụ: gọi bất kỳ model
# OpenAI specific model
model="openai/gpt-4o-2024-08-06"

# Mistral Large
model="mistral/mistral-large-latest"

# Qwen 72B via Together AI
model="together_ai/Qwen/Qwen2.5-72B-Instruct"

# Perplexity online search
model="perplexity/sonar-pro"