Tất cả models
G

Groq Llama 3.1 8B

Rẻ

Model nhỏ chạy trên Groq LPU. Tốc độ cực nhanh, giá thấp nhất. Phù hợp tác vụ đơn giản.

128K
Context Window
8K
Max Output
Nhanh
Tốc độ
2/5
Chất lượng

Bảng giá

LoạiGiá gốc ($)Futrix API (₫)Bao gồm
Input / 1M tokens$0.051.703đ/1M
Smart routing tự động
Cache tiết kiệm 35-60%
1 API key cho 99+ models
Thanh toán VND/USD/Crypto
Output / 1M tokens$0.082.725đ/1M

* Giá Futrix API cao hơn giá gốc ~30% nhưng bao gồm smart routing, semantic cache (tiết kiệm thực tế 35-60%), fallback tự động, và thanh toán VND.

Tính năng hỗ trợ

Chat JSON Mode Streaming

Quick Start

Python
from openai import OpenAI

client = OpenAI(
    base_url="https://api.futrixapi.com/v1",
    api_key="sk-ftx-your-key"
)

response = client.chat.completions.create(
    model="groq-llama-8b",
    messages=[{"role": "user", "content": "Hello!"}]
)

print(response.choices[0].message.content)
cURL
curl -X POST https://api.futrixapi.com/v1/chat/completions \
  -H "Authorization: Bearer sk-ftx-your-key" \
  -H "Content-Type: application/json" \
  -d '{"model": "groq-llama-8b", "messages": [{"role": "user", "content": "Hello!"}]}'