D3S API hiện cung cấp hai nhóm model chính là quick và quick-max, phục vụ cho hai kiểu nhu cầu khá khác nhau.
quick được thiết kế cho các tác vụ cần phản hồi nhanh, gọn và tiết kiệm chi phí. Nhóm này phù hợp với các tình huống hỏi đáp nhanh, xử lý yêu cầu ngắn, tool call nhẹ, hoặc những luồng automation cần tốc độ phản hồi tốt. Nói đơn giản, khi bạn cần AI trả lời sớm, chạy gọn, không đòi hỏi suy luận quá sâu, thì quick là lựa chọn hợp lý. Đây cũng là nhóm model phù hợp cho các tác vụ thường xuyên, khối lượng lớn, hoặc các hệ thống cần tối ưu chi phí vận hành.
Trong khi đó, quick-max hướng đến các bài toán cần chất lượng phân tích cao hơn. Nhóm này phù hợp cho các công việc như viết bài, đánh giá nội dung, nghiên cứu, phân tích vấn đề, tổng hợp thông tin, hoặc những tác vụ cần reasoning tốt hơn trước khi đưa ra câu trả lời. Nếu quick thiên về tốc độ và hiệu quả chi phí, thì quick-max thiên về chiều sâu và chất lượng đầu ra.
Có thể hiểu ngắn gọn như sau:
quick: nhanh, gọn, tiết kiệm, phù hợp hỏi đáp nhanh và tool call nhẹ
quick-max: sâu hơn, chắc hơn, phù hợp viết, phân tích, đánh giá và nghiên cứu
Việc tách thành hai nhóm như vậy giúp người dùng chọn đúng model theo nhu cầu thực tế, thay vì dùng một cấu hình chung cho mọi tác vụ. Với các công việc hàng ngày cần tốc độ, quick là phương án tối ưu. Với các bài toán cần suy luận và đầu ra chất lượng hơn, quick-max sẽ phù hợp hơn.
Nếu bạn mới bắt đầu với D3S API, cách đơn giản nhất là:
- dùng
quick cho các tác vụ thường ngày, phản hồi nhanh
- chuyển sang
quick-max khi cần phân tích sâu hoặc tạo nội dung có chất lượng cao hơn