Amazon Bedrock Custom Model Import: Đã hỗ trợ Qwen model - Sunny Cloud

Mục lục bài viết

Amazon Bedrock Custom Model Import vừa công bố hỗ trợ thêm Qwen model cho phép bạn “đưa” mô hình AI nhà Qwen tự huấn luyện lên cloud chỉ trong vài click.

Nguồn bài viết: https://aws.amazon.com/about-aws/whats-new/2025/06/amazon-bedrock-custom-model-import-qwen-models

Qwen hỗ trợ các loại mô hình chuyên biệt như sau:

Ba loại chính của Qwen model:

1. Qwen 2.5 Coder – Chuyên cho việc lập trình

Chuyên viết code, sửa bug, dịch code
Hiểu sâu về logic lập trình
Hoàn hảo cho các team dev muốn có AI coding assistant riêng

2. Qwen 2.5 VL – Chuyên cho xử lý tác vụ hàng ngày

Xử lý cả văn bản và hình ảnh
Trả lời câu hỏi về hình ảnh
Phân tích tài liệu có cả chữ và hình

3. QwQ 32B – Chuyên về tư duy logic

Giải quyết vấn đề phức tạp
Hiệu suất ngang mô hình lớn hơn nhiều
Tiết kiệm chi phí vận hành

Custom Model Import là gì?

Hãy tưởng tượng bạn bạn phải xây lại mô hình từ đầu?

Phải đầu tư từ cơ sở hạ tầng AI, trung tâm dữ liệu cho đến con người để có thể đủ nguồn lực.Điều này dẫn đến chi phí tăng cao mà không phải doanh nghiệp hay cá nhân nào cũng có thể đáp ứng được.

→ Đây là lý do Custom Model Import ra đời với những lợi ích to lớn:

1. Kết hợp tốt nhất của hai thế giới

Tùy chỉnh theo nhu cầu: Giữ nguyên mô hình đã training với data riêng
Infrastructure đẳng cấp: Tận dụng hạ tầng serverless của AWS
Không lo vận hành: AWS lo phần khó, bạn tập trung vào business

2. Ba kịch bản sử dụng phổ biến

Fine-tuning với dữ liệu riêng

Bạn đã tinh chỉnh mô hình với dữ liệu nội bộ
Muốn giữ bí mật “công thức” riêng
Ví dụ: Mô hình tư vấn tài chính theo style công ty bạn

Chuyên môn hóa cho ngành

Mô hình chuyên sâu cho domain cụ thể
Ví dụ: AI hiểu tiếng lóng ngành y tế Việt Nam
Hoặc model phân tích giá bất động sản Thành Phố Hồ Chí Minh

Xây dựng từ đầu

Mô hình hoàn toàn mới với kiến trúc độc quyền
Thay đổi cả config, vocabulary, attention mechanism
Cho những ai muốn làm “pioneer” tiên phong trong lĩnh vực mới

Sau Đây Là Hướng dẫn import model

Bước 1: Chuẩn bị dữ liệu cho model

Model của bạn cần được đóng gói theo format Hugging Face với các file:

.safetensor – Trọng số model (dưới 200GB cho text, 100GB cho multimodal)
config.json – Cấu hình model
tokenizer.json và tokenizer_config.json – Bộ xử lý văn bản
tokenizer.model – Model tokenizer

Bước 2: Upload lên S3

Đơn giản upload tất cả file lên một S3 bucket

Bước 3: Tạo import job

Vào Amazon Bedrock console
Chọn “Foundation models” → “Imported models”
Paste S3 URI và đặt tên cho model
Click “Import”

Bước 4: Sử dụng model

import boto3

bedrock = boto3.client('bedrock-runtime')

response = bedrock.invoke_model(

    modelId='your-custom-model-id',

    body=json.dumps({

        "prompt": "Phân tích xu hướng thị trường Q4/2025",

        "max_tokens": 1000

    })

)

Kiến trúc được hỗ trợ

Amazon Bedrock hỗ trợ import các kiến trúc phổ biến:

Llama family (2, 3, 3.1, 3.2, 3.3)
Mistral & Mixtral – Hiệu quả với Mixture of Experts
Flan T5 – Encoder-decoder cho các task phức tạp
GPTBigCode – Chuyên gia về code
Qwen family – Mới nhất, đa năng nhất

Chi phí – Minh bạch và linh hoạt

Pay per use: Chỉ trả tiền khi sử dụng
On-demand throughput: Không lo về capacity planning

Các Lưu ý quan trọng

Giới hạn về kỹ thuật:

Model weights: Max 200GB (text) hoặc 100GB (multimodal)
Context length: Tối đa 128K tokens
Transformer version: 4.45.2

Tính năng chưa hỗ trợ:

Batch inference (đang phát triển)
AWS CloudFormation
Quantized models

Các Regions khả dụng:

US East (N. Virginia)
US West (Oregon)
Europe (Frankfurt)

Use cases thực tế

1. Chatbot nội bộ thông minh

Import model đã train với tài liệu công ty
Trả lời câu hỏi về policy, quy trình nội bộ
Bảo mật tuyệt đối

2. AI phân tích tài chính

Model được train với dữ liệu thị trường Việt Nam
Hiểu được context và thuật ngữ local
Dự đoán xu hướng chính xác hơn

3. Code assistant chuyên biệt

Qwen 2.5 Coder được fine-tune với codebase công ty
Hiểu coding convention và architecture pattern riêng
Tăng productivity cho đội phát triển

Kết luận:

Amazon Bedrock Custom Model Import đang mở ra kỷ nguyên mới – nơi mọi công ty đều có thể có AI riêng, được tùy chỉnh theo nhu cầu nhưng vẫn tận dụng được sức mạnh của cloud computing.

Với việc hỗ trợ thêm dòng Qwen – đặc biệt là Qwen 2.5 Coder và QwQ 32B – Amazon Bedrock đang chứng tỏ cam kết mang đến những công nghệ AI tiên tiến nhất cho developer.

Cảm ơn độc giả đã đọc đến cuối bài viết!