Mục lục bài viết

Amazon Bedrock Custom Model Import  vừa công bố hỗ trợ thêm Qwen model cho phép bạn “đưa” mô hình AI nhà Qwen tự huấn luyện lên cloud chỉ trong vài click.

Nguồn bài viết: https://aws.amazon.com/about-aws/whats-new/2025/06/amazon-bedrock-custom-model-import-qwen-models

Qwen hỗ trợ các loại mô hình chuyên biệt như sau:

Ba loại chính của Qwen model:

1. Qwen 2.5 Coder – Chuyên cho việc lập trình

  • Chuyên viết code, sửa bug, dịch code
  • Hiểu sâu về logic lập trình
  • Hoàn hảo cho các team dev muốn có AI coding assistant riêng

2. Qwen 2.5 VL – Chuyên cho xử lý tác vụ hàng ngày

  • Xử lý cả văn bản và hình ảnh
  • Trả lời câu hỏi về hình ảnh
  • Phân tích tài liệu có cả chữ và hình

3. QwQ 32B – Chuyên về tư duy logic

  • Giải quyết vấn đề phức tạp
  • Hiệu suất ngang mô hình lớn hơn nhiều
  • Tiết kiệm chi phí vận hành

Custom Model Import là gì?

Hãy tưởng tượng bạn bạn phải xây lại mô hình từ đầu?

Phải đầu tư từ cơ sở hạ tầng AI, trung tâm dữ liệu cho đến con người để có thể đủ nguồn lực.Điều này dẫn đến chi phí tăng cao mà không phải doanh nghiệp hay cá nhân nào cũng có thể đáp ứng được.

→ Đây là lý do Custom Model Import ra đời với những lợi ích to lớn:

1. Kết hợp tốt nhất của hai thế giới

  • Tùy chỉnh theo nhu cầu: Giữ nguyên mô hình đã training với data riêng
  • Infrastructure đẳng cấp: Tận dụng hạ tầng serverless của AWS
  • Không lo vận hành: AWS lo phần khó, bạn tập trung vào business

2. Ba kịch bản sử dụng phổ biến

Fine-tuning với dữ liệu riêng

  • Bạn đã tinh chỉnh mô hình với dữ liệu nội bộ
  • Muốn giữ bí mật “công thức” riêng
  • Ví dụ: Mô hình tư vấn tài chính theo style công ty bạn

Chuyên môn hóa cho ngành

  • Mô hình chuyên sâu cho domain cụ thể
  • Ví dụ: AI hiểu tiếng lóng ngành y tế Việt Nam
  • Hoặc model phân tích giá bất động sản Thành Phố Hồ Chí Minh

Xây dựng từ đầu

  • Mô hình hoàn toàn mới với kiến trúc độc quyền
  • Thay đổi cả config, vocabulary, attention mechanism
  • Cho những ai muốn làm “pioneer” tiên phong trong lĩnh vực mới

Sau Đây Là Hướng dẫn import model

Bước 1: Chuẩn bị dữ liệu cho model

Model của bạn cần được đóng gói theo format Hugging Face với các file:

  • .safetensor – Trọng số model (dưới 200GB cho text, 100GB cho multimodal)
  • config.json – Cấu hình model
  • tokenizer.json và tokenizer_config.json – Bộ xử lý văn bản
  • tokenizer.model – Model tokenizer

Bước 2: Upload lên S3

Đơn giản upload tất cả file lên một S3 bucket

Bước 3: Tạo import job

  • Vào Amazon Bedrock console
  • Chọn “Foundation models” → “Imported models”
  • Paste S3 URI và đặt tên cho model
  • Click “Import”

Bước 4: Sử dụng model

import boto3

bedrock = boto3.client('bedrock-runtime')

response = bedrock.invoke_model(

    modelId='your-custom-model-id',

    body=json.dumps({

        "prompt": "Phân tích xu hướng thị trường Q4/2025",

        "max_tokens": 1000

    })

)

Kiến trúc được hỗ trợ

Amazon Bedrock hỗ trợ import các kiến trúc phổ biến:

  • Llama family (2, 3, 3.1, 3.2, 3.3)
  • Mistral & Mixtral – Hiệu quả với Mixture of Experts
  • Flan T5 – Encoder-decoder cho các task phức tạp
  • GPTBigCode – Chuyên gia về code
  • Qwen family – Mới nhất, đa năng nhất

Chi phí – Minh bạch và linh hoạt

  • Pay per use: Chỉ trả tiền khi sử dụng
  • On-demand throughput: Không lo về capacity planning

Các Lưu ý quan trọng

Giới hạn về kỹ thuật:

  • Model weights: Max 200GB (text) hoặc 100GB (multimodal)
  • Context length: Tối đa 128K tokens
  • Transformer version: 4.45.2

Tính năng chưa hỗ trợ:

  • Batch inference (đang phát triển)
  • AWS CloudFormation
  • Quantized models

Các Regions khả dụng:

  • US East (N. Virginia)
  • US West (Oregon)
  • Europe (Frankfurt)

Use cases thực tế

1. Chatbot nội bộ thông minh

  • Import model đã train với tài liệu công ty
  • Trả lời câu hỏi về policy, quy trình nội bộ
  • Bảo mật tuyệt đối

2. AI phân tích tài chính

  • Model được train với dữ liệu thị trường Việt Nam
  • Hiểu được context và thuật ngữ local
  • Dự đoán xu hướng chính xác hơn

3. Code assistant chuyên biệt

  • Qwen 2.5 Coder được fine-tune với codebase công ty
  • Hiểu coding convention và architecture pattern riêng
  • Tăng productivity cho đội phát triển

Kết luận:

Amazon Bedrock Custom Model Import đang mở ra kỷ nguyên mới – nơi mọi công ty đều có thể có AI riêng, được tùy chỉnh theo nhu cầu nhưng vẫn tận dụng được sức mạnh của cloud computing.

Với việc hỗ trợ thêm dòng Qwen – đặc biệt là Qwen 2.5 Coder và QwQ 32B – Amazon Bedrock đang chứng tỏ cam kết mang đến những công nghệ AI tiên tiến nhất cho developer.

Cảm ơn độc giả đã đọc đến cuối bài viết!