Mục lục bài viết

Amazon vừa công bố cập nhật quan trọng cho SageMaker Hyperpod Flexible Training Plans cho phép khởi động ngay lập tức và nhiều tùy chọn đặt trước tài nguyên.

Chi tiết có thể tham khảo ở đây:

https://aws.amazon.com/about-aws/whats-new/2025/03/sagemaker-hyperpod-flexible-training-plans-instant-start-times-multiple-offers

Những Tính Năng Mới

1. Khởi Động Nhanh Trong 30 Phút

  • Tự động tìm kiếm khung thời gian phù hợp
  • Tối ưu hóa việc phân bổ tài nguyên GPU

2. Tự Động Chia Nhỏ Thời Gian Đặt Trước

SageMaker giờ đây có thể:

  • Tìm kiếm một khối thời gian liên tục phù hợp
  • Tự động chia nhỏ thành hai phân đoạn nếu cần thiết
  • Đảm bảo tổng thời gian đáp ứng yêu cầu của người dùng

Cách Sử Dụng Training Plans

1. Thông Qua SageMaker AI Console

2. Sử Dụng API

Tìm Kiếm Training Plan

import boto3

sagemaker = boto3.client('sagemaker')

# Tìm kiếm các training plan có sẵn

response = sagemaker.search_training_plan_offerings(

    InstanceType='ml.p4d.24xlarge',

    InstanceCount=4,

    StartTimeRange={

        'EarliestTime': '2025-03-05T00:00:00',

        'LatestTime': '2025-03-06T00:00:00'

    },

    DurationInHours=24

)

Tạo Training Plan

# Đặt trước training plan

plan = sagemaker.create_training_plan(

    TrainingPlanOfferingId=response['TrainingPlanOfferings'][0]['Id'],

    TrainingPlanName='MyMLProject'

)

Liệt Kê và Xem Chi Tiết

# Liệt kê tất cả training plans

all_plans = sagemaker.list_training_plans()

# Xem chi tiết một training plan cụ thể

plan_details = sagemaker.describe_training_plan(

    TrainingPlanArn='arn:aws:sagemaker:region:account:training-plan/plan-id'

)

Các API Actions Chính

  1. SearchTrainingPlanOfferings
    • Tìm kiếm tài nguyên tính toán có sẵn
    • Chỉ định loại instance, số lượng và khung thời gian
    • Nhận danh sách được xếp hạng các tùy chọn phù hợp
  2. CreateTrainingPlan
    • Đặt trước một training plan cụ thể
    • Chuyển đổi capacity tiềm năng thành scheduled reserved capacities
    • Tạo ARN độc nhất cho training plan
  3. ListTrainingPlans
    • Xem tất cả training plans trong tài khoản AWS
    • Hỗ trợ lọc và sắp xếp
    • Quản lý nhiều plans cùng lúc
  4. DescribeTrainingPlan
    • Xem chi tiết một training plan cụ thể
    • Theo dõi trạng thái từ Pending đến Active và Expired
    • Kiểm soát vòng đời của training plan

Lợi Ích Cho Người Dùng

  1. Tiết Kiệm Thời Gian
    • Khởi động nhanh trong vòng 30 phút
    • Không cần chờ đợi lâu để bắt đầu training
  2. Linh Hoạt Trong Sử Dụng
    • Nhiều tùy chọn đặt trước
    • Tự động tối ưu hóa thời gian
  3. Quản Lý Chi Phí Hiệu Quả
    • Không yêu cầu cam kết dài hạn
    • Chỉ trả tiền cho thời gian sử dụng thực tế

Kết Luận

SageMaker Hyperpod Flexible Training Plans với khả năng khởi động nhanh và nhiều tùy chọn đặt trước, người dùng có thể dễ dàng lên kế hoạch và thực hiện các dự án ML một cách hiệu quả hơn.

Cảm ơn các bạn đã đọc đến cuối bài viết!