Amazon SageMaker Nâng Cao Khả Năng Tùy Chỉnh Triển Khai Mô Hình - Sunny Cloud

Mục lục bài viết

Nội dung cập nhật
Lợi ích chính
Cách sử dụng InferenceAmiVersion trong ProductionVariant
Kết luận

Amazon Web Services (AWS) vừa công bố một cập nhật đáng chú ý cho Amazon SageMaker, nâng cao đáng kể khả năng tùy chỉnh trong quá trình triển khai mô hình machine learning (ML).

Mục Lục

Tính năng mới: Tùy chỉnh phiên bản phần mềm và driver

Nội dung cập nhật

. Trước đây: Người dùng phải sử dụng các phiên bản phần mềm và driver được SageMaker định sẵn trên các instance được quản lý phía sau endpoint.

. Hiện nay: Người dùng có thể chỉ định tham số “InferenceAmiVersion” trong ProductionVariant khi cấu hình endpoint để lựa chọn kết hợp phiên bản phần mềm và driver phù hợp nhất với yêu cầu của họ.

Lợi ích chính

Kiểm soát phiên bản: Có thể nâng cấp hoặc hạ cấp phiên bản driver cho endpoint theo lịch trình riêng.
Tối ưu hóa hiệu suất: Chọn kết hợp phần mềm và driver tốt nhất cho use case cụ thể, cải thiện hiệu suất tổng thể.

Cách sử dụng InferenceAmiVersion trong ProductionVariant

Khi cấu hình ProductionVariant cho endpoint, chúng ta có thể sử dụng tham số InferenceAmiVersion để chỉ định phiên bản AMI mong muốn.

Ví dụ:

InferenceAmiVersion = "al2-ami-sagemaker-inference-gpu-2"

Giải thích tùy chọn trên:

Accelerator: GPU
NVIDIA driver version: 535.54.03
CUDA driver version: 12.2
Hỗ trợ các loại instance: ml.g4dn., ml.g5., ml.g6., ml.p3., ml.p4d., ml.p4de., ml.p5.*

Ví dụ cấu hình ProductionVariant:

production_variant = {

    "VariantName": "MyVariant",

    "ModelName": "MyModel",

    "InstanceType": "ml.g5.xlarge",

    "InitialInstanceCount": 1,

    "InferenceAmiVersion": "al2-ami-sagemaker-inference-gpu-2"

}

Ví dụ cấu hình ProductionVariant nâng cao:

production_variant = {

    "VariantName": "MyVariant",

    "ModelName": "MyModel",

    "InstanceType": "ml.g5.xlarge",

    "InitialInstanceCount": 1,

    "InferenceAmiVersion": "al2-ami-sagemaker-inference-gpu-2",

    "VolumeSizeInGB": 50,

    "ContainerStartupHealthCheckTimeoutInSeconds": 300,

    "ModelDataDownloadTimeoutInSeconds": 900,

    "EnableSSMAccess": True

}

Kết luận

Vậy là hôm nay tôi đã chia sẻ tính năng mới trong Amazon Sagmaker giúp tùy chỉnh phiên bản phần mềm và driver kết hợp với ProductionVariant cho phép tùy chọn cấu hình một cách mạnh mẽ, cung cấp cho nhà phát triển khả năng kiểm soát và tối ưu hóa việc triển khai mô hình ML.