Mục lục bài viết
Giới thiệu
Amazon SageMaker HyperPod giờ đây tích hợp với Amazon EventBridge, cho phép bạn nhận thông báo gần như thời gian thực về các thay đổi trạng thái của cluster! Điều này mở ra khả năng tự động hóa mạnh mẽ cho các quy trình machine learning.
Amazon Event Bridge giám sát các sự kiện thay đổi trạng thái trong Amazon SageMaker AI, cho phép bạn tự động hóa SageMaker và phản hồi tự động với các sự kiện như thay đổi trạng thái training job hoặc endpoint status change.
Tại sao Event Bridge Integration quan trọng?
Với tích hợp Event Bridge, bạn có thể:
- Theo dõi real-time – Nhận thông báo ngay lập tức về status changes
- Tự động hóa workflows – Trigger actions tự động khi có sự kiện
- Thông báo thông minh – Thiết lập alerts cho các events quan trọng
- Giám sát toàn diện – Theo dõi toàn bộ ML pipeline
- Tích hợp liền mạch – Kết nối với các AWS services khác
Tổng quan EventBridge
EventBridge là gì?
Amazon EventBridge là dịch vụ eventbus serverless giúp kết nối các ứng dụng với dữ liệu từ nhiều nguồn khác nhau. Với SageMaker integration:
- Near real-time delivery – Events được gửi gần như thời gian thực
- Simple rules – Viết rules đơn giản để định nghĩa events quan tâm
- Automated actions – Thực hiện actions tự động khi event match rule
- Rich integrations – Tích hợp với nhiều AWS services
Cách hoạt động:
SageMaker AI → EventBridge → Rules → Target Actions
↓ ↓ ↓ ↓
Status Change → Event Bus → Filtering → Lambda/SNS/SQS
Các loại SageMaker Events
Danh sách đầy đủ các events được giám sát:
Loại Event | Mô tả | Use Case |
Endpoint Deployment | Thay đổi trạng thái triển khai endpoint | Monitoring deployments |
Endpoint State | Thay đổi trạng thái endpoint | Health checking |
Feature Group | Thay đổi trạng thái feature group | Data pipeline monitoring |
Hyperparameter Tuning | Thay đổi trạng thái tuning job | Optimization tracking |
HyperPod Cluster | Thay đổi trạng thái cluster | Cluster management |
HyperPod Node Health | Thay đổi sức khỏe node | Node monitoring |
Image State | Thay đổi trạng thái image | Container management |
Image Version | Thay đổi version image | Version control |
Model Card | Thay đổi model card | Model governance |
Model Package | Thay đổi model package | Model registry |
Model State | Thay đổi trạng thái model | Model lifecycle |
Pipeline Execution | Thay đổi execution pipeline | Workflow monitoring |
Pipeline Step | Thay đổi step trong pipeline | Step-level tracking |
Processing Job | Thay đổi processing job | Data processing |
Training Job | Thay đổi training job | Training monitoring |
Transform Job | Thay đổi transform job | Batch inference |
Ví dụ:
Endpoint Deployment
{
"version": "0",
"id": "0bd4a141-0a02-9d8a-f977-3924c3fb259c",
"detail-type": "SageMaker Endpoint Deployment State Change",
"source": "aws.sagemaker",
"account": "111122223333",
"time": "2021-10-25T01:52:12Z",
"region": "us-west-2",
"resources": [
"arn:aws:sagemaker:us-west-2:111122223333:endpoint/sample-endpoint"
],
"detail": {
"EndpointName": "sample-endpoint",
"EndpointArn": "arn:aws:sagemaker:us-west-2:111122223333:endpoint/sample-endpoint",
"EndpointConfigName": "sample-endpoint-config-1",
"ProductionVariants": [
{
"VariantName": "AllTraffic",
"CurrentWeight": 1,
"DesiredWeight": 1,
"CurrentInstanceCount": 3,
"DesiredInstanceCount": 3
}
],
"EndpointStatus": "UPDATING",
"CreationTime": 1635195148181,
"LastModifiedTime": 1635195148181,
"Tags": {},
"PendingDeploymentSummary": {
"EndpointConfigName": "sample-endpoint-config-2",
"StartTime": Timestamp,
"ProductionVariants": [
{
"VariantName": "AllTraffic",
"CurrentWeight": 1,
"DesiredWeight": 1,
"CurrentInstanceCount": 1,
"DesiredInstanceCount": 3,
"VariantStatus": [
{
"Status": "Baking",
"StatusMessage": "Baking for 600 seconds (TerminationWaitInSeconds) with traffic enabled on canary capacity of 1 instance(s).",
"StartTime": 1635195269181,
}
]
}
]
}
}
}
State Change
{
"version": "0",
"id": "d2921b5a-b0ad-cace-a8e3-0f159d018e06",
"detail-type": "SageMaker Endpoint State Change",
"source": "aws.sagemaker",
"account": "111122223333",
"time": "1583831889050",
"region": "us-west-2",
"resources": [
"arn:aws:sagemaker:us-west-2:111122223333:endpoint/myendpoint"
],
"detail": {
"EndpointName": "MyEndpoint",
"EndpointArn": "arn:aws:sagemaker:us-west-2:111122223333:endpoint/myendpoint",
"EndpointConfigName": "MyEndpointConfig",
"ProductionVariants": [
{
"DesiredWeight": 1.0,
"DesiredInstanceCount": 1.0
}
],
"EndpointStatus": "IN_SERVICE",
"CreationTime": 1592411992203.0,
"LastModifiedTime": 1592411994287.0,
"Tags": {
}
}
}
Kết Luận
Việc công bố Amazon Sagmaker tích hợp Event Bridge rule đánh dấu bước cải tiến đáng kể khi sử dụng làm các ứng dụng AI tạo sinh.
Hy vọng bài viết có ích và cảm ơn độc giả!
Để lại một bình luận