Bạn đã bao giờ tự hỏi làm thế nào để nắm bắt mọi sự cố ẩn sau việc kết nối với Amazon EBS volume trên EC2 instance của mình? Đừng lo lắng nữa, vì CloudWatch vừa cập nhật một loạt các metric kiểm tra trạng thái EBS volume mới, mở ra những khả năng theo dõi mà bạn chưa từng trải nghiệm trước đây. Giờ đây, bạn có thể thông qua Amazon CloudWatch Metrics để theo dõi tình trạng kết nối của EBS volume được gắn vào EC2 instance.

Nội dung cập nhật Amazon CloudWatch Metrics

CloudWatch hiện đã thêm các metric (thước đo) cho phép bạn theo dõi việc kết nối đến một hoặc nhiều Amazon EBS volume được đính kèm vào EC2 instance

Cụ thể tên metric mới là “StatusCheckFailed_AttachedEBS“.

Cập nhật mới này cho phép bạn phát hiện các sự cố EBS ảnh hưởng đến hệ thống đang chạy trên Amazon EC2 instance.

Theo đó, khi metric kiểm tra trạng thái EBS đính kèm có giá trị false, tùy thuộc vào nguyên nhân, bạn có thể tự động thực hiện các hành động như chờ đợi cho đến khi sự cố được giải quyết, thay thế volume bị ảnh hưởng, hoặc dừng và khởi động lại instance.

Lưu ý: metric kiểm tra trạng thái EBS này chỉ có thể sử dụng trên Nitro instance từ tháng 10 năm 2023.

Nguyên nhân metric kiểm tra trạng thái EBS có giá trị false?

Khi metric “StatusCheckFailed_AttachedEBS” báo cáo giá trị false, hãy nhanh chóng xem xét để tìm hiểu nguyên nhân. Dưới đây là các nguyên nhân phổ biến nhất:

  • Sự cố về phần cứng hoặc phần mềm của hệ thống lưu trữ cơ bản của EBS volume.
  • Sự cố về phần cứng trên máy chủ vật lý ảnh hưởng đến khả năng kết nối của EBS volume.
  • Sự cố về kết nối giữa instance và EBS volumes

Cách sử dụng Amazon CloudWatch Metrics

Bước 1: Khởi động EC2 instance, ta không thể thấy thông số hiển thị trong cột “Status Checks” (kiểm tra trạng thái EC2) của AWS Management Console.

Cột Status checks trong bảng AWS Management Console
Cột Status checks trong bảng AWS Management Console

Bước 2: Tiến hành tìm kiếm “StatusCheckFailed_AttachedEBS” trên EC2 trong CloudWatch Metrics

Tìm kiếm StatusCheckFailed_AttachedEBS
Tìm kiếm StatusCheckFailed_AttachedEBS (metric kiểm tra trạng thái EBS volume)

Bước 3: Tạo một thông báo (alarm)

Tạo alarm trong Cloudwatch Metrics (thông báo)

Bước 5: Trong cài đặt action, bạn có thể chọn dừng, huỷ, hoặc khởi động lại instance khi thông báo được kích hoạt.

Cài đặt action
Cài đặt action

Bước 6: Sau khi hoàn thành, hãy kiểm tra trạng thái alarm ở cột bên trái

Kiểm tra trạng thái Alarm
Kiểm tra trạng thái Alarm

Bước 7: Bạn cũng có thể ngắt kết nối IO của EBS volume từ FIS (Fault Injection Simulator).

kết nối IO của EBS volume từ FIS (Fault Injection Simulator)

Trạng thái alarm đã được kích hoạt thành công. Với thời gian thiết lập FIS là 3 phút, việc kiểm tra được thực hiện sau mỗi phút. Sau khi thử nghiệm hoàn thành, alarm đã trở về trạng thái OK.

Alarm ở trạng thái OK sau khi đã thử nghiệm
Alarm ở trạng thái OK sau khi đã thử nghiệm

Bản cập nhật lần này đã công bố metric có thể kiểm tra kết nối từ EC2 instance đến EBS volume. Trước đây bạn chỉ có thể kiểm tra trạng thái của EC2, bây giờ bạn có thể kiểm tra cả trạng thái của EBS từ đó dễ phát hiện trường hợp xảy ra lỗi hơn để sớm khắc phục.

Tham khảo: 【アップデート】Amazon CloudWatchメトリクスで、EC2インスタンスのEBSボリュームの到達性が監視できるようになりました