Mục lục bài viết

AWS Systems Manager Incident Manager là gì?

AWS Systems Manager Incident Manager là một dịch vụ quản lý các sự kiện được phát hiện dưới dạng sự cố, quản lý quá trình khôi phục và giải quyết sự cố, theo dõi theo thời gian và phân tích hậu sự cố.

Incident Manager kết hợp các dịch vụ AWS như Amazon CloudWatch, CloudWatch Alarms, metricsAWS CloudTrail, AWS Systems Manager, AWS Chatbot, có khả năng đối ứng nhanh với các sự cố để khôi phục ứng dụng.

Các tính năng chính của Incident Manager bao gồm:

Kế hoạch ứng phó

Tự động hóa và tạo kế hoạch đối ứng sự cố dựa trên CloudWatch Alarms hoặc sự kiện của Amazon EventBridge.

Runbook automation

Định nghĩa các runbook trong Systems Manager Automation để có thể tự động hóa các đối ứng quan trọng.

Engagement and escalation

Tự động kết nối nhân sự phù hợp cho mỗi sự cố riêng biệt. Nâng cao khả năng ứng phó thông qua các phương thức liên lạc khác nhau, giúp hiển thị và phân công người đối ứng phù hợp với sự cố.

Active collaboration

Người đối ứng sự cố có thể tham gia chủ động hơn trong việc ứng phó sự cố bằng cách kết hợp với dịch vụ AWS Chatbot client.

・Incident tracing

Cập nhật thông tin trong sự cố và xem chi tiết sự cố. Tạo và sửa đổi các mục follow-up theo runbook cho các sự cố.

Nội dung cập nhật

Trước đây, không thể quản lý nơi liên lạc đã đăng ký có đang on-call hay không, điều này có thể ảnh hưởng đến tốc độ đối ứng sự cố tuỳ thuộc vào người liên lạc và thời gian tham gia.

Tính năng On-call schedule đã được giới thiệu trong bản cập nhật hôm nay.

Thử nghiệm

  1. Đầu tiên “chuẩn bị” Incident Manager. Từ hệ thống, nhấp vào [Cài đặt].
  1. Đồng ý với [Điều khoản sử dụng] và nhấp vào [next].
  1. Định nghĩa [replication set].
  1. Nhấp vào [Liên hệ].
  1. Nhập thông tin liên lạc và nhấp [Tạo].
  1. Sau khi tạo thông tin liên lạc, chọn “On-call schedule” từ menu của Incident Manager.

Đây là tính năng mới.

  1. Nhấp vào “on-call schedule”.

Hiển thị Schedule details và rotation. Đầu tiên, thử đăng ký một rotation.

  1. Tiếp theo là đăng ký thông tin liên lạc.
  1. Bạn có thể kiểm tra rotation từ calendar.

Tổng kết

Tính năng On-call schedule đã được thêm vào Systems Manager Incident Manager.

Đây là một tính năng thuận tiện cho việc tự động hóa.