Mục lục bài viết

AWS Fault Injection Simulator

AWS Fault Injection Simulator (FIS) là một dịch vụ quản lý đầy đủ để thực hiện thí nghiệm Fault Injection trên AWS, giúp cải thiện hiệu suất, khả năng quan sát và khả năng phục hồi của ứng dụng một cách dễ dàng.

Thí nghiệm Fault Injection được sử dụng trong kỹ thuật Chaos.

Trong kỹ thuật Chaos, môi trường sản xuất có thể chịu đựng được tình trạng không ổn định do sự cố và những vấn đề tương tự.

Lặp lại thao tác “thí nghiệm Fault Injection” trong đó cố ý gây ra sự cố trên đám mây để kiểm tra “Elasticity” của hệ thống. Elasticity là chỉ số cho thấy hệ thống không gây ra tác động xấu đến người dùng ngay cả khi xảy ra sự cố.

Thông qua thí nghiệm này, có thể tìm ra những vấn đề của hệ thống, cải thiện khả năng sẵn sàng và khả năng chống sự cố. Netflix đã tăng cường nhận thức về điều này khi công bố công cụ “Chaos Monkey” dành cho kỹ thuật Chaos vào năm 2012.

Fault Injection Simulator cung cấp Controls và Guardrails cần thiết để đội ngũ có thể thực hiện thí nghiệm trong môi trường sản xuất, chẳng hạn như tự động roll back hoặc dừng thí nghiệm khi đáp ứng các điều kiện cụ thể.

Hiện tại, các dịch vụ mà FIS hướng đến bao gồm Amazon EC2, Amazon ECS/EKS, Amazon RDS.

Nội dung cập nhật

Trong thí nghiệm AWS Fault Injection Simulator (FIS), hiện tại có thể kiểm tra sự cố của container ở ECS task-level.

Trước đây, FIS đã hỗ trợ ECS. Vì đã hỗ trợ sự cố instance-level, nên có hiệu quả trong việc mô phỏng sự cố phần cứng, mạng và hệ điều hành.

Tuy nhiên, các components của ứng dụng dựa trên container và các container được triển khai trên AWS Fargate không nằm trong phạm vi của FIS.

Với bản cập nhật này, bất kể container dựa trên ứng dụng đã được triển khai trên cơ sở hạ tầng AWS Fargate hay Amazon EC2, cũng có thể dừng việc thực hiện task.

Điều này giúp dễ dàng phát hiện lỗi một cách linh hoạt và xác định performance bottlenecks.

Thử nghiệm ECS task với FIS

Nếu đang sử dụng Amazon ECS, có thể tạo và thực hiện thí nghiệm AWS FIS để dừng ECS task bằng việc target ARN của task cụ thể, tag, hoặc tên của cluster hoặc dịch vụ.

  1. Từ bảng điều khiển quản lý AWS, nhấp vào “Tạo mẫu thí nghiệm” từ FIS.
  1. Đối với action trong thí nghiệm FIS, chọn dừng ECS task.
  1. Đối với target của FIS, chọn ECS task.
  1. Đối với điều kiện dừng của FIS, chọn CloudWatch alarm đã thiết lập cho ECS.
  1. Sau khi nhấp vào “Tạo mẫu thí nghiệm”, mẫu sẽ được tạo và bạn có thể thực hiện thí nghiệm từ mẫu.

Khu vực áp dụng

Bản cập nhật này có thể sử dụng được ở tất cả các khu vực thương mại.