Mục lục bài viết

AWS DataSync Discovery

AWS DataSync Discovery là một dịch vụ được công bố vào tháng 9 năm 2022 dưới dạng public preview.

Khi sử dụng DataSync Discovery, hiệu suất lưu trữ on-premise và tình trạng sử dụng được hiển thị một cách trực quan, đồng thời có thể nhận các đề xuất tự động, giúp đơn giản hóa và tăng tốc quá trình di chuyển dữ liệu lên AWS.

Thử nghiệm sử dụng AWS DataSync Discovery

Để sử dụng DataSync Discovery, trước tiên cần triển khai agent DataSync ở phía on-premise.

Cài đặt agent trên máy ảo chạy VMware ESXi, Microsoft Hyper-V, hoặc môi trường Linux KVM, kết nối với lưu trữ on-premise và tự động thu thập thông tin như metrics hiệu suất và sử dụng dung lượng theo thời gian.

Nếu đã có kết nối mạng đủ tốt giữa on-premise và AWS thông qua AWS Direct Connect, bạn có thể triển khai agent trên một instance Amazon EC2.

Thông tin thu thập được gợi ý về việc di chuyển sang dịch vụ lưu trữ nào đó của AWS, như Amazon FSx for NetApp ONTAP, Amazon FSx for Windows File Server, Amazon Elastic File System (EFS),…

Đầu tiên, sau khi cài đặt agent, thêm hệ thống lưu trữ từ phần cài đặt. Agent kết nối với lưu trữ thông qua địa chỉ IP hoặc tên host và thông tin xác thực được cung cấp. Quá trình này dự kiến mất khoảng 5 phút.

Khi discovery job được thực hiện, có thể kiểm tra thông tin thu thập được trên bảng điều khiển DataSync, và cũng có thể kiểm tra bằng cách sử dụng DataSync CLI hoặc SDK. CloudWatch có thể phát hiện lỗi từ discovery job nếu có.

Khi job hoàn thành, các đề xuất sẽ được tạo tự động. Các đề xuất bao gồm cấu hình dịch vụ lưu trữ AWS và ước tính chi phí hàng tháng.

Các dịch vụ DataSync Discovery hỗ trợ

 • Network File System (NFS) file servers
 • Server Message Block (SMB) file servers
 • Hadoop Distributed File System (HDFS)
 • Object storage systems
 • Amazon S3 buckets
 • Amazon EFS file systems
 • Amazon FSx for Windows File Server file systems
 • Amazon FSx for Lustre file systems
 • Amazon FSx for OpenZFS file systems
 • Amazon FSx for NetApp ONTAP file systems
 • AWS Snowcone devices
 • Google Cloud Storage buckets
 • Microsoft Azure Files
 • Microsoft Azure Blob Storage (preview)

Ưu điểm của DataSync Discovery

Dễ dàng lập kế hoạch di chuyển

DataSync Discovery nổi bật với tính năng thu thập dữ liệu tự động và đề xuất.

Giảm thiểu thời gian, công sức và chi phí lập kế hoạch di chuyển dữ liệu sang AWS. Sử dụng đề xuất để thông báo cho kế hoạch ngân sách và có thể chạy lại discovery job để tăng độ chính xác cho kế hoạch di chuyển.

Tự động hóa di chuyển dữ liệu

DataSync cho phép di chuyển dữ liệu dễ dàng thông qua mạng giữa hệ thống lưu trữ và dịch vụ.

DataSync hỗ trợ quản lý quy trình chuyển dữ liệu và cung cấp cơ sở hạ tầng cần thiết cho quá trình chuyển dữ liệu an toàn và có hiệu suất cao.

Chuyển dữ liệu an toàn

DataSync đảm bảo chuyển dữ liệu an toàn thông qua mã hóa và xác thực toàn vẹn từ đầu đến cuối.

DataSync sử dụng IAM role để truy cập lưu trữ AWS. Hỗ trợ Virtual Private Cloud (VPC) endpoints, cho phép chuyển dữ liệu mà không cần thông qua public internet.

Tốc độ chuyển dữ liệu

DataSync sử dụng giao thức mạng đặc biệt và kiến trúc đa luồng song song để tăng tốc độ chuyển dữ liệu.

Tăng tốc quá trình di chuyển, quy trình xử lý dữ liệu lặp đi lặp lại cho phân tích, học máy và các quy trình bảo vệ dữ liệu.

Giảm chi phí vận hành

DataSync cài đặt giá cố định theo gigabyte, bạn có thể di chuyển dữ liệu một cách hiệu quả về chi phí.

Không cần tạo và duy trì các maintain custom hoặc sử dụng các công cụ chuyển dữ liệu thương mại đắt tiền.