Amazon DataZone là gì?

DataZone là một data catalog có các tính năng giao diện người dùng (UI) dành cho người không có chuyên môn về IT. Sử dụng Amazon DataZone giúp dễ dàng lập catalog, tìm kiếm, chia sẻ và quản lý dữ liệu đang được lưu trữ trong các resource của AWS, on-premises và bên thứ ba. DataZone giúp những người sử dụng như kỹ sư, nhà khoa học dữ liệu, người quản lý sản phẩm, phân tích viên, người dùng doanh nghiệp có thể dễ dàng truy cập vào dữ liệu của toàn bộ tổ chức để tìm kiếm và sử dụng thông tin chi tiết của dữ liệu.

DataZone có 4 loại component chính:

  1. Data portal
  2. Business data catalog
  3. Data project
  4. Pub/Sub workflow with access management

DataZone AI recommendations – Cập nhật AI vào DataZone

Đây là một tính năng mới dựa trên AI được tạo ra để cải thiện việc tìm kiếm, hiểu và sử dụng dữ liệu bằng cách cải thiện business data catalog.

Đối với Data producer: Có thể tạo ra mô tả và background của dữ liệu chỉ với một cú nhấp chuột. Họ cũng có thể đánh dấu các cột dữ liệu quan trọng và đề xuất usecage cho các phân tích.

Đối với Data user: Có thể dễ dàng phát hiện dữ liệu thông qua các đề xuất của AI. Thêm các giải thích và ví dụ sử dụng dựa trên dữ liệu. Điều này giúp việc ứng dụng dữ liệu trở nên mượt mà hơn.

Việc sử dụng ML/AI để tạo ra catalog đã trở nên phổ biến trong quản lý metadata, tạo catalog và nền tảng quản trị.

Tổng kết

Đây là bài giới thiệu tính năng dựa trên AI để cải thiện business data catalog dành cho Amazon DataZone (phiên bản dùng thử). DataZone đang ở giai đoạn đầu của quá trình triển khai, vì vậy sẽ có các bản cập nhật cho phiên bản dùng thử. Dịch vụ này có thể sẽ phát triển thành một dịch vụ dựa trên ruled-base grovernance cho dữ liệu và các tài nguyên liên quan.

Tham khảo: 

Amazon DataZone AI recommendationsが発表されました | SunnyCloud