Mục lục bài viết

1. Giới thiệu về Amazon Kendra

Amazon Kendra là dịch vụ tìm kiếm doanh nghiệp thông minh được hỗ trợ bởi machine learning, cho phép người dùng tìm kiếm thông tin chính xác và phù hợp từ nhiều nguồn dữ liệu khác nhau. Với các mô hình ngôn ngữ lớn tích hợp, Kendra cung cấp trải nghiệm tìm kiếm tương tác và chính xác cao.

Các Tính Năng Chính

  • Tìm kiếm thông minh dựa trên ML
  • Tích hợp nhiều nguồn dữ liệu
  • Tùy chỉnh kết quả tìm kiếm

2. Quy trình Triển khai:

2.1 Chuẩn bị dữ liệu

. Tạo bucket S3 để lưu trữ dữ liệu(CSV, PDF, …)

2.2 Tạo Index trong Kendra

Truy cập AWS Console và tìm dịch vụ Kendra

Tạo Index mới bằng cách nhấn “Create an Index

Đặt tên Index, tạo hoặc chọn IAM Role, nhấn “Next

Cấu hình Access control settings là “No”, User-group expansion là “None”, nhấn “Next

Chọn Edition là “Developer Edition”, nhấn “Next

Lưu ý về Developer Edition:

  • Hỗ trợ 10,000 tài liệu
  • Phù hợp cho proof of concept
  • Chạy trên một availability zone

Cuối cùng nhấn “Create” để tạo index

Ta có kết quả index đã được tạo

2.3 Cấu hình Data Source

Chọn loại Data Source có sẵn, ở bài này tôi chọn S3

Cấu hình S3 Connector

Đặt tên data source, nhấn “Next

Tạo IAM role cho connector, nhấn “Next

Cấu hình các mục cần thiết, nhấn “Next

Enter the data source location (Trỏ tới bucket s3 đã tạo)

Sync mode = Full sync

Sync run schedule = Run on demand

Để mặc định S3 field mapping “s3_document_id”, nhấn “Next

Cuối cùng nhấn “Add data source

2.4 Đồng bộ và Kiểm tra

Sau khi cấu hình, nhấn “”Sync now” để bắt đầu crawl dữ liệu

Đã crawl dữ liệu thành công

Bây giờ, chúng ta có thể test thử tính năng search index đã tạo ra

Test thử, tôi thấy trỏ tới đúng file PDF có trong s3

Kết luận

Amazon Kendra cung cấp giải pháp tìm kiếm doanh nghiệp mạnh mẽ, tích hợp machine learning để cải thiện độ chính xác và trải nghiệm người dùng. Hy vọng bài viết này hữu ích cho các nhà phát triển đang tìm kiếm giải pháp search với độ chính xác cao.