Amazon Redshift

📚 Giới Thiệu

Amazon Redshift là một dịch vụ kho dữ liệu quy mô petabyte, được quản lý hoàn toàn trong đám mây. Bạn có thể bắt đầu với chỉ vài trăm gigabyte dữ liệu và mở rộng quy mô lên một petabyte hoặc hơn. Điều này cho phép bạn sử dụng dữ liệu của mình để có được những hiểu biết mới cho doanh nghiệp và khách hàng của mình.

🌟 Key Features

  • Petabyte-Scale Data Warehousing: Có khả năng xử lý các tập dữ liệu cực lớn.
  • Columnar Storage: Lưu trữ dữ liệu theo cột, tối ưu hóa cho các truy vấn phân tích và giảm đáng kể I/O.
  • Massively Parallel Processing (MPP): Tự động phân phối dữ liệu và khối lượng công việc truy vấn trên tất cả các nút để thực thi song song.
  • Redshift Spectrum: Cho phép bạn chạy các truy vấn SQL đối với dữ liệu phi cấu trúc trong Amazon S3 mà không cần phải tải hoặc chuyển đổi dữ liệu.
  • Concurrency Scaling: Tự động thêm và xóa dung lượng cụm để xử lý các khối lượng công việc đọc đồng thời không thể đoán trước.
  • Federated Queries: Cho phép bạn truy vấn và phân tích dữ liệu trên các cơ sở dữ liệu hoạt động, kho dữ liệu và hồ dữ liệu của mình.

✅ Ưu Điểm

  • Hiệu suất truy vấn nhanh: Được thiết kế cho hiệu suất cao trên các tập dữ liệu lớn.
  • Hiệu quả về chi phí: Rẻ hơn đáng kể so với các giải pháp kho dữ liệu tại chỗ truyền thống.
  • Khả năng mở rộng: Dễ dàng thay đổi kích thước cụm của bạn hoặc mở rộng quy mô với tính năng thay đổi kích thước đồng thời hoặc đàn hồi.
  • Tích hợp hệ sinh thái: Tích hợp tốt với các dịch vụ AWS khác như S3, EMR, Glue và QuickSight.

❌ Nhược Điểm

  • Không dành cho khối lượng công việc OLTP: Được thiết kế cho các truy vấn phân tích, không phải cho các giao dịch nhỏ, có độ trễ thấp.
  • Độ phức tạp của việc quản lý: Mặc dù được quản lý, nhưng vẫn đòi hỏi kiến thức về quản lý kho dữ liệu để có hiệu suất tối ưu (ví dụ: các phím phân phối, các phím sắp xếp).
  • Chi phí: Có thể tốn kém đối với các cụm lớn, liên tục chạy.
  • Khả năng tương thích: Sử dụng SQL dựa trên PostgreSQL, nhưng có thể không tương thích 100% với tất cả các công cụ BI và ETL.