Google BigQuery

📚 Giới Thiệu

Google BigQuery là một kho dữ liệu đám mây không có máy chủ, có khả năng mở rộng cao và hiệu quả về chi phí, được thiết kế để giúp bạn đưa ra các quyết định kinh doanh nhanh chóng. Nó cho phép các truy vấn SQL siêu nhanh đối với các tập dữ liệu lớn bằng cách sử dụng sức mạnh xử lý của cơ sở hạ tầng của Google.

🌟 Key Features

  • Serverless: Không có cơ sở hạ tầng để quản lý hoặc cơ sở dữ liệu để quản trị. BigQuery tự động quản lý và phân bổ tài nguyên.
  • Petabyte Scale: Xử lý các tập dữ liệu ở quy mô petabyte một cách dễ dàng.
  • Real-time Analytics: Hỗ trợ các truy vấn có độ trễ thấp và chèn dữ liệu thông lượng cao để phân tích thời gian thực.
  • BigQuery ML: Cho phép các nhà khoa học dữ liệu và nhà phân tích dữ liệu xây dựng và vận hành các mô hình học máy trong BigQuery bằng các truy vấn SQL đơn giản.
  • Built-in GIS: Hỗ trợ các hàm và kiểu dữ liệu không gian địa lý để phân tích dữ liệu vị trí.
  • Federated Queries: Cho phép bạn truy vấn dữ liệu trong các nguồn bên ngoài (như Cloud Storage, Bigtable và Cloud SQL) mà không cần sao chép dữ liệu.

✅ Ưu Điểm

  • Tốc độ đáng kinh ngạc: Trả về kết quả từ các truy vấn phức tạp trên các tập dữ liệu lớn trong vài giây.
  • Dễ sử dụng: Giao diện SQL quen thuộc giúp các nhà phân tích dễ dàng truy cập.
  • Hiệu quả về chi phí: Mô hình định giá theo yêu cầu có nghĩa là bạn chỉ trả tiền cho các truy vấn bạn chạy.
  • Tích hợp ML: Dân chủ hóa việc học máy bằng cách cho phép nó được thực hiện bằng SQL.

❌ Nhược Điểm

  • Không dành cho khối lượng công việc OLTP: Đây là một công cụ phân tích (OLAP), không được thiết kế cho các giao dịch nhỏ, thường xuyên.
  • Chi phí truy vấn: Các truy vấn được viết không tốt có thể quét một lượng lớn dữ liệu và trở nên rất tốn kém.
  • Cập nhật và xóa: Mặc dù được hỗ trợ, nhưng các hoạt động cập nhật và xóa hàng loạt không hiệu quả như trong cơ sở dữ liệu giao dịch.
  • Không phải là thời gian thực thực sự: Mặc dù nhanh, nhưng nó được thiết kế cho các truy vấn phân tích gần thời gian thực, không phải cho các hoạt động có độ trễ mili giây.