[PRESTO] - Overview

Use case

Phần này đặt Presto vào viễn cảnh để các quản trị viên tiềm năng và người dùng cuối biết những gì mong đợi từ Presto.

Presto không là gì?

Vì Presto đang được nhiều thành viên của cộng đồng gọi là cơ sở dữ liệu, nên bắt đầu với một định nghĩa về những gì Presto không phải là.

Đừng nhầm lẫn rằng Presto hiểu SQL với nó cung cấp các tính năng của cơ sở dữ liệu tiêu chuẩn. Presto không phải là một cơ sở dữ liệu quan hệ mục đích chung. Nó không phải là sự thay thế cho các cơ sở dữ liệu như MySQL, PostgreSQL hoặc Oracle. Presto không được thiết kế để xử lý Xử lý giao dịch trực tuyến (OLTP). Điều này cũng đúng với nhiều cơ sở dữ liệu khác được thiết kế và tối ưu hóa cho kho dữ liệu hoặc phân tích.

Presto là gì

Presto là một công cụ được thiết kế để truy vấn hiệu quả lượng dữ liệu khổng lồ bằng các truy vấn phân tán. Nếu bạn làm việc với terabyte hoặc petabyte dữ liệu, bạn có thể đã quen sử dụng các công cụ tương tác với Hadoop và HDFS. Presto được thiết kế thay thế cho các công cụ truy vấn HDFS bằng cách sử dụng các đường dẫn của các công việc MapReduce như Hive hoặc Pig, nhưng Presto không giới hạn truy cập HDFS. Presto có thể và đã được mở rộng để hoạt động trên các loại nguồn dữ liệu khác nhau bao gồm cả cơ sở dữ liệu quan hệ truyền thống và các nguồn dữ liệu khác như Cassandra.

Presto được thiết kế để xử lý kho dữ liệu và phân tích: phân tích dữ liệu, tổng hợp số lượng lớn dữ liệu và tạo báo cáo. Các khối lượng công việc này thường được phân loại là Xử lý phân tích trực tuyến (OLAP).

Ai sử dụng Presto?

Presto là một dự án nguồn mở hoạt động dưới sự bảo trợ của Facebook. Nó được phát minh tại Facebook và dự án tiếp tục được phát triển bởi cả các nhà phát triển nội bộ của Facebook và một số nhà phát triển bên thứ ba trong cộng đồng.

Phạm Thanh Hoài

Search This Blog

[PRESTO] - Overview

Use case

Presto không là gì?

Presto là gì

Ai sử dụng Presto?

Comments

Post a Comment