Presto免费版下载-Presto(分布式SQL查询引擎) v0.245.1 官方版下载

Presto(分布式SQL查询引擎) v0.245.1 官方版

大小:24.3MB 时间:2021-01-15

语言:简体中文 环境:Win All

简介

Presto是一款功能强大的分布式sql查询引擎,这款软件是由facebook推出的,在java的基础上进行开发的。Presto最新版主要是用于交互式查询,数据支持gb到pb字节。该软件不能够存储数据,但是能够接入多个不同的数据源,同时还能支持跨数据源的级联查询。

Presto电脑版内置高性能的内存计算引擎,与同类软件相比,不管是tez、mr、spark引擎,impala效率至少是5到10倍,实用性极强。

Presto

Presto支持的数据源

常见的RDBMS都支持,如:Oracle、MySQL、PG等;

NoSQL:MongoDB、Redis、ElasticSearch 等;

大数据:Hive、HBase(第三方)、Kudu、Kafka 等;

Presto 支持从多种数据源获取数据来进行运算分析,一条SQL查询可以将多个数据源的数据进行合并分析。如如下SQL:a可以来源于MySQL,b可以来源于Hive。

Presto优势

1.多数据源、混合计算支持:支持众多常见的数据源,并且可以进行混合计算分析;

2.大数据:完全的内存计算,支持的数据量完全取决于集群内存大小。他不像SparkSQL可以配置把溢出的数据持久化到磁盘,Presto是完完全全的内存计算;

3.高性能:低延迟高并发的内存计算引擎,相比Hive(无论MR、Tez、Spark执行引擎)、Impala 执行效率要高很多。根据Facebook和京东的测试报告,至少提升10倍以上;

4.支持ANSI SQL:这点不像Hive、SparkSQL都是以HQL为基础(方言),Presto是标准的SQL。用户可以使用标准SQL进行数据查询和分析计算;

5.扩展性:有众多 SPI 扩展点支持,开发人员可编写UDF、UDTF。甚至可以实现自定义的Connector,实现索引下推,借助外置的索引能力,实现特殊场景下的 MPP;

6.流水线:Presto 是基于PipeLine进行设计,在大量数据计算过程中,终端用户(Driver)无需等到所有数据计算完成才能看到结果。一旦开始计算就可立即产生一部分结果返回,后续的计算结果会以多个Page返回给终端用户(Driver)。

软件优势

Presto应用场景

1.实时计算:Presto 性能优越,实时查询工具上的重要选择。

2.Ad-Hoc查询:数据分析应用、Presto 根据特定条件的查询返回结果和生成报表。

3.ETL:因支持的数据源广泛、可用于不同数据库之间迁移,转换 和 完成 ETL 清洗的能力。

4.实时数据流分析:Presto-Kafka Connector 使用 SQL对Kafka的数据流进行清洗、分析。

5.作为MPP:Presto Connector 有非常好的扩展性,可进行扩展开发,可支持其他异构非SQL查询引擎转为SQL,支持索引下推。

应用场景

配置要求

Mac OS X或Linux

Java 8 Update 151或更高版本(8u151 +),64位。支持Oracle JDK和OpenJDK。

Maven 3.3.9+(用于建筑)

Python 2.4+(用于与启动脚本一起运行)

Presto安装方法

Presto安装:

Presto是一个标准的Maven项目。只需从项目根目录运行以下命令:

./mvnw clean install

在第一个构建中,Maven将从Internet下载所有依赖项并将它们缓存在本地存储库(~/.m2/repository)中,这可能会花费大量时间。随后的构建将更快。

Presto有一套全面的单元测试,可能需要几分钟才能运行。您可以在构建时禁用测试:

./mvnw clean install -DskipTests

厂商名称:

官网:

sql查询软件

推荐下载

特色标签

精彩合集,奇葩无下限 更多

相关文章