logo头像

Always believe youself.

大数据

DeltaLake架构

Delta 架构Delta 架构介绍Delta 架构代替经典的 Lambda 架构 第一,同时读写,并且要保证数据的一致性 就是刚才我们提出的第一个需求,就是要支持 transcation,就是说你只要能实现读写之间的 Snap...

DeltaLake入门

Delta Lake,让你从复杂的 Lambda 架构中解放出来 方案升级过程方案一建设一个基本的 Data Pipeline [数据处理流水线],按照项目经理的说法,那就很简单。我们把 Kafka、Kinesis、各种各样数据湖的...

ElasticSearch入门基础

elasticsearchElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。 cluster代表一个集群,集群中有多个节点,其中有一个为主节点,这...

Flume基础入门

日志收集系统flume (日志收集系统)Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处...

HBase基础

HBase基础HBase是一种构建在HDFS之上的分布式,面向列的存储系统。应用场景:需要实时写入,随机访问超大数据集。 HBase通过线性方式从上到下增加节点来进行扩展。HBase不是关系型数据库,也不支持SQL,但是他有自己的特长...

ZooKeeper详解

ZooKeeper是一个分布式应用所设计的 开源协调服务 。他可以为用户提供同步、配置管理、分组和命名等服务。 简介1、ZooKeeper的设计目标 (1)简单化: 允许分布式的进程通过共享体系的命名空间来进行协调,这个命名空间的组织...