Apache Hadoop YARN 是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度
HBase 提供了预分区功能,即用户可以在创建表的时候对表按照一定的规则分区
HBase 的 Rowkey 设计可以说是使用 HBase 最为重要的事情,直接影响到HBase的性能
maven 是一种软件项目管理和理解的工具。基于项目对象模型的概念。
Kafka 消息系统
Filebeat 采集日志到 Kafka 配置及使用
Flink 在流程序中支持不同的 Time 概念,就比如有 Processing Time、Event Time 和 Ingestion Time。
CDH6 安装