古道长亭

Contact me with ixiaoqiang0011@gmail.com


  • 首页

  • 归档

  • 分类

  • 关于

  • Book

  • 搜索

HBASE应用及优化

时间: 2023-05-27   |   分类: hbase   | 字数: 2820 字 | 阅读约: 6分钟

HBASE应用及优化

1. Java客户端

示例代码: client包 https://gitee.com/ixinglan/hbase.git

2. 协处理器

2.1 概念

访问HBase的方式是使用scan或get获取数据,在获取到的数据上进行业务运算。但是在数据量非常大的时候,比如一个有上亿行及十万个列的数据集,再按常用的方式移动获取数据就会遇到性能问题。客户端也需要有强大的计算能力以及足够的内存来处理这么多的数据。

阅读全文 »

HBASE原理深入

时间: 2023-05-26   |   分类: hbase   | 字数: 3955 字 | 阅读约: 8分钟

HBASE原理深入

1. 读数据流程

HBase读操作

1)首先从zk找到meta表的region位置,然后读取meta表中的数据,meta表中存储了用户表的region信息

阅读全文 »

HBASE基础

时间: 2023-05-25   |   分类: hbase   | 字数: 2872 字 | 阅读约: 6分钟

HBASE基础

1. 简介

HBase基于Google的BigTable论文而来,是一个分布式海量列式非关系型数据库系统,可以提供超大规模数据集的实时随机读写。

关系型数据库存在空间浪费情况

阅读全文 »

Yarn资源调度

时间: 2023-05-23   |   分类: hadoop   | 字数: 2645 字 | 阅读约: 6分钟

Yarn资源调度

1. Yarn架构

  • ResourceManager(rm):处理客户端请求、启动/监控ApplicationMaster、监控NodeManager、资源分配与调度;
  • NodeManager(nm):单个节点上的资源管理、处理来自ResourceManager的命令、处理来自 ApplicationMaster的命令;
  • ApplicationMaster(am):数据切分、为应用程序申请资源,并分配给内部任务、任务监控与容错。
  • Container:对任务运行环境的抽象,封装了CPU、内存等多维资源以及环境变量、启动命令等任务运行相关的信息。

2. Yarn任务提交(工作机制)

阅读全文 »

MapReduce编程框架

时间: 2023-05-22   |   分类: hadoop   | 字数: 8386 字 | 阅读约: 17分钟

MapReduce编程框架

1. 思想

MapReduce思想在生活中处处可见。我们或多或少都曾接触过这种思想。MapReduce的思想核心是分而治之,充分利用了并行处理的优势。

阅读全文 »
8 9 10 11 12 13 14 15 16
古道长亭

古道长亭

Always remember that your present situation is not your final destination. The best is yet to come.

226 日志
57 分类
104 标签
GitHub Gitee
友情链接
  • 古道长亭的BOOK
  • JAVA学习
标签云
  • Mysql
  • 搜索引擎
  • Mybatis
  • 容器
  • 架构
  • 消息队列
  • Flink
  • Sharding sphere
  • 流处理
  • 缓存
© 2019 - 2024 京ICP备19012088号-1
0%