大数据中服役新数据节点和退役旧节点步骤(hive,hadoop) 2024-05-07 hive, 数据仓库, hadoop, 分布式, 大数据 77人 已看 当要新上线数据节点的时候 ,需要把数据节点的名字追加在 dfs.hosts(1)关闭新增节点的防火墙(2)在 NameNode 节点的 hosts 文件中加入新增数据节点的 hostname(3)在每个新增数据节点的 hosts 文件中加入 NameNode 的 hostname(4)在 NameNode 节点上增加新增节点的 SSH 免密码登录的操作(5)在 NameNode 节点上的 dfs.hosts 中追加上新增节点的 hostname,
hadoop学习---基于Hive的教育平台数据仓库分析案例(二) 2024-05-07 hive, 学习, 数据仓库, hadoop, 大数据 74人 已看 hadoop学习---基于Hive的教育平台数据仓库分析案例(二)
ETL免费工具kettle(PDI),安装和配置 2024-05-06 数据仓库, etl 276人 已看 起源:Kettle最早是一个开源的ETL工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。在2006年,Pentaho公司收购了Kettle项目,原Kettle项目发起人Matt Casters加入了Pentaho团队,成为Pentaho套件数据集成架构师 [1];从此,Kettle成为企业级数据集成及商业智能套件Pentaho的主要组成部分,Kettle亦重命名为[1-2]。