Hadoop 伪分布式部署
文章目录
伪分布式部署
- 以 IP 为 192.168.212.91 的虚拟机为例
- 包下载地址:https://archive.apache.org/dist/
配置 java 运行环境
- 略
创建 hadoop 用户,并配置目录
|
|
配置 Hadoop limits
|
|
配置 hadoop 用户免密
|
|
安装 hadoop(hadoop 用户下执行)
解压安装包
- 上传 hadoop 安装包 hadoop-3.1.0.tar.gz 至用户家目录
|
|
配置环境变量
|
|
修改配置
hadoop-env.sh
|
|
core-site.xml
- fs.defaultFS:指定临时文件路名
- hadoop.tmp.dir:指定配置文件系统路径
|
|
|
|
hdfs-site.xml
- dfs.replication 为 1 表示副本数为 1
- dfs.namenode.name.dir:namenode 存储路径
- dfs.datanode.data.dir:datanode 存储路径
|
|
|
|
mapred-site.xml
- 配置 mapreduce 在 yarn 上运行
|
|
|
|
yarn-site.xml
- 指定reducer获取数据的方式
|
|
|
|
格式化 HDFS 文件系统
|
|
启动 hadoop
|
|
- 验证 hadoop 进程
- 有 jps 可用 jps 命令验证,无 jps 可以如下命令查询
|
|
- 通过网络验证,IP 改为主机 IP:http://192.168.212.91:8088/cluster
文章作者 Xiang
上次更新 2023-06-27