![大数据技术与应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/689/33643689/b_33643689.jpg)
3.5 实训1 Hadoop搭建
1.实训目的
掌握Hadoop平台的安装和配置。
2.实训内容
搭建Hadoop平台的第一步,就是根据实际情况选择最合适的Hadoop版本。目前,由于Hadoop飞速发展,功能更新和错误修复在不断地迭代着,所以版本特别多,显得有些杂乱。结合功能和稳定性两方面,这里选择CDH5。该版本是目前生产环境中装机量较大的版本之一,涵盖了所有Hadoop版本的主要功能和模块,稳定且有很多有用的新特性。下载地址为https://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.6.0.tar.gz。
Hadoop的运行环境有以下两种。
● Windows。虽然Hadoop社区目前已经支持Windows,但由于Windows操作系统本身不适合作为服务器操作系统,因此本书不介绍Windows下Hadoop的安装方式。
● Linux。Hadoop的最佳运行环境无疑是开源操作系统Linux。Linux的发行版本众多,常见的有CentOS、Ubuntu、RedHat等。本书选择的就是CentOS。
(1)安装虚拟机
1)进入VMware安装向导,如图3-12所示,单击“下一步”按钮。
2)选择自定义安装,进入“自定义安装”界面,如图3-13所示,单击“下一步”按钮。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_01.jpg?sign=1739303833-AQrovdROth2XN3V5oGyJLd4p0Uya0RHb-0-1da4085ffcc69d5a131b84626d4ecd44)
图3-12 VMware安装向导
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_02.jpg?sign=1739303833-gUSIyLslty4ejyI2ZGnJRylzUuZ4XyZe-0-33b72cc08c665cd739e941cdad4150ab)
图3-13 “自定义安装”界面
3)进入“用户体验设置”界面,设置用户体验,单击“下一步”按钮,如图3-14所示。
4)进入“快捷方式”界面,选择创建快捷方式的位置,单击“下一步”按钮,如图3-15所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_03.jpg?sign=1739303833-rCcmWLDeIv8mO6BnvVoX6dl9im1WItig-0-0cbafed641d3638f8df4110c41e691ca)
图3-14 “用户体验设置”界面
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/65_04.jpg?sign=1739303833-M6kxewsq84HQDzf6dH3vVIoaXdW4h1NS-0-47e87d211736e6a44993b0851a6f05a2)
图3-15 “快捷方式”界面
5)准备工作完成,单击“安装”按钮,开始安装,如图3-16所示。
6)在安装过程中不需要用户执行任何操作,如图3-17所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_01.jpg?sign=1739303833-nmCLxvlEBw41OmPliRwDoIHTlpEtHmgj-0-b8a09bfabb8b8340b8aa23708fd4860a)
图3-16 开始安装
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_02.jpg?sign=1739303833-dt8znqSJJA30StmEdRD2Y1UAFotidVAq-0-6393ebf0e7613295f3a94cb6f52f1aeb)
图3-17 安装过程
7)单击“完成”按钮,退出安装向导,安装完成,如图3-18所示。
(2)新建虚拟机并安装CentOS
1)选择“自定义(高级)”单选按钮,进入新建虚拟机向导,单击“下一步”按钮,如图3-19所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_03.jpg?sign=1739303833-iSljBpge7bmPfRrq6LdzDZUUghTqpqyj-0-cb048feea5460e5ae1db661b1fd3ce80)
图3-18 安装完成
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_04.jpg?sign=1739303833-p438EyUGtTtVgJoaMMdWOR6sGuvNtRZ2-0-a3fabdea0bf84499719c2c05342d90e2)
图3-19 新建虚拟机向导
2)选择虚拟机硬件兼容性,单击“下一步”按钮,如图3-20所示。
3)安装客户机操作系统,单击“下一步”按钮,如图3-21所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_05.jpg?sign=1739303833-dBPsA4o8j92dq5uwM5cW5VISCxT5Ux8v-0-42a2548dba55eac2d6ca95b9479a3db7)
图3-20 选择虚拟机硬件兼容性
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/66_06.jpg?sign=1739303833-4Pm9gafC38FB9erofqRyBmMTfErK17JM-0-7c0e4f80b3e5d7796308717c3b984d77)
图3-21 安装客户机操作系统
4)设置安装信息,单击“下一步”按钮,如图3-22所示。
5)命名虚拟机为“hadoop”,并选择安装位置,单击“下一步”按钮,如图3-23所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_01.jpg?sign=1739303833-lcMyHIO24ZH1oDJBCSpCQItfGWtrdNeC-0-b65047d52cd5a0b3a7fd35b126b5eb6e)
图3-22 设置安装信息
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_02.jpg?sign=1739303833-Ink3lT4YUdc42okSgMDlSqUV32kDZ8yX-0-e3312ce1428680ae8a48006029da4bfe)
图3-23 命名虚拟机
6)配置处理器参数,单击“下一步”按钮,如图3-24所示。
7)给虚拟机分配内存,单击“下一步”按钮,如图3-25所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_03.jpg?sign=1739303833-A1Xm6ewciYY1idBWA4uzpGSOcUhDPCK2-0-328107d55ba5301cd15c17196db6b4ab)
图3-24 配置处理器
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/67_04.jpg?sign=1739303833-HiBVrzXwXTCGFPTNZ4yGNjFWotpXK2xf-0-de2b0b7d1c1b62071e17c2914e394334)
图3-25 设置虚拟机内存
8)选择“使用网络地址转换(NAT)”单选按钮,为虚拟机添加网络,单击“下一步”按钮,如图3-26所示。
9)选择“LSI Logic(L)(推荐)”单选按钮,设置I/O控制器类型,单击“下一步”按钮,如图3-27所示。
10)选择“SCSI(S)(推荐)”单选按钮,设置磁盘类型,单击“下一步”按钮,如图3-28所示。
11)选择“创建新虚拟磁盘”单选按钮,单击“下一步”按钮,如图3-29所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_01.jpg?sign=1739303833-VzwqEbK53AlfKi9X0T3lkdJjzCaGwc8w-0-bb22003b9a547744df2b39c94da67045)
图3-26 选择网络类型
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_02.jpg?sign=1739303833-kAFfBMXLVSlK99owmbxInwBigsRFvSnb-0-def87225c6a6fd6185730f1ddaef6fd9)
图3-27 选择I/O控制器类型
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_03.jpg?sign=1739303833-1qrq7WrqluJmOTcf1CZvV2zirPq31wlG-0-c4321c9cdf4732b0b77109f65a5ebb82)
图3-28 选择磁盘类型
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_04.jpg?sign=1739303833-rhDBOBt8elBKanPOp0M6etORq88jW7Kq-0-f77592fa73eb5cfa8e60f8800f6d730f)
图3-29 选择磁盘
12)设置“最大磁盘大小”为20GB,单击“下一步”按钮,如图3-30所示。
13)选择磁盘文件存储位置,单击“下一步”按钮,如图3-31所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_05.jpg?sign=1739303833-iPvsMsjB0PqetsAgdqIXpwC1tIM4h3Hm-0-714917c4fb50fde7c0c2819eaa9949f1)
图3-30 指定磁盘容量
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/68_06.jpg?sign=1739303833-bCwwiqmXEz6lBC8WlL4aXcnd3035WhoX-0-1d94aed0c428304f8f3d89eb9a2e4d88)
图3-31 指定磁盘文件存储位置
14)单击“完成”按钮,虚拟机创建结束,如图3-32所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/69_01.jpg?sign=1739303833-fkrVJja6poTO2elLWP40SpQykBOpyEmp-0-7f8c7252ea5234652109bcb79d5c23c0)
图3-32 创建完成
15)安装完成后,可以看到前面创建的hadoop虚拟机,设置用户名为“root”,如图3-33所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/69_02.jpg?sign=1739303833-EE0y2rxbe4YBJDYJQ1M608TkidNvrFA3-0-ee27db3160b12708403966c946246a7f)
图3-33 设置用户名
(3)配置CentOS网卡
1)执行“vi/etc/sysconfig/network-scripts/ifcfg-eth0”命令编辑ifcfg-eth0网卡,如图3-34所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/70_01.jpg?sign=1739303833-PVhrg67LRnqXraFDx2Y5mE22S1kOpP02-0-c1349b7a0ab8bcec2b3df5465774a36e)
图3-34 输入编辑网卡命令
2)在该网卡内修改其IP地址、子网掩码及网关,如图3-35所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/70_02.jpg?sign=1739303833-jEmKeDMDOO3TsqAyZXUN9ZQETbdIK79q-0-dc209923a30233b6ce2ec2d6a5ee5966)
图3-35 设置IP地址
3)修改完成后,执行“service network restart”命令重启网卡,如图3-36所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/71_01.jpg?sign=1739303833-2HH1vNYM4b6jpbVPgXP9Tc14hKf1tsot-0-59523fb2a2105858b28a3468664003c2)
图3-36 重启网卡
4)重启后,执行“ifconfig”命令查看网卡相关信息,如图3-37所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/71_02.jpg?sign=1739303833-1EA0X2rljzX7EMT5YN6Df95mqktMCnoN-0-79dcd521c14a442903d5d3523e36507e)
图3-37 查看网卡信息
5)执行“vi/etc/system/network”命令编辑network文件,如图3-38所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/72_01.jpg?sign=1739303833-spnnSCxEwrbaK61Q1gjyMQiGU9NIBSSF-0-43bb1b29a380cc451a747cabb36775ee)
图3-38 输入编辑文件命令
6)进入CentOS系统名称修改界面,修改系统名称(HOSTNAME)为“hadoop”,如图3-39所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/72_02.jpg?sign=1739303833-yNfKcGgh1AV1gUrh1hzW0zdBoUpXwNdI-0-087c5d6d4af46d24a8ba09b605355bab)
图3-39 修改系统名称
7)设置完成后,执行“reboot”命令重启虚拟机,如图3-40所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/73_01.jpg?sign=1739303833-3L1Zg1Qwc9i6apRlehrrCd7dsuPqOv4Q-0-0400ecc602e0f022094c9b0e180aaa4a)
图3-40 重启虚拟机
8)执行“vi/etc/host”命令编辑hosts文件,如图3-41所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/73_02.jpg?sign=1739303833-PMmvXv9cy7BY2f4y55wnKYWkJzJNWoWH-0-5dd164241efd188a0e632a9e73789592)
图3-41 输入编辑文件命令
9)进入绑定IP地址与主机名界面,输入要绑定的IP地址与主机名,如图3-42所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/74_01.jpg?sign=1739303833-j8jjFuKeIPt4hvIH3zBmb1qhUMwYcHFI-0-af72f5841a3fda62468f97b336f89807)
图3-42 输入要绑定的IP地址与主机名
(4)配置ssh无密码连接
1)执行“ssh-keygen”命令生成公钥。生成公钥后执行“ssh-copy-id 192.168.137.10”命令,将其转发至本机的authorized_keys列表,如图3-43所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/74_02.jpg?sign=1739303833-xuX7ZufJ0GqFnQpJ2PlJ1pMkvqzN6we3-0-71d6eb810aa5f9443831b60f18f7c276)
图3-43 生成公钥并转发
2)使用SecureCRT工具上传JDK安装包至hadoop主机,为下一步安装JDK做准备,如图3-44所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/75_01.jpg?sign=1739303833-6Qf4pNGpFPwDCdJ6ouWUlKDzggUdagW6-0-3e743d487e7a1c0e9950145bae704c5b)
图3-44 上传JDK安装包
(5)安装JDK与Hadoop环境
1)使用tar命令解压JDK安装包,如图3-45所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/75_02.jpg?sign=1739303833-kRSmAFLY5tBZrwL8hW5RakzmTTPj4PDb-0-43bce7db3b2c937fea6a126fad5af4e1)
图3-45 解压JDK安装包
2)执行“vi/etc/profile”命令编辑profile文件,配置JDK环境变量,如JAVA_HOME和PATH,如图3-46所示。
3)执行“source/etc/profile”命令使profile文件立即生效,如图3-47所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/76_01.jpg?sign=1739303833-DRW3FOQxrssCBgEO2CXDwprPVAvtiH9C-0-26dec4f617b709337efbb57f1562831e)
图3-46 配置JDK环境变量
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/76_02.jpg?sign=1739303833-BEWEyRr7nthxSs19TV5zKhScZBw7dYav-0-e43ae7e6a4cf4f8c959190b3720b74fe)
图3-47 使profile文件生效
4)执行“java-version”命令查看JDK安装结果,能看到已经安装成功,如图3-48所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/76_03.jpg?sign=1739303833-myTCBlWATgCDzrYNJh6OnrrCe231xMOg-0-fc3cde32dc8d41d20f73a9aa5916a28c)
图3-48 查看JDK安装结果
5)上传Hadoop安装包文件至虚拟机,如图3-49所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/77_01.jpg?sign=1739303833-H28oFTTxdvLWKWLwgsN77zf3l3nSHI7L-0-d2d6989afb7b0036cff353829edfe48e)
图3-49 上传Hadoop安装包
6)使用tar命令解压Hadoop安装包,如图3-50所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/77_02.jpg?sign=1739303833-glXqMkmC6pey5FC4CziG7dKwkTdoR7hb-0-33131c2607d872dfad9b2630b26e9a21)
图3-50 解压Hadoop安装包
7)使用mv命令将解压后的Hadoop安装文件从上传目录移动至opt目录下,如图3-51所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/77_03.jpg?sign=1739303833-uAB0NovlO6eJs7WCMjP6gmc03yUWr2Dw-0-50187210f71f5dc245dd45d8867ca70f)
图3-51 移动Hadoop安装文件
8)执行“vi/etc/profile”命令编辑profile文件,为Hadoop配置环境变量,如图3-52所示。执行“source/etc/profile”命令使profile文件立即生效。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_01.jpg?sign=1739303833-5BX3dtA2Y9Ttp9dJcbl5PrWdRbTb4kSy-0-6439a2e4626faeff11a122c170332664)
图3-52 配置Hadoop环境变量
9)使用vi命令修改Hadoop配置文件,即hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml和slaves文件,如图3-53所示。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_02.jpg?sign=1739303833-nyKVHIXIGlHpFtN4YZWjeCfYBnTpu0Qr-0-a5c13f702e16f3802fb0a32cca5e5bb6)
图3-53 修改Hadoop配置文件
① 修改hadoop-env.sh文件,在文件末尾追加环境变量语句。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_03.jpg?sign=1739303833-kKt1xddUzD7n8pV5aVP6PjcN1JnnjnUX-0-9ea945a1342bb2b061cc21f866d30fff)
② 修改core-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/78_04.jpg?sign=1739303833-xlUCgB6pcILe2ROElmBjshtyss8tcIJ4-0-a1366c5d468f4a6cdf3345dc533ad775)
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_01.jpg?sign=1739303833-v5q7RfI8Yjj6rEWdokumcAfxoX8gKOYl-0-849a89835382329a8cdc26f56f86f39e)
③ 修改hdfs-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_02.jpg?sign=1739303833-B508vId6asNsLKTF0DjTS82IDCXuEkMW-0-aa28d73821d37da5e060a7f98da542cb)
④ 修改mapred-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_03.jpg?sign=1739303833-t7AurPHYleKKhqU12TwVeAb4LO5ZUR6E-0-aed6f66f016aa8850201a700a9a2cf03)
⑤ 修改yarn-site.xml文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/79_04.jpg?sign=1739303833-CQeoj0293fOUx6vpohPtCRfd7c4vQQJ0-0-b60c1f6990c96ef5782969741a3be9cc)
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/80_01.jpg?sign=1739303833-36RK5Nx7ukouFWPDV0c8mKnUSzfDyM0P-0-d0183d3d4ef43b350fd57480aa140889)
⑥ 修改slaves文件,修改如下。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/80_02.jpg?sign=1739303833-jr62oFi57Vsf3wlwa0JCJpFMYS7z1Hc4-0-b2e54557b086a63a275d04964b19adf1)
10)执行“hadoop namenode-format”命令格式化HDFS。最后执行“hadoop version”命令查看安装完成后的Hadoop,如图3-54所示。至此,Hadoop已经安装并配置完成。
![](https://epubservercos.yuewen.com/1E2B13/17977545601605106/epubprivate/OEBPS/Images/80_03.jpg?sign=1739303833-57nNpUjgxAQOXeFANsvO7cb2nGArYSCf-0-7240865f0f327df5e16195770a016d94)
图3-54 查看Hadoop安装信息