常规
202人加入学习
Hadoop大数据开发基础
价格 ¥ 369.00
课程还未发布,不允许加入和购买

三、监控集群

[前提]本地设置映射。“C:/windows/System32/drivers/etc/hosts”,打开hosts,编写映射代码如下(参考master中的/etc/hosts):

IP地址 节点名 主机名

192.168.128.130 master master.centos.com

192.168.128.131 slave1 slave1.centos.com

192.168.128.132 slave2 slave2.centos.com

192.168.128.133 slave3 slave3.centos.com

 

(1)50070端口。监控NodeManager

启动本地浏览器窗口,输入“master:50070”进入NodeManager端口,Overview

 Datanodes,记录子节点信息

Utilities/Browse the file system,查看HDFS文件信息,Utilities/logs,查看日志信息,

浏览器地址栏输入“master:50070/dfshealth.jsp”,可以查看整个HDFS系统。

(2)8088端口。监控ResourceManager

本地浏览器,输入“master:8088”,显示与YARN框架相关窗口

(3)19888端口。日志服务端口。

本地浏览器,输入“master:19888”,显示与日志窗口

[展开全文]

一、启动集群

XShell中master进入Hadoop目录下

(1)启动HDFS。输入“sbin/start-dfs.sh”、输入“jps”,查看启动的服务。

反馈“1296 NameNode”“1498 SecondaryNameNode”

(2)启动YARN。输入“sbin/start-yarn.sh”、输入“jps”

反馈“1722 ResourceManager”

(3)启动JobHistoryServer。输入“sbin/mr-jobhistory-daemon.sh start historyserver”、输入“jps”

反馈“2175 JobHistoryServer”

必须在master主节点上通过输入jps,显示:NameNode / SecondaryNameNode / ResourceManager / JobHistoryServer / Jps

必须在slave子节点上通过输入jps,显示:DataNode /NodeManager / Jps

集群启动成功!

无法启动的原因

(1)master和slave相关配置错误

(2)master和slave时间同步错误

 

二、关闭集群

关闭虚拟机之前必须关闭Hadoop集群。XShell中master进入Hadoop目录下,输入

sbin/stop-yarn.sh,关闭YARN

sbin/stop-dfs.sh,关闭HDFS

sbin/mr-jobhistory-daemon.sh stop historyserver,关闭JobHistoryServer

 

 

 

[展开全文]

配置ntp时间同步服务

ntp服务器,计算机时间同步化协议。目的就是使Hadoop各个节点之间时间同步。

(1)各个节点,安装ntp服务

挂载yum源。输入“mount /dev/dvd /media/”,注意/dvd ,后面有个空格。

在线下载安装ntp。输入“yum -y install ntp”,进行安装,出现Complete!表示成功安装。

同样操作在slave们。

(2)以master节点为主节点(其他slave节点时间同步于master),使用“vim /etc/ntp.conf”打开master节点该文件,“注释掉server开头的行”,添加如下内容:

restrict 192.168.0.0 mask 255.255.255.0 nomodify notrap

server 127.127.1.0

fudge 127.127.1.0 stratum 10

(3)在slave1/slave2/slave3配置ntp,使用“vim /etc/ntp.conf”打开该文件,“注释掉server开头的行”,添加如下内容:

server master

(4)输入“service iptables stop & chkconfig iptalbes off”永久关闭防火墙,master和slave们都要关闭

(5)启动ntp服务。注意启动顺序

master主节点输入“service ntpd start & chkconfig ntpd on”,启动ntp服务并且是永久性启动。

slave子节点们输入“ntpdate master”,启动同步。

slave子节点们输入“service ntpd start & chkconfig ntpd on”,启动ntp服务并且是永久性启动。

~~~~~~~~~~~~~~~~~~~~~~~~~~~

以上是关于Hadoop的所有配置完成!!!!

~~~~~~~~~~~~~~~~~~~~~~~~~~~

格式化集群

主要是格式化namenode的操作,在节点初始化HDFS的相关配置,只需一次,永久生效。

先看一下/etc/profile是否已经写入JAVA_HOME和HADOOP_HOME了,输入“source /etc/profile”,使改变生效。各个slave子节点同样需要设置环境变量。

master主节点输入“hdfs namenode -format”,出现“...has been successfully formatte”

 

 

[展开全文]

SSH免密登录

SSH,Secure Shell,一组安全协议,保证了远程登录和网络传输服务的安全性,防止信息泄露。即从master节点向slave节点传输数据时不需要输入密码,master节点可以跳转到slave节点目录而不需要输入登录密码。

【例:master节点】

(1)生成公钥与私钥对。输入“ssh-keygen -t rsa”,按三次enter键。生成id_rsa(私钥)和id_rsa.pub(公钥)两个文件

(2)修改ip和hostsname映射。在4个节点中修改/etc/hosts文件(每个节点都要修改,输入“vi /etc/hosts”,删除预制的两个映射),增加内容为

IP地址 节点名称 主机名称

192.168.128.130 master master.centos.com

192.168.128.131 slave1 slave1.centos.com

192.168.128.132 slave2 slave2.centos.com

192.168.128.133 slave3 slave3.centos.com

保存退出。

(3)复制公钥到远程虚拟机中。输入“ssh-copy-id -i /root/.ssh/id_rsa.pub master”,将公钥传递到master节点,yes,输入登录密码123456

输入“ssh-copy-id -i /root/.ssh/id_rsa.pub slave1”,将公钥传递到slave1节点,yes,输入登录密码123456

输入“ssh-copy-id -i /root/.ssh/id_rsa.pub slave2”,将公钥传递到slave2节点,yes,输入登录密码123456

输入“ssh-copy-id -i /root/.ssh/id_rsa.pub slave3”,将公钥传递到slave3节点,yes,输入登录密码123456

(4)检测SSH免密登录是否成功。master节点输入“ssh slave1”,此时目录会跳转到slave1节点目录,即“[root@slave1 ~]# ”。输入“[root@slave1 ~]#exit”退出,返回master节点目录。依次尝试slave2和slave3

 

 

 

 

 

 

[展开全文]

克隆虚拟机

以master为基准,克隆出其他3个slave

首先,关闭master

然后,VMware中选中master,右击,选择克隆。选择,完整克隆,填写克隆虚拟机名称,选择虚拟机存放位置./vmware/slave1,关闭。

接着,相同方式,克隆出slave2和slave3

最后,修改克隆虚拟机的名称和IP地址

【例】slave1

登录slave1,删除一个文件“rm -rf /etc/udev/rules.d/70-persistent-net.rules”,与网上更新视频游戏相关,所以删除。

查看slave1的IP地址,输入“ifconfig”,结果与master相同。保存HWaddr的内容,可截图

输入“vi /etc/sysconfig/network-scripts/ifcfg-eth0”,打开该文件,修改以下内容:DEVICE=eth1(原eth0,都是根据ifconfig的信息中找到的)、HWADDR=上述保存内容、UUID注释,即加#、IPADDR更改为slave1的IP192.168.128.131、保存退出。

输入“vi /etc/sysconfig/network”,打开该文件,修改HOSTNAME=slave1.cnetos.com,保存退出。

输入“reboot”重启虚拟机。

【练习】更改slave2和slave3的设置

 

XShell连接slave1~3

[展开全文]

1.Hadoop安装与配置

【准备工作】

(1)新建4台虚拟机,分别命名master / slave1 / slave2 / slave3。已完成master

master:1.5G~2G内存、20G硬盘、NAT、1~2核

slave:1G内存、20G硬盘、NAT、1核

(2)每台虚拟机设置固定IP地址。已完成master

(3)每台虚拟机安装必要软件。已完成master

【具体做法】

(1)新建master虚拟机,配置固定IP地址,关闭防火墙,安装必要软件;

(2)克隆master到salve系列从机;

(3)修改salve系列从机的IP地址,改为固定IP;

2.修改Hadoop相关配置文件

【在master虚拟机上安装Hadoop】

启动XShell,连接master虚拟机; 

将Hadoop的安装包传输到CentOS的opt目录(工具栏启动文件传输命令,Windows部分找到Hadoop安装文件.gz,右击,传输即可);

进入master虚拟机,查看opt目录下文件(输入命令“cd /opt”、“ls”);

加压缩.gz文件(输入命令“tar -zxf hadoop-2.6.4.tar.gz -C /usr/local/”,-C后面为文件解压缩到的路径);

进入/usr/local,查看所有文件,找到解压的文件,进入hadoop-2.6.4文件夹,进入配置文件所在目录etc,进行文件配置(cd /usr/local/hadoop-2.6.4/etc/hadoop/);

【修改配置文件】

/usr/local/hadoop-2.6.4/etc/hadoop/

该目录下,通过输入命令“vi 文件名”打开文件,按“i”进入编辑模式;修改里面的配置内容;按“ESC”退出编辑模式,通过输入命令“:wq”保存并退出文件;

(1)core-site.xml

HDFS核心文件,主要用于配置HDFS的命令,位置为主机的8020端口

找到<configuration>标签,进入编辑模式,输入以下内容:

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://master:8020</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/var/log/hadoop/tmp</value>

</property>

</configuration>

注意:其中的master为主机名称,可以根据需要更改存在的主机名称;第二个property为设置Hadoop临时文件存放路径

(2)hadoop-env.sh

Hadoop运行环境配置文件,需要修改JAVA_HOME位置,修改成我们刚刚安装的JDK的位置

找到“export JAVA_HOME=”,修改值为“/usr/java/jdk1.7.0_80(双击XShell中的连接,复制一个相同的连接,在窗口中定位JDK安装位置,通过输入命令“pwd”复制该路径,黏贴到第一个XShell窗口中的配置文件中的位置)”

保存退出

(3)hdfs-site.xml

HDFS相关配置信息,在<configuration>标签内添加<property>标签中的<name>和<value>键值对儿内容

<configuration>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:///data/hadoop/hdfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:///data/hadoop/hdfs/data</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>master:50090</value>

</property>

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

</configuration>

保存退出

注意:

第一个property,为NameNode存放路径

第二个property,为DataNode存放路径

第三个property,为secondarynamenode的地址为主机节点的50090窗口,要根据自己的master主机,进行更改

第四个property,为存放文件的备份数量

(4)mapred-env.sh

MapReduce运行环境配置文件,同样修改JAVA_HOME路径,方法同(2),保存退出

(5)mapred-site.xml

目录中只有“mapred-site.xml.template”,所以需要复制该文件并命名为“mapred-site.xml”(XShell命令窗口输入命令“cp mapred-site.xml.template mapred-site.xml”)

同样是在<configuration>标签内添加属性

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<!-- jobhistory properties-->

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>master:19888</value>

</property>

</configuration>

保存退出

注意:

第一个property,为MapReduce运行框架

第二个property,为MapReduce任务日志地址,主节点10020端口

第三个property,为MapReduce任务日志服务地址,主节点19888端口,

第四个property,为存放文件的备份数量

所有节点端口要根据自己的master主机,进行更改

(6)slaves

设置子节点文件

删除“localhost”,进入编辑模式,填写

slave1

slave2

slave3

退出编辑模式,保存退出

(7)yarn-env.sh

YARN运行环境配置文件,同样是修改JAVA_HOME的路径,同(2),保存退出

(8)yarn-site.xml

与YARN框架相关的配置文件,

同样是在<configuration>标签内添加属性

<configuration>

<property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property>

<property>

<name>yarn.resourcemanager.address</name>

<value>${yarn.resourcemanager.hostname}:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>${yarn.resourcemanager.hostname}:8030</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>${yarn.resourcemanager.hostname}:8088</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.https.address</name>

<value>${yarn.resourcemanager.hostname}:8090</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.https.address</name>

<value>${yarn.resourcemanager.hostname}:8031</value>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>${yarn.resourcemanager.hostname}:8033</value>

</property>

<property>

<name>yarn.nodemanager.local-dirs</name>

<value>/data/hadoop/yarn/local</value>

</property>

<property>

<name>yarn.log-aggregation-enable</name>

<value>true</value>

</property>

<property>

<name>yarn.nodemanager.remote-app-log-dir</name>

<value>/data/tmp/logs</value>

</property>

</configuration>

我没有抄完,呜~~~~~

保存退出

注意:

第一个property,为yarn运行主机节点名称

第二个property,为yarn运行主机节点地址,主节点8032端口,注意采用了引用的写法,值得提倡

第三个property,为yarn运行主机调度地址,主节点8030端口,

第四个property,为存放文件的备份数量

所有节点端口要根据自己的master主机,进行更改

【编辑系统文件】

XShell命令窗口,输入命令“vi /etc/profile”

在最下面输入“export JAVA_HOME=/usr/local/java/jdk1.7.0_80”把JAVA_HOME路径和“export HADOOP_HOME=/usr/local/hadoop-2.6.4/”Hadoop路径加入进去。

把两个路径加入系统环境变量PATH中,输入命令“export PATH=$PATH:$HADOOP/bin:$JAVA_HOME/bin”(使用冒号:分隔,使用$进行引用)保存退出,两个_HOME的值,是根据实际安装情况而定。

使修改生效,输入命令“source /etc/”

 

[展开全文]

虚拟机

为了后面的Hadoop集群搭建,Hadoop集群是一个有主从关系的节点集群,需要多台计算机实现集群假设。如果在一台计算机上搭建集群,需要使用虚拟机虚拟出多个模拟节点(计算机),共同组建Hadoop集群。

操作系统为Linux,因为Hadoop与Linux友好。

1.创建虚拟机

【机器要求】内存最少8G

【软件包 64bit】

(1)VMware 10

【安装】

典型安装,默认安装位置即可。不勾选用户体验计划等。一路下一步即可。

【使用】

模拟4个虚拟机节点:

master:192.168.128.130

slave1:192.168.128.131

slave2:192.168.128.132

slave3:192.168.128.133

【所需软件】

CentOS6.iso

SSH连接工具Xme5.exe

【具体实施】

新建虚拟机master,配置固定IP地址,关闭防火墙(XShell中输入命令“service iptalbes stop”可以暂时关闭防火墙。XShell中输入命令“chkconfig iptalbes off”,可以永久关闭防火墙。);

使用Xme5.EXE连接master,在线安装软件;

(2)CentOS 6

创建master虚拟机,选择LinuxOS系统,创建虚拟机名称“master”,设置安装路径(VMware/master,其他slave虚拟可以在相同目录中创建),选择磁盘容量(可以适当降低),差分多个文件,设置硬件DVD为iso,完成。

VMware中启动虚拟机,进行CentOS6的安装。选择第1项,进入安装。跳过信息媒体安装。选择安装过程中的语言(选择中文或者U.S. English)。存储位置默认Basic那个。设置虚拟机名称(master.centos.com)。设置root用户密码。 是否要分区(选择所有空间Use All Space)。选择最小化版本(Minimal)。安装完成,Reboot。

(3)JDK 1.7

【Windows】

是因为Windows下的Eclipes编写Hadoop中MapReduce程序,需要使用Java,所以要在Windows环境下安装Java的JDK

针对Windows的环境变量,执行如下操作:

1)新建JAVA_HOME变量,值为JDK的安装路径;

2)新建CLASSPATH变量,值为“%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar”

3)更改PATH变量,在值的最前面加入“%JAVA_HOME%\bin;”即可。

测试,启动Windows命令行,输入“java -version”

【Linux】

是因为Hadoop在运行过程中需要Java环境,因此需要在Linux环境中安装Java的JDK

1)Windows连接虚拟机

打开XShell窗口,连接master虚拟机,在XShell工具栏中选择“新建文件传输”按钮,启动Windows与虚拟机的文件传输窗口。

2)传输文件

在窗口中,虚拟机部分,地址栏输入“/opt”,意思就是将Windows文件传输到CentOS虚拟机的/opt目录下。

在Windows部分,找到需要传送的JDK的Linux版本,右击,选择“传输”即可将文件由Windows传入Linux系统

3)安装

<查看文件>

在XShell(已连接master主机)中,输入“cd /opt”,跳转到该目录下,输入命令“ls”可以查看目录下所有文件

<安装>

.rpm文件,是Linux可执行文件,直接安装即可

XShell中输入命令“rpm -ivh 安装包完整名称”,回车即可安装,过程很快。

<验证>

XShell中输入命令“java -version”

安装位置:/usr/

 

 

(4)Hadoop 2.6.4

(5)Eclipes 4.5.1

(6)Eclipes Hadoop插件 2.6.0

(7)SSH连接工具 Xme5.exe

2.设置固定IP

【接1.(2)】

再次启动虚拟机,输入用户名root,输入登录密码(不显示),回车登录CentOS系统(由于安装CentOS时,选择的是Minimal,所以启动的是CentOS的命令行模式)。

所有命令都是Linux命令

【查看IP地址】

命令行,输入命令“ifconfig”,查看当前IP地址,默认为127.0.0.1。

【设置IP地址 】

重启网络服务:命令行,输入命令“service network restart”(两项OK)

打开IP配置文件ifcfg-eth0:命令行,输入命令“vi /etc/sysconfig/network-scripts/ifcfg-eth0”,回车,打开该文件(vi命令表示编辑文件命令)

修改文件信息:

“ONBOOT=yes”、“BOOTPROTO=static”

添加文件信息:

IPADDR=192.168.128.130(主机master的IP地址,主办方会给出)

NETMASK=255.255.255.0

GATEWAY=192.168.128.2

DNS1=192.168.128.2

保存文件:直接输入“:wq”,保存退出。

再次重启网络服务:命令行,输入命令“service network restart”(两项OK)

3.远程连接虚拟机

【接2】Windows中安装Xme5,用以从Windows连接虚拟机

一路下一步,安装(选择英语),双击Xshell图标启动,右上角新建会话(输入虚拟主机名称、IP地址;在用户身份验证中输入登录CentOS的root口令)即可。

单击新建的会话,进行连接,如果出现连接不成功,是因为虚拟机网络设置与masterIP不在一个网段上,按照如下操作进行

(1)查看虚拟机网络。在VMware中,“编辑-虚拟网络编辑器”;

(2)选择“VMnet NAT模式”,将最下面的子网IP修改为master网段,将192.168.222.0修改为192.168.128.0

(3)选择“NAT设置”按钮,进入设置NAT,同样更改网关IP为同网段

(4)选择“DHCP设置”按钮。进入设置DHCP,同样更改开始和结束IP网段为相同网段

(5)应用,确定

再次连接会话即可。连接成功后,在该窗口进行的操作就等同于在CentOS命令窗口进行的操作,因为已经连接到虚拟机。

4.虚拟机在线安装软件方法

【接3】

.rpm软件包,是Linux的软件包名称后缀。

yum,软件包管理器,目的提高.rpm软件包的安装性,彻底解决.rpm安装的关联性问题,并且提供了查找、安装、删除某一个或某一组全部软件包的命令,命令简洁好记。

【yum命令格式】

yum [options] [command] [package]

[options]:可选。常用:-h / -y / -c

[command]:必填。常用:install / update / remove / rearch / clean

[package]:需要安装的软件包

实例:

连接到CentOS后,在Xshell中,执行如下操作

(1)配置本地yum源

命令“cd /etc/yum.repos.d”,进入该目录。

命令“ls”,查看当前目录下的所有文件。

(2)将除去yum本地源以外的其他yum源禁用

命令“mv CentOS-Base.repo CentOS-Base.repo.bak”.就是将CentOS-Base.repo文件更改为CentOS-Base.repo.bak后,就禁用该yum。

以此类推,禁用其他yum源(除了CentOS-Media.repo文件)。

(3)修改CentOS-Media.repo文件

命令“vi CentOS-Media.repo”

baseurl,系统下载文件位置,更改为“baseurl=file:///media/”。我们把安装文件包放入这个目录即可。

gogcheck,是否检查更新,更改为0 

enabled,是否从当前位置安装,更改为1

ESC,退出编辑状态

:wq,进行保存

(4)挂载

虚拟机中,右击master,选择设置,DVD的设备状态,勾选“已连接”,ISO镜像选择软件包存放位置?

Xshell中,输入命令“mount /dev/dvd /media”

(5)更新yum源

Xshell中,输入命令“yum clean all”

(6)使用yum安装以下软件

vim,类似于VI的文本编辑器

zip,压缩文件命令

openssh-server,开启这个服务,就可以用一些远程连接工具来连接CentOS

openssh-client,类似XShell,可以作为一个客户端连接openssh-server

yum安装软件命令格式:

Xshell中,输入命令“yum install -y vim zip openssh-server openssh-client”

 

 

 

 

[展开全文]

虚拟机

为了后面的Hadoop集群搭建,Hadoop集群是一个有主从关系的节点集群,需要多台计算机实现集群假设。如果在一台计算机上搭建集群,需要使用虚拟机虚拟出多个模拟节点(计算机),共同组建Hadoop集群。

操作系统为Linux,因为Hadoop与Linux友好。

1.创建虚拟机

【机器要求】内存最少8G

【软件包 64bit】

(1)VMware 10

【安装】

典型安装,默认安装位置即可。不勾选用户体验计划等。一路下一步即可。

【使用】

模拟4个虚拟机节点:

master:192.168.128.130

slave1:192.168.128.131

slave2:192.168.128.132

slave3:192.168.128.133

【所需软件】

CentOS6.iso

SSH连接工具Xme5.exe

【具体实施】

新建虚拟机master,配置固定IP地址,关闭防火墙(XShell中输入命令“service iptalbes stop”可以暂时关闭防火墙。XShell中输入命令“chkconfig iptalbes off”,可以永久关闭防火墙。);

使用Xme5.EXE连接master,在线安装软件;

(2)CentOS 6

创建master虚拟机,选择LinuxOS系统,创建虚拟机名称“master”,设置安装路径(VMware/master,其他slave虚拟可以在相同目录中创建),选择磁盘容量(可以适当降低),差分多个文件,设置硬件DVD为iso,完成。

VMware中启动虚拟机,进行CentOS6的安装。选择第1项,进入安装。跳过信息媒体安装。选择安装过程中的语言(选择中文或者U.S. English)。存储位置默认Basic那个。设置虚拟机名称(master.centos.com)。设置root用户密码。 是否要分区(选择所有空间Use All Space)。选择最小化版本(Minimal)。安装完成,Reboot。

(3)JDK 1.7

【Windows】

是因为Windows下的Eclipes编写Hadoop中MapReduce程序,需要使用Java,所以要在Windows环境下安装Java的JDK

针对Windows的环境变量,执行如下操作:

1)新建JAVA_HOME变量,值为JDK的安装路径;

2)新建CLASSPATH变量,值为“%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar”

3)更改PATH变量,在值的最前面加入“%JAVA_HOME%\bin;”即可。

测试,启动Windows命令行,输入“java -version”

【Linux】

是因为Hadoop在运行过程中需要Java环境,因此需要在Linux环境中安装Java的JDK

 

(4)Hadoop 2.6.4

(5)Eclipes 4.5.1

(6)Eclipes Hadoop插件 2.6.0

(7)SSH连接工具 Xme5.exe

2.设置固定IP

【接1.(2)】

再次启动虚拟机,输入用户名root,输入登录密码(不显示),回车登录CentOS系统(由于安装CentOS时,选择的是Minimal,所以启动的是CentOS的命令行模式)。

所有命令都是Linux命令

【查看IP地址】

命令行,输入命令“ifconfig”,查看当前IP地址,默认为127.0.0.1。

【设置IP地址 】

重启网络服务:命令行,输入命令“service network restart”(两项OK)

打开IP配置文件ifcfg-eth0:命令行,输入命令“vi /etc/sysconfig/network-scripts/ifcfg-eth0”,回车,打开该文件(vi命令表示编辑文件命令)

修改文件信息:

“ONBOOT=yes”、“BOOTPROTO=static”

添加文件信息:

IPADDR=192.168.128.130(主机master的IP地址,主办方会给出)

NETMASK=255.255.255.0

GATEWAY=192.168.128.2

DNS1=192.168.128.2

保存文件:直接输入“:wq”,保存退出。

再次重启网络服务:命令行,输入命令“service network restart”(两项OK)

3.远程连接虚拟机

【接2】Windows中安装Xme5,用以从Windows连接虚拟机

一路下一步,安装(选择英语),双击Xshell图标启动,右上角新建会话(输入虚拟主机名称、IP地址;在用户身份验证中输入登录CentOS的root口令)即可。

单击新建的会话,进行连接,如果出现连接不成功,是因为虚拟机网络设置与masterIP不在一个网段上,按照如下操作进行

(1)查看虚拟机网络。在VMware中,“编辑-虚拟网络编辑器”;

(2)选择“VMnet NAT模式”,将最下面的子网IP修改为master网段,将192.168.222.0修改为192.168.128.0

(3)选择“NAT设置”按钮,进入设置NAT,同样更改网关IP为同网段

(4)选择“DHCP设置”按钮。进入设置DHCP,同样更改开始和结束IP网段为相同网段

(5)应用,确定

再次连接会话即可。连接成功后,在该窗口进行的操作就等同于在CentOS命令窗口进行的操作,因为已经连接到虚拟机。

4.虚拟机在线安装软件方法

【接3】

.rpm软件包,是Linux的软件包名称后缀。

yum,软件包管理器,目的提高.rpm软件包的安装性,彻底解决.rpm安装的关联性问题,并且提供了查找、安装、删除某一个或某一组全部软件包的命令,命令简洁好记。

【yum命令格式】

yum [options] [command] [package]

[options]:可选。常用:-h / -y / -c

[command]:必填。常用:install / update / remove / rearch / clean

[package]:需要安装的软件包

实例:

连接到CentOS后,在Xshell中,执行如下操作

(1)配置本地yum源

命令“cd /etc/yum.repos.d”,进入该目录。

命令“ls”,查看当前目录下的所有文件。

(2)将除去yum本地源以外的其他yum源禁用

命令“mv CentOS-Base.repo CentOS-Base.repo.bak”.就是将CentOS-Base.repo文件更改为CentOS-Base.repo.bak后,就禁用该yum。

以此类推,禁用其他yum源(除了CentOS-Media.repo文件)。

(3)修改CentOS-Media.repo文件

命令“vi CentOS-Media.repo”

baseurl,系统下载文件位置,更改为“baseurl=file:///media/”。我们把安装文件包放入这个目录即可。

gogcheck,是否检查更新,更改为0 

enabled,是否从当前位置安装,更改为1

ESC,退出编辑状态

:wq,进行保存

(4)挂载

虚拟机中,右击master,选择设置,DVD的设备状态,勾选“已连接”,ISO镜像选择软件包存放位置?

Xshell中,输入命令“mount /dev/dvd /media”

(5)更新yum源

Xshell中,输入命令“yum clean all”

(6)使用yum安装以下软件

vim,类似于VI的文本编辑器

zip,压缩文件命令

openssh-server,开启这个服务,就可以用一些远程连接工具来连接CentOS

openssh-client,类似XShell,可以作为一个客户端连接openssh-server

yum安装软件命令格式:

Xshell中,输入命令“yum install -y vim zip openssh-server openssh-client”

 

 

 

 

 

[展开全文]

虚拟机

为了后面的Hadoop集群搭建,Hadoop集群是一个有主从关系的节点集群,需要多台计算机实现集群假设。如果在一台计算机上搭建集群,需要使用虚拟机虚拟出多个模拟节点(计算机),共同组建Hadoop集群。

操作系统为Linux,因为Hadoop与Linux友好。

1.创建虚拟机

【机器要求】内存最少8G

【软件包 64bit】

(1)VMware 10

【安装】

典型安装,默认安装位置即可。不勾选用户体验计划等。一路下一步即可。

【使用】

模拟4个虚拟机节点:

master:192.168.128.130

slave1:192.168.128.131

slave2:192.168.128.132

slave3:192.168.128.133

【所需软件】

CentOS6.iso

SSH连接工具Xme5.exe

【具体实施】

新建虚拟机master,配置固定IP地址,关闭防火墙(XShell中输入命令“service iptalbes stop”可以暂时关闭防火墙。XShell中输入命令“chkconfig iptalbes off”,可以永久关闭防火墙。);

使用Xme5.EXE连接master,在线安装软件;

(2)CentOS 6

创建master虚拟机,选择LinuxOS系统,创建虚拟机名称“master”,设置安装路径(VMware/master,其他slave虚拟可以在相同目录中创建),选择磁盘容量(可以适当降低),差分多个文件,设置硬件DVD为iso,完成。

VMware中启动虚拟机,进行CentOS6的安装。选择第1项,进入安装。跳过信息媒体安装。选择安装过程中的语言(选择中文或者U.S. English)。存储位置默认Basic那个。设置虚拟机名称(master.centos.com)。设置root用户密码。 是否要分区(选择所有空间Use All Space)。选择最小化版本(Minimal)。安装完成,Reboot。

(3)JDK 1.7

(4)Hadoop 2.6.4

(5)Eclipes 4.5.1

(6)Eclipes Hadoop插件 2.6.0

(7)SSH连接工具 Xme5.exe

2.设置固定IP

【接1.(2)】

再次启动虚拟机,输入用户名root,输入登录密码(不显示),回车登录CentOS系统(由于安装CentOS时,选择的是Minimal,所以启动的是CentOS的命令行模式)。

所有命令都是Linux命令

【查看IP地址】

命令行,输入命令“ifconfig”,查看当前IP地址,默认为127.0.0.1。

【设置IP地址 】

重启网络服务:命令行,输入命令“service network restart”(两项OK)

打开IP配置文件ifcfg-eth0:命令行,输入命令“vi /etc/sysconfig/network-scripts/ifcfg-eth0”,回车,打开该文件(vi命令表示编辑文件命令)

修改文件信息:

“ONBOOT=yes”、“BOOTPROTO=static”

添加文件信息:

IPADDR=192.168.128.130(主机master的IP地址,主办方会给出)

NETMASK=255.255.255.0

GATEWAY=192.168.128.2

DNS1=192.168.128.2

保存文件:直接输入“:wq”,保存退出。

再次重启网络服务:命令行,输入命令“service network restart”(两项OK)

3.远程连接虚拟机

【接2】Windows中安装Xme5,用以从Windows连接虚拟机

一路下一步,安装(选择英语),双击Xshell图标启动,右上角新建会话(输入虚拟主机名称、IP地址;在用户身份验证中输入登录CentOS的root口令)即可。

单击新建的会话,进行连接,如果出现连接不成功,是因为虚拟机网络设置与masterIP不在一个网段上,按照如下操作进行

(1)查看虚拟机网络。在VMware中,“编辑-虚拟网络编辑器”;

(2)选择“VMnet NAT模式”,将最下面的子网IP修改为master网段,将192.168.222.0修改为192.168.128.0

(3)选择“NAT设置”按钮,进入设置NAT,同样更改网关IP为同网段

(4)选择“DHCP设置”按钮。进入设置DHCP,同样更改开始和结束IP网段为相同网段

(5)应用,确定

再次连接会话即可。连接成功后,在该窗口进行的操作就等同于在CentOS命令窗口进行的操作,因为已经连接到虚拟机。

4.虚拟机在线安装软件方法

【接3】

.rpm软件包,是Linux的软件包名称后缀。

yum,软件包管理器,目的提高.rpm软件包的安装性,彻底解决.rpm安装的关联性问题,并且提供了查找、安装、删除某一个或某一组全部软件包的命令,命令简洁好记。

【yum命令格式】

yum [options] [command] [package]

[options]:可选。常用:-h / -y / -c

[command]:必填。常用:install / update / remove / rearch / clean

[package]:需要安装的软件包

实例:

连接到CentOS后,在Xshell中,执行如下操作

(1)配置本地yum源

命令“cd /etc/yum.repos.d”,进入该目录。

命令“ls”,查看当前目录下的所有文件。

(2)将除去yum本地源以外的其他yum源禁用

命令“mv CentOS-Base.repo CentOS-Base.repo.bak”.就是将CentOS-Base.repo文件更改为CentOS-Base.repo.bak后,就禁用该yum。

以此类推,禁用其他yum源(除了CentOS-Media.repo文件)。

(3)修改CentOS-Media.repo文件

命令“vi CentOS-Media.repo”

baseurl,系统下载文件位置,更改为“baseurl=file:///media/”。我们把安装文件包放入这个目录即可。

gogcheck,是否检查更新,更改为0 

enabled,是否从当前位置安装,更改为1

ESC,退出编辑状态

:wq,进行保存

(4)挂载

虚拟机中,右击master,选择设置,DVD的设备状态,勾选“已连接”,ISO镜像选择软件包存放位置?

Xshell中,输入命令“mount /dev/dvd /media”

(5)更新yum源

Xshell中,输入命令“yum clean all”

(6)使用yum安装以下软件

vim,类似于VI的文本编辑器

zip,压缩文件命令

openssh-server,开启这个服务,就可以用一些远程连接工具来连接CentOS

openssh-client,类似XShell,可以作为一个客户端连接openssh-server

yum安装软件命令格式:

Xshell中,输入命令“yum install -y vim zip openssh-server openssh-client”

 

 

 

 

 

 

[展开全文]

虚拟机

为了后面的Hadoop集群搭建,Hadoop集群是一个有主从关系的节点集群,需要多台计算机实现集群假设。如果在一台计算机上搭建集群,需要使用虚拟机虚拟出多个模拟节点(计算机),共同组建Hadoop集群。

操作系统为Linux,因为Hadoop与Linux友好。

1.创建虚拟机

【机器要求】内存最少8G

【软件包 64bit】

(1)VMware 10

【安装】

典型安装,默认安装位置即可。不勾选用户体验计划等。一路下一步即可。

【使用】

模拟4个虚拟机节点:

master:192.168.128.130

slave1:192.168.128.131

slave2:192.168.128.132

slave3:192.168.128.133

【所需软件】

CentOS6.iso

SSH连接工具Xme5.exe

【具体实施】

新建虚拟机master,配置固定IP地址,关闭防火墙;

使用Xme5.EXE连接master,在线安装软件;

(2)CentOS 6

创建master虚拟机,选择LinuxOS系统,创建虚拟机名称“master”,设置安装路径(VMware/master,其他slave虚拟可以在相同目录中创建),选择磁盘容量(可以适当降低),差分多个文件,设置硬件DVD为iso,完成。

VMware中启动虚拟机,进行CentOS6的安装。选择第1项,进入安装。跳过信息媒体安装。选择安装过程中的语言(选择中文或者U.S. English)。存储位置默认Basic那个。设置虚拟机名称(master.centos.com)。设置root用户密码。 是否要分区(选择所有空间Use All Space)。选择最小化版本(Minimal)。安装完成,Reboot。

(3)JDK 1.7

(4)Hadoop 2.6.4

(5)Eclipes 4.5.1

(6)Eclipes Hadoop插件 2.6.0

(7)SSH连接工具 Xme5.exe

2.设置固定IP

【接1.(2)】

再次启动虚拟机,输入用户名root,输入登录密码(不显示),回车登录CentOS系统(由于安装CentOS时,选择的是Minimal,所以启动的是CentOS的命令行模式)。

所有命令都是Linux命令

【查看IP地址】

命令行,输入命令“ifconfig”,查看当前IP地址,默认为127.0.0.1。

【设置IP地址 】

重启网络服务:命令行,输入命令“service network restart”(两项OK)

打开IP配置文件ifcfg-eth0:命令行,输入命令“vi /etc/sysconfig/network-scripts/ifcfg-eth0”,回车,打开该文件(vi命令表示编辑文件命令)

修改文件信息:

“ONBOOT=yes”、“BOOTPROTO=static”

添加文件信息:

IPADDR=192.168.128.130(主机master的IP地址,主办方会给出)

NETMASK=255.255.255.0

GATEWAY=192.168.128.2

DNS1=192.168.128.2

保存文件:直接输入“:wq”,保存退出。

再次重启网络服务:命令行,输入命令“service network restart”(两项OK)

3.远程连接虚拟机

【接2】Windows中安装Xme5,用以从Windows连接虚拟机

一路下一步,安装(选择英语),双击Xshell图标启动,右上角新建会话(输入虚拟主机名称、IP地址;在用户身份验证中输入登录CentOS的root口令)即可。

单击新建的会话,进行连接,如果出现连接不成功,是因为虚拟机网络设置与masterIP不在一个网段上,按照如下操作进行

(1)查看虚拟机网络。在VMware中,“编辑-虚拟网络编辑器”;

(2)选择“VMnet NAT模式”,将最下面的子网IP修改为master网段,将192.168.222.0修改为192.168.128.0

(3)选择“NAT设置”按钮,进入设置NAT,同样更改网关IP为同网段

(4)选择“DHCP设置”按钮。进入设置DHCP,同样更改开始和结束IP网段为相同网段

(5)应用,确定

再次连接会话即可。连接成功后,在该窗口进行的操作就等同于在CentOS命令窗口进行的操作,因为已经连接到虚拟机。

 

 

4.虚拟机在线安装软件方法

[展开全文]

虚拟机

为了后面的Hadoop集群搭建,Hadoop集群是一个有主从关系的节点集群,需要多台计算机实现集群假设。如果在一台计算机上搭建集群,需要使用虚拟机虚拟出多个模拟节点(计算机),共同组建Hadoop集群。

操作系统为Linux,因为Hadoop与Linux友好。

1.创建虚拟机

【机器要求】内存最少8G

【软件包 64bit】

(1)VMware 10

【安装】

典型安装,默认安装位置即可。不勾选用户体验计划等。一路下一步即可。

【使用】

模拟4个虚拟机节点:

master:192.168.128.130

slave1:192.168.128.131

slave2:192.168.128.132

slave3:192.168.128.133

【所需软件】

CentOS6.iso

SSH连接工具Xme5.exe

【具体实施】

新建虚拟机master,配置固定IP地址,关闭防火墙;

使用Xme5.EXE连接master,在线安装软件;

(2)CentOS 6

创建master虚拟机,选择LinuxOS系统,创建虚拟机名称“master”,设置安装路径(VMware/master,其他slave虚拟可以在相同目录中创建),选择磁盘容量(可以适当降低),差分多个文件,设置硬件DVD为iso,完成。

VMware中启动虚拟机,进行CentOS6的安装。选择第1项,进入安装。跳过信息媒体安装。选择安装过程中的语言(选择中文或者U.S. English)。存储位置默认Basic那个。设置虚拟机名称(master.centos.com)。设置root用户密码。 是否要分区(选择所有空间Use All Space)。选择最小化版本(Minimal)。安装完成,Reboot。

(3)JDK 1.7

(4)Hadoop 2.6.4

(5)Eclipes 4.5.1

(6)Eclipes Hadoop插件 2.6.0

(7)SSH连接工具 Xme5.exe

2.设置固定IP

【接1.(2)】

再次启动虚拟机,输入用户名root,输入登录密码(不显示),回车登录CentOS系统(由于安装CentOS时,选择的是Minimal,所以启动的是CentOS的命令行模式)。

所有命令都是Linux命令

【查看IP地址】

命令行,输入命令“ifconfig”,查看当前IP地址,默认为127.0.0.1。

【设置IP地址 】

重启网络服务:命令行,输入命令“service network restart”(两项OK)

打开IP配置文件ifcfg-eth0:命令行,输入命令“vi /etc/sysconfig/network-scripts/ifcfg-eth0”,回车,打开该文件(vi命令表示编辑文件命令)

修改文件信息:

“ONBOOT=yes”、“BOOTPROTO=static”

添加文件信息:

IPADDR=192.168.128.130(主机master的IP地址,主办方会给出)

NETMASK=255.255.255.0

GATEWAY=192.168.128.2

DNS1=192.168.128.2

保存文件:直接输入“:wq”,保存退出。

再次重启网络服务:命令行,输入命令“service network restart”(两项OK)

3.远程连接虚拟机

4.虚拟机在线安装软件方法

[展开全文]

虚拟机

为了后面的Hadoop集群搭建,Hadoop集群是一个有主从关系的节点集群,需要多台计算机实现集群假设。如果在一台计算机上搭建集群,需要使用虚拟机虚拟出多个模拟节点(计算机),共同组建Hadoop集群。

操作系统为Linux,因为Hadoop与Linux友好。

1.创建虚拟机

【机器要求】内存最少8G

【软件包 64bit】

(1)VMware 10

【安装】

典型安装,默认安装位置即可。不勾选用户体验计划等。一路下一步即可。

【使用】

模拟4个虚拟机节点:

master:192.168.128.130

slave1:192.168.128.131

slave2:192.168.128.132

slave3:192.168.128.133

【所需软件】

CentOS6.iso

SSH连接工具Xme5.exe

【具体实施】

新建虚拟机master,配置固定IP地址,关闭防火墙;

使用Xme5.EXE连接master,在线安装软件;

(2)CentOS 6

创建master虚拟机,选择LinuxOS系统,创建虚拟机名称“master”,设置安装路径(VMware/master,其他slave虚拟可以在相同目录中创建),选择磁盘容量(可以适当降低),差分多个文件,设置硬件DVD为iso,完成。

VMware中启动虚拟机,进行CentOS6的安装。选择第1项,进入安装。跳过信息媒体安装。选择安装过程中的语言(选择中文或者U.S. English)。存储位置默认Basic那个。设置虚拟机名称(master.centos.com)。设置root用户密码。 是否要分区(选择所有空间Use All Space)。选择最小化版本(Minimal)。安装完成,Reboot。

(3)JDK 1.7

(4)Hadoop 2.6.4

(5)Eclipes 4.5.1

(6)Eclipes Hadoop插件 2.6.0

(7)SSH连接工具 Xme5.exe

2.设置固定IP

3.远程连接虚拟机

4.虚拟机在线安装软件方法

[展开全文]

HBase,即Hadoop Database,非结构化数据库,其中的数据以“键值对儿”形式存储。可以在线实时查询。

Hive,部署在Hadoop上的一个数据库,使用类似SQL的查询语句。

Pig,基于Hadoop的大规模数据分析平台。

Sqoop,传输工具,在普通数据库与HDFS或Hive之间传递数据。

Flume,日志采集。

oozie,Hadoop调度器。

Zookeeper,管理Hadoop和HBase,起到时间同步。

Mahout,机器学习软件包。

 

[展开全文]

Hadoop核心3

MapReduce,主要包含map(映射)和reduce(归纳)过程。

map,就是把键值对儿使用函数,从而映射成新的键值对儿。即,对所有的键值对儿的值,进行某种函数映射,形成新的键值对儿。

reduce,就是把键值对儿中,键相同的值根据某种函数映射成新的键值对儿。即对键相同的值,进行某种函数映射,形成新的键值对儿。

   

[展开全文]

Hadoop核心2

HDFS,分布式文件系统。可扩展、高容错、高性能分布式文件系统。异步复制,一次写入多次读取。文件一旦写入,不能修改,只能增加,可以保证数据的一致性。

架构组成:

(1)NameNode,用于存储元数据(指,有几个节点以及各个节点存储的文件个数与大小与名称等信息)、处理客户端发出的请求。作用,主要用来管理HDFS的。

(2)SecondaryNameNode,用于辅助NameNode进行HDFS管理,也就是当NameNode不够用时,启用它。

(3)DataNode,存储数据。

HDFS,类似Window的文件管理系统,有层级关系。

[展开全文]

Hadoop核心1

Hadoop Common,是一个公共基础设施,用于支撑其他项目。

[展开全文]

Hadoop特点

分布式软件框架;

高可靠、高容错、高效率;

可伸缩,随着数量的增加可以动态增加节点;

依赖社区服务,成本低;

[展开全文]

  Hadoop,分布式系统基础架构,核心就是HDFS和MapReduce。用户可以在不了解分布式底层细节的情况下,使用Hadoop开发分布式程序。

  由于数据存量和增量极大,加之极大数据需要存储和分析,由于Hadoop可以存储并处理大量数据,因此采用Hadoop处理大数据问题。

  Hadoop的编程,就是针对MapReduce的编程,使用的是Java语言

[展开全文]

授课教师

大数据开发讲师

课程特色

视频(57)
下载资料(2)