`
Chase_Sun
  • 浏览: 8809 次
  • 性别: Icon_minigender_2
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop配置运行java程序

 
阅读更多
Ubuntu  Hadoop环境搭建:

第一部分:下载JDK和HADOOP安装文件:
1. 下载jdk:
    查看操作系统是32位还是64位,输入命令:sudo uname --m  如果显示 i586 则是32位,如果显示x86_64则是64位,得到此信息后,下载相应版本的JDK。下载网址是:http://www.oracle.com/technetwork/java/javase/downloads/
2.  下载hadoop:
网址是:http://hadoop.apache.org/releases.html

第二部分:安装java:
    解压文件:tar -zxvf jdk-8u11-linux-x64.tar.gz  这时得到一个文件夹jdk1.8.0_11  (我选择的目录是/opt/jdk1.8.0_11,当然可以任意选择安装目录)
    修改~/.bashrc 在该文件末尾加入如下语句:
          export JAVA_HOME=/opt/jdk1.8.0_11
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
     执行source ~/.bashrc立即生效该配置。注意只需要修改黑体部分也就是java的安装目录。
    配置默认的JDK版本:
sudo update-alternatives --install /usr/bin/java java /opt/jdk1.8.0_11/bin/java 300
sudo update-alternatives --install /usr/bin/javac javac /opt/jdk1.8.0_11/bin/javac 300
sudo update-alternatives --install /usr/bin/javap javap /opt/jdk1.8.0_11/bin/javap 300
sudo update-alternatives --install /usr/bin/javadoc javadoc /opt/jdk1.8.0_11/bin/javadoc 300
同样的,只需要修改黑体部分的java的安装目录即可。
测试JAVA安装成功:输入 java   和  java -version测试,出现如下的结果表明安装过程正确并结束:
 
root@ubuntu:/opt/jdk1.8.0_11# java -version
java version "1.8.0_11"
Java(TM) SE Runtime Environment (build 1.8.0_11-b12)
Java HotSpot(TM) 64-Bit Server VM (build 25.11-b03, mixed mode)

第三部分:安装hadoop:

解压hadoop安装包到/opt/下,修改~/.bashrc添加hadoop的相关环境变量:
vi ~/.bashrc

export HADOOP_HOME=/opt/hadoop-1.2.1
export HADOOP_CLASSPATH=$HADOOP_HOME/build/classes
(说明:将要跑的class,jar包等程序一定要在这个目录下放一份,否则报错:Error: Could not find or load main class com.hadoop.mn.MaxTemperature)
export PATH=$HADOOP_HOME/bin:${PATH}
黑体部分可以自行定义。

修改$HADOOP_HOME/conf/hadoop-env.sh,添加 export JAVA_HOME=/opt/jdk1.8.0_11


工具一:使得UE能够FTP连接root用户:
在/etc/ftpusers文件中保存了,系统不允许FTP访问的用户列表,在这个列表中将root删掉即可。
# /etc/ftpusers: list of users disallowed FTP access. See ftpusers(5).

daemon
bin
sys
sync
games
man
lp
mail
news
uucp
nobody



工具二:配置和安装SSH
1. 输入命令ssh-keygen,其余的都回车就可以:
root@ubuntu:/# ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
be:2c:48:43:9d:c9:67:50:a9:2c:0a:a9:fa:b2:cb:c0 root@ubuntu
The key's randomart image is:
+--[ RSA 2048]----+
| ... |
| . . |
| . + = |
|o o B o |
|.. o . oS |
|o . o . |
|oE . o . |
|= . .. . |
|o*. .o |
+-----------------+

2.   首先cd到目录/root,执行命令:cp .ssh/id_rsa.pub .ssh/authorized_keys
3. 测试 SSH安装,  输入命令 ssh localhost。

工具三:关于vi的实用命令:
/pattern<Enter> :向下查找pattern匹配字符串
?pattern<Enter>:向上查找pattern匹配字符串
使用了查找命令之后,使用如下两个键快速查找:
n:按照同一方向继续查找
N:按照反方向查找

输出结果:
root@ubuntu:/opt/hadoop-1.2.1/build/classes# hadoop com/hadoop/mn/NewMaxTemperature 1901 output
14/10/23 02:00:05 INFO util.NativeCodeLoader: Loaded the native-hadoop library
14/10/23 02:00:05 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same.
14/10/23 02:00:05 WARN mapred.JobClient: No job jar file set.  User classes may not be found. See JobConf(Class) or JobConf#setJar(String).
14/10/23 02:00:05 INFO input.FileInputFormat: Total input paths to process : 1
14/10/23 02:00:05 WARN snappy.LoadSnappy: Snappy native library not loaded
14/10/23 02:00:06 INFO mapred.JobClient: Running job: job_local693177873_0001
14/10/23 02:00:06 INFO mapred.LocalJobRunner: Waiting for map tasks
14/10/23 02:00:06 INFO mapred.LocalJobRunner: Starting task: attempt_local693177873_0001_m_000000_0
14/10/23 02:00:06 INFO util.ProcessTree: setsid exited with exit code 0
14/10/23 02:00:06 INFO mapred.Task:  Using ResourceCalculatorPlugin : org.apache.hadoop.util.LinuxResourceCalculatorPlugin@2cc3897e
14/10/23 02:00:06 INFO mapred.MapTask: Processing split: file:/opt/hadoop-1.2.1/build/classes/1901:0+888190
14/10/23 02:00:06 INFO mapred.MapTask: io.sort.mb = 100
14/10/23 02:00:06 INFO mapred.MapTask: data buffer = 79691776/99614720
14/10/23 02:00:06 INFO mapred.MapTask: record buffer = 262144/327680
14/10/23 02:00:07 INFO mapred.JobClient:  map 0% reduce 0%
14/10/23 02:00:07 INFO mapred.MapTask: Starting flush of map output
14/10/23 02:00:07 INFO mapred.Task: Task:attempt_local693177873_0001_m_000000_0 is done. And is in the process of commiting
14/10/23 02:00:07 INFO mapred.LocalJobRunner:
14/10/23 02:00:07 INFO mapred.Task: Task 'attempt_local693177873_0001_m_000000_0' done.
14/10/23 02:00:07 INFO mapred.LocalJobRunner: Finishing task: attempt_local693177873_0001_m_000000_0
14/10/23 02:00:07 INFO mapred.LocalJobRunner: Map task executor complete.
14/10/23 02:00:07 INFO mapred.Task:  Using ResourceCalculatorPlugin : org.apache.hadoop.util.LinuxResourceCalculatorPlugin@67d3712a
14/10/23 02:00:07 INFO mapred.LocalJobRunner:
14/10/23 02:00:07 INFO mapred.Merger: Merging 1 sorted segments
14/10/23 02:00:07 INFO mapred.Merger: Down to the last merge-pass, with 0 segments left of total size: 0 bytes
14/10/23 02:00:07 INFO mapred.LocalJobRunner:
14/10/23 02:00:07 INFO mapred.Task: Task:attempt_local693177873_0001_r_000000_0 is done. And is in the process of commiting
14/10/23 02:00:07 INFO mapred.LocalJobRunner:
14/10/23 02:00:07 INFO mapred.Task: Task attempt_local693177873_0001_r_000000_0 is allowed to commit now
14/10/23 02:00:07 INFO output.FileOutputCommitter: Saved output of task 'attempt_local693177873_0001_r_000000_0' to output
14/10/23 02:00:07 INFO mapred.LocalJobRunner: reduce > reduce
14/10/23 02:00:07 INFO mapred.Task: Task 'attempt_local693177873_0001_r_000000_0' done.
14/10/23 02:00:08 INFO mapred.JobClient:  map 100% reduce 100%
14/10/23 02:00:08 INFO mapred.JobClient: Job complete: job_local693177873_0001
14/10/23 02:00:08 INFO mapred.JobClient: Counters: 20
14/10/23 02:00:08 INFO mapred.JobClient:   Map-Reduce Framework
14/10/23 02:00:08 INFO mapred.JobClient:     Spilled Records=0
14/10/23 02:00:08 INFO mapred.JobClient:     Map output materialized bytes=6
14/10/23 02:00:08 INFO mapred.JobClient:     Reduce input records=0
14/10/23 02:00:08 INFO mapred.JobClient:     Virtual memory (bytes) snapshot=0
14/10/23 02:00:08 INFO mapred.JobClient:     Map input records=6565
14/10/23 02:00:08 INFO mapred.JobClient:     SPLIT_RAW_BYTES=106
14/10/23 02:00:08 INFO mapred.JobClient:     Map output bytes=0
14/10/23 02:00:08 INFO mapred.JobClient:     Reduce shuffle bytes=0
14/10/23 02:00:08 INFO mapred.JobClient:     Physical memory (bytes) snapshot=0
14/10/23 02:00:08 INFO mapred.JobClient:     Reduce input groups=0
14/10/23 02:00:08 INFO mapred.JobClient:     Combine output records=0
14/10/23 02:00:08 INFO mapred.JobClient:     Reduce output records=0
14/10/23 02:00:08 INFO mapred.JobClient:     Map output records=0
14/10/23 02:00:08 INFO mapred.JobClient:     Combine input records=0
14/10/23 02:00:08 INFO mapred.JobClient:     CPU time spent (ms)=0
14/10/23 02:00:08 INFO mapred.JobClient:     Total committed heap usage (bytes)=505110528
14/10/23 02:00:08 INFO mapred.JobClient:   File Input Format Counters
14/10/23 02:00:08 INFO mapred.JobClient:     Bytes Read=888190
14/10/23 02:00:08 INFO mapred.JobClient:   FileSystemCounters
14/10/23 02:00:08 INFO mapred.JobClient:     FILE_BYTES_WRITTEN=100924
14/10/23 02:00:08 INFO mapred.JobClient:     FILE_BYTES_READ=1776712
14/10/23 02:00:08 INFO mapred.JobClient:   File Output Format Counters
14/10/23 02:00:08 INFO mapred.JobClient:     Bytes Written=8
分享到:
评论

相关推荐

    hadoop-3.3.4 版本(最新版)

    够让用户轻松地在 Hadoop 上开发和运行处理海量数据的应用程序。 Hadoop 架构有两个主要的组件:分布式文件系统 HDFS 和 MapReduce 引擎。 在 Hadoop 中,MapReduce 底层的分布式文件系统是独文模块,用户可按照约定...

    hadoop-common.2.7.4.rar

    在开发工具中(例如Eclipse)使用Java语言开发Hadoop程序,调用API,可以在Windows环境运行。配置步骤大致是1 解压缩,2 配置Windows的环境变量HADOOP_HOME,添加bin目录到path中。3 把hadoop文件夹bin中的hadoop....

    新版Hadoop视频教程 段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发

    07-MR程序的几种提交运行模式.avi 08-YARN的通用性意义.avi 09-yarn的job提交流程.avi 第四天 常见mr算法实现和shuffle的机制 01-复习.avi 02-hadoop中的序列化机制.avi 03-流量求和mr程序开发.avi 04-...

    hadoop段海涛老师八天实战视频

    07-MR程序的几种提交运行模式.avi 08-YARN的通用性意义.avi 09-yarn的job提交流程.avi 第四天 常见mr算法实现和shuffle的机制 01-复习.avi 02-hadoop中的序列化机制.avi 03-流量求和mr程序开发.avi 04-...

    Hadoop从入门到上手企业开发

    049 MapReduce编程模型讲解及运行PI程序和JobWebUI监控Job运行 050 如何按照【八股文】方式编写MapReduce 051 复习MapReduce编写模型和【八股文】方式编写MapReduce 052 完成MyWordCount程序编写 053 打包运行...

    Hadoop权威指南 第二版(中文版)

     Hadoop配置  配置管理  环境设置  Hadoop守护进程的关键属性  Hadoop守护进程的地址和端口  Hadoop的其他属性  创建用户帐号  安全性  Kerberos和Hadoop  委托令牌  其他安全性改进  利用基准测试程序...

    Hadoop单机模式的配置与安装

    由于Hadoop属于java程序,所以,安装Hadoop之前需要先安装jdk。 对于hadoop0.20.2的单机模式安装就需要在一个节点(一台主机)上运行5个节点。 分别是: JobTracker:负责Hadoop的Job任务分发和管理。 ...

    三 Hadoop运行模式之本地运行模式和伪分布式模式

    文章目录1 本地运行模式1.1 官方Grep案例1.2 官方WordCount案例2 伪分布式模式2.1 启动HDFS并运行MapReduce程序2.1.1 分析2.1.2 执行步骤2.2 启动YARN并运行MapReduce程序2.2.1 分析2.2.1 执行步骤2.3 配置文件说明 ...

    Hadoop实战中文版

    《Hadoop实战》作为云计算所青睐的分布式架构,Hadoop是一个用Java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,是谷歌实现云计算的重要基石。《Hadoop实战》分为3个部分,深入浅出地...

    hadoop基础教程

    人民邮电出版社Hadoop和云服务出现的历史背景,以及何时适用Hadoop的背景知识, 安装并配置Hadoop集群的最佳方式,根据手头的问题调整系统配置, 用Java和Ru by示例程序讲解如何编写运行在Hadoop上的程序, Amazon网络...

    Hadoop权威指南(中文版)2015上传.rar

    Hadoop配置 配置管理 环境设置 Hadoop守护进程的关键属性 Hadoop守护进程的地址和端口 Hadoop的其他属性 创建用户帐号 安全性 Kerberos和Hadoop 委托令牌 其他安全性改进 利用基准测试程序测试Hadoop集群 Hadoop基准...

    Apache hadoop-3.1.0 版本

    够让用户轻松地在 Hadoop 上开发和运行处理海量数据的应用程序。 Hadoop 架构有两个主要的组件:分布式文件系统 HDFS 和 MapReduce 引擎。 在 Hadoop 中,MapReduce 底层的分布式文件系统是独文模块,用户可按照约定...

    Linux下的JDK1.8.0用于目的是安装Hadoop大数据平台虚拟机安装Java

    【内容概要】 本资源包含JDK 8u191在Linux环境下的完整安装包jdk-8u191-linux-x64.tar.gz。可以帮助Java开发者快速配置Linux下的JDK运行环境。 【适合人群】 需要在Linux服务器上配置JDK的...- 测试运行Java示例程序

    Intellij-Hadoop:使用 Intellij 运行 Hadoop 程序

    使用 Intellij 和 Maven 在本地运行 Hadoop 程序您可以使用这种方法在本地编写和测试您的 Hadoop 程序,而无需在您自己的机器上配置 Hadoop 环境或使用集群。 本教程基于 , 。要求 JDK Linux 或 Mac 操作系统如何...

    windows 运行hadoop-2.8.1所需文件winutils.exe

    解决eclipse运行java程序问题。只需要把这个文件放到hadoop-2.8.1文件夹下的bin目录下即可。记得要配置运行前的参数,以及运行前也需要的环境变量呀,不然运行结果可能有错。

    云计算虚拟化hadoop实验报告.doc

    " " "通过Linux下JAVA-ADT的安装以及Hadoop的相关配置了解Hadoop的基础知识及基础的应用方 " " "法; " " "通过多台主机的虚拟化以及Hadoop的联合部署,在该平台上运行WordCount程序,体验基本 " " "的云计算的雏形...

    大数据技术开发环境搭建.docx

    使用Eclipse编译运行MapReduce程序(Hadoop-Eclipse-Plugin,建议) 38 使用Eclipse打包自己的MapReduce程序 51 不用Hadoop-Eclipse-Plugin编写MapReduce程序 54 Hadoop集群安装配置教程 56 HBase安装 56 HBase...

    hadoop 1.2.1 api 最新chm 伪中文版

    hadoop 1.2 api 伪中文版。支持即时查询,高级查询。方便编码学习。 大数据炙手可热!hadoop是一个大数据分布式系统基础架构,由...虽然Hadoop框架是用JavaTM实现的,但Map/Reduce应用程序则不一定要用 Java来写 。

    Hadoop实战中文版.PDF

    1649.2.2 获得命令行工具 1669.2.3 准备SSH密钥对 1689.3 在EC2上安装Hadoop 1699.3.1 配置安全参数 1699.3.2 配置集群类型 1699.4 在EC2上运行MapReduce程序 1719.4.1 将代码转移到Hadoop集群上 1719...

    CentOS下hadoop0.20安装完成版

    hadoop初学者的福音,包含已经安装好hadoop0.20的CentOS7,在vmware下可以直接导入,运行成功;已经配置好的hadoop0.20;...hadoop的入门程序WordCount.java;还有一些开发过程中需要的软件安装包;以及一篇教学博客。

Global site tag (gtag.js) - Google Analytics