博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hadoop通过java输出HAFS上的文件内容
阅读量:6929 次
发布时间:2019-06-27

本文共 1750 字,大约阅读时间需要 5 分钟。

package org.apache.hadoop.book;

import java.io.InputStream;
import java.net.URL;
import org.apache.hadoop.fs.FsUrlStreamHandlerFactory;
import org.apache.hadoop.io.IOUtils;
 
public class URLCat {
 
  static {
    URL.setURLStreamHandlerFactory(new FsUrlStreamHandlerFactory());
  }
 
  public static void main(String[] args) throws Exception {
    InputStream in = null;
    try {
      in = new URL(args[0]).openStream();
      IOUtils.copyBytes(in, System.out, 4096, false);
    } finally {
      IOUtils.closeStream(in);
    }
  }
}
/*1,创建目录class,并编译

    [root@centos7 class]# pwd

    root/hadoop-2.9.2/class    注:class一般在hadoop的安装目录下
    [root@centos7 java]#javac -classpath /home/hdc/user/hadoop-2.9.1/share/hadoop/common/hadoop-common-2.9.1.jar -d ${HADOOP_HOME}/class URLCat.java

           (javac -classpath /home/hdc/user/hadoop-2.9.1/share/hadoop/common/hadoop-common-2.9.1.jar:/home/hdc/user/hadoop-2.9.1/share/hadoop/mapreduce/hadoop-mapreduce-client-core-2.9.1.jar:/home/hdc/user/hadoop-2.9.1/share/hadoop/common/lib/commons-cli-1.2.jar -d ${HADOOP_HOME}/class *.java )

 2,打包
     jar -cvf URLCat.jar ./org/apache/hadoop/book/URLCat.class
 3,配置环境
     export HADOOP_CLASSPATH=/home/hdc/user/hadoop-2.9.1/class
 4,执行
     hadoop org.apache.hadoop.book.URLCat hdfs://localhost:9000/hdc/test

  (hadoop jar MaxTemperature.jar temperature.MaxTemperature /program/maxtemperature/input /program/maxtemperature/output)

 (

    jar -cvf WordCount.jar ~/eclipse-workspace/WordCount/bin/WordCount*.class  //有三个.class文件分别是WordCount.class,WordCountMapper.class,WordCountReducer.class

    hadoop jar ~/eclipse-workspace/WordCount/bin/WordCount.jar WordCount /hdc/input_1/word /program_output/wordcount_out

    主要参考教程:http://dblab.xmu.edu.cn/blog/hadoop-build-project-by-shell/

 )

 */

转载于:https://www.cnblogs.com/hdc520/p/10435985.html

你可能感兴趣的文章
Android数据加密之Base64编码算法
查看>>
解决IE8不支持html5标签最好解决办法?
查看>>
EqualsBuilder和HashCodeBuilder
查看>>
取某字段不为空的数据is not null
查看>>
聚生网管
查看>>
005-TCP传输控制协议
查看>>
SQL 优化原则
查看>>
screen的使用
查看>>
UdpClient无法在局域网中发送UDP广播包的解决办法
查看>>
《CLR via C#》读书笔记 之 共享程序集和强名称程序集
查看>>
Struts2注解(旧&新)
查看>>
linux tail命令的使用方法详解
查看>>
countif
查看>>
Matlab绘图详解
查看>>
[.NET] C# 知识回顾 - 委托 delegate (续)
查看>>
跟着百度学PHP[4]OOP面对对象编程-12-对象接口技术(interface)
查看>>
Linux find/grep命令
查看>>
微信小程序四(设置底部导航)
查看>>
杭州富阳场口科目四考试公交路线(西溪北苑->场口)
查看>>
B. Simple Game( Codeforces Round #316 (Div. 2) 简单题)
查看>>