博客
关于我
第2.1.3章 hadoop之eclipse远程调试hadoop
阅读量:307 次
发布时间:2019-03-01

本文共 1511 字,大约阅读时间需要 5 分钟。

Hadoop环境配置及WordCount示例

Eclipse配置

在Eclipse中进行Hadoop插件配置,首先将hadoop-common-project的winutils.exe复制到本地Hadoop的$HADOOP_HOME/bin目录,hadoop.dll则复制到%windir%\System32目录。启动Eclipse后,通过菜单选择“Window > Show View > Other > Map/Reduce Tools > Map/Reduce Locations”进行配置,完成后即可连接到远程DFS。

Windows环境配置

在Windows系统上设置Hadoop环境变量,通常不需要手动配置本地Hadoop即可使用。将winutils.exe和hadoop.dll分别放置在对应的路径下,确保环境变量HADOOP_HOME正确指向Hadoop安装目录。

WordCount示例运行

创建一个Maven项目,引入相关的Hadoop依赖。将core-site.xmlhdfs-site.xmlmapred-site.xmlyarn-site.xml文件复制到项目的src/main/resources目录。将WordCount源码导入项目,编译并将JAR打包为testWordCount.jar

在运行配置中,修改主类的代码,添加输入输出路径。例如,输入文件路径设置为hdfs://192.168.5.174:9000/user/hadoop/testdata/test.log,输出目录设为hdfs://192.168.5.174:9000/user/hadoop/testdata/output2。运行后,可在输出目录查看结果文件。

import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import java.io.IOException;public class WordCountMain {    public static void main(String[] args) throws IOException {        String inputPath = "hdfs://192.168.5.174:9000/user/hadoop/testdata/test.log";        String outputPath = "hdfs://192.168.5.174:9000/user/hadoop/testdata/output2";                Configuration conf = new Configuration();        FileSystem fs = FileSystem.get(URI.create(inputPath), conf);                Path outputPath = new Path(outputPath);        if (!outputPath.exists(fs, new ProgressableIOException())) {            fs.mkdirs(fs, new Path(outputPath), fs.getPermission(), true);        }                // 类似于上述代码,添加其他操作逻辑    }}

转载地址:http://kawo.baihongyu.com/

你可能感兴趣的文章
NIFI大数据进阶_NIFI监控的强大功能介绍_处理器面板_进程组面板_summary监控_data_provenance事件源---大数据之Nifi工作笔记0025
查看>>
NIFI大数据进阶_内嵌ZK模式集群1_搭建过程说明---大数据之Nifi工作笔记0015
查看>>
NIFI大数据进阶_外部ZK模式集群1_实际操作搭建NIFI外部ZK模式集群---大数据之Nifi工作笔记0017
查看>>
NIFI大数据进阶_离线同步MySql数据到HDFS_01_实际操作---大数据之Nifi工作笔记0029
查看>>
NIFI大数据进阶_离线同步MySql数据到HDFS_02_实际操作_splitjson处理器_puthdfs处理器_querydatabasetable处理器---大数据之Nifi工作笔记0030
查看>>
NIFI大数据进阶_连接与关系_设置数据流负载均衡_设置背压_设置展现弯曲_介绍以及实际操作---大数据之Nifi工作笔记0027
查看>>
NIFI数据库同步_多表_特定表同时同步_实际操作_MySqlToMysql_可推广到其他数据库_Postgresql_Hbase_SqlServer等----大数据之Nifi工作笔记0053
查看>>
NIFI汉化_替换logo_二次开发_Idea编译NIFI最新源码_详细过程记录_全解析_Maven编译NIFI避坑指南001---大数据之Nifi工作笔记0068
查看>>
NIFI集群_内存溢出_CPU占用100%修复_GC overhead limit exceeded_NIFI: out of memory error ---大数据之Nifi工作笔记0017
查看>>
NIFI集群_队列Queue中数据无法清空_清除队列数据报错_无法删除queue_解决_集群中机器交替重启删除---大数据之Nifi工作笔记0061
查看>>
NIH发布包含10600张CT图像数据库 为AI算法测试铺路
查看>>
Nim教程【十二】
查看>>
Nim游戏
查看>>
NIO ByteBuffer实现原理
查看>>
Nio ByteBuffer组件读写指针切换原理与常用方法
查看>>
NIO Selector实现原理
查看>>
nio 中channel和buffer的基本使用
查看>>
NIO三大组件基础知识
查看>>
NIO与零拷贝和AIO
查看>>
NIO同步网络编程
查看>>