WordCount案例实操_wordcount案例实操 1)需求在给定的文本文件中统计输出每一个单词出现的总次数 (1-CSDN博客

本文链接：https://blog.csdn.net/youif/article/details/108067013

1．需求

在给定的文本文件中统计输出每一个单词出现的总次数
（1）输入数据
在这里插入图片描述

（2）期望输出数据
1
lin 1
shi 2
wo 2
xiang 1
xinyue 2

2．需求分析

按照MapReduce编程规范，分别编写Mapper，Reducer，Driver，如图所示。

在这里插入图片描述

3．环境准备

（1）创建maven工程
在这里插入图片描述

（2）在pom.xml文件中添加如下依赖

<dependencies>
		<dependency>
			<groupId>junit</groupId>
			<artifactId>junit</artifactId>
			<version>RELEASE</version>
		</dependency>
		<dependency>
			<groupId>org.apache.logging.log4j</groupId>
			<artifactId>log4j-core</artifactId>
			<version>2.8.2</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-common</artifactId>
			<version>2.7.2</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-client</artifactId>
			<version>2.7.2</version>
		</dependency>
		<dependency>
			<groupId>org.apache.hadoop</groupId>
			<artifactId>hadoop-hdfs</artifactId>
			<version>2.7.2</version>
		</dependency>
</dependencies>

（2）在项目的src/main/resources目录下，新建一个文件，命名为“log4j.properties”，在文件中填入。

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout