关于在服务器上跑map/reduce后找不到输出文件的问题

在本地开发的MapReduce程序上传到服务器运行后,发现无法在指定的服务器路径下找到输出文件。经过排查,了解到Hadoop MapReduce的任务完成后的输出文件位于Hadoop集群中,而非执行任务的服务器本地。解决方法是使用`hadoop dfs -ls | more`命令在集群中查找输出文件。对于如何将输出路径设置为本地文件,目前未知,需要进一步研究。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题是这样的:我在本地机器上写了段map/reduce代码,打成jar包后传到服务器上运行后,在服务器上找不到指定的输出路径。

如下图,urlcounter.jar是我打的jar包,urlcount.sh是我要执行的脚本


testDir目录下 testDir目录下


如下图,这是urlcount.sh中的内容,包含两个路径,一个输入路径,一个输出路径:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值