Ошибка hadoop jar hadoop-examples.jar wordcount input output WARN mapred.JobClient: U

При выполнении комадны:

 hadoop jar hadoop-examples.jar wordcount input output

Может возникнуть ошибка:

14/01/10 04:49:24 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same.
14/01/10 04:49:25 INFO mapred.JobClient: Cleaning up the staging area hdfs://0.0.0.0:8020/var/lib/hadoop-hdfs/cache/mapred/mapred/staging/training/.staging/job_201401090757_0002
14/01/10 04:49:25 ERROR security.UserGroupInformation: PriviledgedActionException as:training (auth:SIMPLE) cause:org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://0.0.0.0:8020/user/training/input
org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://0.0.0.0:8020/user/training/input
	at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:231)
	at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:248)
	at org.apache.hadoop.mapred.JobClient.writeNewSplits(JobClient.java:1014)
	at org.apache.hadoop.mapred.JobClient.writeSplits(JobClient.java:1031)
	at org.apache.hadoop.mapred.JobClient.access$600(JobClient.java:172)
	at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:943)
	at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:896)
	at java.security.AccessController.doPrivileged(Native Method)
	at javax.security.auth.Subject.doAs(Subject.java:396)
	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1332)
	at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:896)
	at org.apache.hadoop.mapreduce.Job.submit(Job.java:531)
	at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:561)
	at org.apache.hadoop.examples.WordCount.main(WordCount.java:67)
	at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
	at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
	at java.lang.reflect.Method.invoke(Method.java:597)
	at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:72)
	at org.apache.hadoop.util.ProgramDriver.driver(ProgramDriver.java:144)
	at org.apache.hadoop.examples.ExampleDriver.main(ExampleDriver.java:64)
	at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
	at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
	at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
	at java.lang.reflect.Method.invoke(Method.java:597)
	at org.apache.hadoop.util.RunJar.main(RunJar.java:208)

можно попытаться указать пусть к входной и выходной директории в явном виде:

hadoop jar hadoop-examples.jar wordcount /usr/lib/hadoop-0.20-mapreduce/input  /usr/lib/hadoop-0.20-mapreduce/output

РЕШЕНИЕ

Следует добавить входную папку в "файловую систему" hadoop, например чтобы добавить директорию /home/training/input следует выполнить команду:

hadoop fs -mkdir /home/training/input


ПРИМЕЧАНИЕ:
когда мы запускаем дважды одно и то же задание, необходимо удалять выходную директорию.