Я пытался запустить пример программы в Hadoop, указанный здесь
когда я пытаюсь запустить его, я получаю org.apache.hadoop.mapred.FileAlreadyExistsException
[email protected]:~/project/hadoop-0.20.2$ bin/hadoop jar jar_files/wordcount.jar org.myorg.WordCount jar_files/wordcount/input jar_files/wordcount/output
11/02/06 14:54:23 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
11/02/06 14:54:23 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same.
Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory file:/home/emil/project/hadoop-0.20.2/jar_files/wordcount/input already exists
at org.apache.hadoop.mapred.FileOutputFormat.checkOutputSpecs(FileOutputFormat.java:111)
at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:772)
at org.apache.hadoop.mapred.JobClient.submitJob(JobClient.java:730)
at org.apache.hadoop.mapred.JobClient.runJob(JobClient.java:1249)
at org.myorg.WordCount.main(WordCount.java:55)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
at java.lang.reflect.Method.invoke(Method.java:597)
at org.apache.hadoop.util.RunJar.main(RunJar.java:156)
[email protected]:~/project/hadoop-0.20.2$
Его из /home/emil/project/hadoop -0.20.2/jar_files/wordcount/input, что я беру файлы ввода file01 и file02. Когда я googled, я узнал, что это сделано для предотвращения повторного выполнения одной и той же задачи. Но в моем случае это входной файл, вызывающий исключение. Что-то не так с моей командой, потому что я не вижу сообщений с той же ошибкой для проблемы wordcount. Я новичок в java.
Что может быть причиной этого?