Я создал многоузловой кластер Hadoop. NameNode и Secondary namenode работают на одном компьютере, и в кластере есть только один Datanode. Все узлы настроены на машинах Amazon EC2.
Ниже приведены файлы конфигурации на главном узле:
masters
54.68.218.192 (public IP of the master node)
slaves
54.68.169.62 (public IP of the slave node)
ядро-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
HDFS-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/datanode</value>
</property>
</configuration>
Теперь файлы конфигурации на датоде:
ядро-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://54.68.218.192:10001</value>
</property>
</configuration>
mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>54.68.218.192:10002</value>
</property>
</configuration>
HDFS-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.name.dir</name>
<value>file:/usr/local/hadoop_store/hdfs/datanode</value>
</property>
</configuration>
запуск jps на Наменоде дает следующее:
5696 NameNode
6504 Jps
5905 SecondaryNameNode
6040 ResourceManager
и JPS на датоде:
2883 DataNode
3496 Jps
3381 NodeManager
что мне кажется правильным.
Теперь, когда я пытаюсь запустить команду put:
hadoop fs -put count_inputfile /test/input/
Это дает мне следующую ошибку:
put: File /count_inputfile._COPYING_ could only be replicated to 0 nodes instead of minReplication (=1). There are 0 datanode(s) running and no node(s) are excluded in this operation.
Журналы на датоде говорят следующее:
hadoop-datanode log
INFO org.apache.hadoop.ipc.Client: Retrying connect to server: 54.68.218.192/54.68.218.192:10001. Already tried 8 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
журнал управления пряжей:
INFO org.apache.hadoop.ipc.Client: Retrying connect to server: 0.0.0.0/0.0.0.0:8031. Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
Веб-интерфейс диспетчера узлов (50070) показывает, что существует 0 активных узлов и 0 мертвых узлов, а значение dfs составляет 100%.
Я также отключил IPV6.
На нескольких веб-сайтах я узнал, что мне следует также отредактировать файл /etc/hosts
. Я также отредактировал их, и они выглядят так:
127.0.0.1 localhost
172.31.25.151 ip-172-31-25-151.us-west-2.compute.internal
172.31.25.152 ip-172-31-25-152.us-west-2.compute.internal
Почему я все еще получаю ошибку?