У меня есть следующая структура каталогов в HDFS,
/analysis/alertData/logs/YEAR/MONTH/DATE/HOURS
Это данные поступают на основе и сохраняются в формате год/месяц/день/час.
Я написал оболочку script, в которой я прохожу путь до
"/analysis/alertData/logs" ( this will vary depending on what product of data i am handling)
тогда shell script просматривает папки year/month/date/hour и возвращает самый последний путь.
Например:
Directories present in HDFS has following structure:
/analysis/alertData/logs/2014/10/22/01
/analysis/alertData/logs/2013/5/14/04
shell script is given path till : " /analysis/alertData/logs "
it outputs most recent directory : /analysis/alertData/logs/2014/10/22/01
Мой вопрос заключается в том, как я могу проверить правильность пути пути HDFS к оболочке script или нет. Допустим, что я передаю неправильный путь как вход или путь, которого не существует, так как обрабатывать это в shell script.
Пример неправильного пути может быть:
wrong path : /analysis/alertData ( correct path : /analysis/alertData/logs/ )
wrong path : /abc/xyz/ ( path does not exit in HDFS )
Я пробовал использовать опции Hadoop dfs -test -z/-d/-e, которые не работали для меня. Любое предложение для этого.
ПРИМЕЧАНИЕ. Не отправляйте мой оригинальный код здесь, так как решение моей проблемы не зависит от него.
Спасибо заранее.