Есть ли хорошие сайты/службы для проверки соответствия CSV файла?
То же, что W3C валидатор, но для CSV?
Есть ли хорошие сайты/службы для проверки соответствия CSV файла?
То же, что W3C валидатор, но для CSV?
Недавно я столкнулся с Google Refine - это не служба для проверки файлов CSV, это инструмент, который вы загружаете локально, но он предоставляет множество инструментов для работы с данными и обнаружения аномалий.
http://code.google.com/p/google-refine/
Как упоминалось в ответе, "CSV" стал неопределенным термином, главным образом потому, что люди не следуют One True Way при использовании данных, разделенных разделителями
http://www.catb.org/~esr/writings/taoup/html/ch05s02.html
EDIT/UPDATE (2016-08-09):
CSV в настоящее время становится четко определенным термином рабочей группой W3C CSV
Открытый институт данных разрабатывает службу проверки CSV, которая позволит пользователям проверять структуру своих данных, а также проверять ее на простую схему.
Сервис по-прежнему очень важен для альфы, но можно найти здесь:
Код приложения и базовая библиотека являются открытыми:
https://github.com/theodi/csvlint
https://github.com/theodi/csvlint.rb
README в библиотеке предоставляет сводку ошибок и предупреждений, которые могут быть сгенерированы. Можно сообщить о следующих типах ошибок:
:wrong_content_type
- тип содержимого не является текстом /csv :ragged_rows
- строка имеет различное количество столбцов (чем первая строка в файле):blank_rows
- полностью пустая строка, например. пустую строку или строку, где все значения столбца пусты.:invalid_encoding
- ошибка кодирования при разборе строки, например. из-за недопустимых символов:not_found
- ошибка HTTP 404 при извлечении данных:quoting
- проблема с цитированием, например. отсутствующая или нецензурная цитата, незакрытое цитированное поле:whitespace
- цитируемый столбец имеет ведущие или завершающие пробелыМожно сообщить о следующих типах предупреждения:
:no_encoding
- заголовок Content-Type, возвращаемый в HTTP-запросе, не имеет параметра charset:encoding
- набор символов не UTF-8:no_content_type
- файл подается без заголовка Content-Type:excel
- нет заголовка Content-Type и расширения файла .xls:check_options
- Файл CSV содержит только один столбец:inconsistent_values
- несогласованные значения в одном столбце. Сообщается, если и 90% значений, похоже, имеют одинаковый тип данных (числовой или буквенно-цифровой, включая пунктуацию).Национальный архив разработал Язык схемы CSV и CSV Validator, программное обеспечение, написанное на Java. Это с открытым исходным кодом.