У меня проблема, когда файлы .doc и .pdf выводятся нормально, но файл .docx выходит из строя.
Чтобы решить эту проблему, я пытаюсь отладить, почему .docx поврежден.
Я узнал, что формат docx намного более строг в отношении дополнительных символов, чем либо .pdf, либо .doc. Поэтому я искал различные файлы xml в файле docx, ищущем недопустимый XML. Но я не могу найти. Все это подтверждается штрафом.
Может ли кто-нибудь предложить мне сейчас расследование?
UPDATE:
Полный список файлов внутри папки выглядит следующим образом:
/_rels
.rels
/customXml
/_rels
.rels
item1.xml
itemProps1.xml
/docProps
app.xml
core.xml
/word
/_rels
document.xml.rels
/media
image1.jpeg
/theme
theme1.xml
document.xml
fontTable.xml
numbering.xml
settings.xml
styles.xml
stylesWithEffects.xml
webSettings.xml
[Content_Types].xml
ОБНОВЛЕНИЕ 2:
Я также должен был упомянуть, что причиной коррупции является почти наверняка плохой двоичный файл POST от моего имени.
Почему файлы docx повреждены двоичным сообщением, но .doc и .pdf в порядке?
ОБНОВЛЕНИЕ 3:
Я пробовал демонстрацию различных инструментов для восстановления docx. Кажется, что все они исправляют файл в порядке, но не дают никаких указаний относительно причины ошибки.
Мой следующий шаг - изучить содержимое поврежденного файла с исправленной версией.
Если кто-нибудь знает инструмент восстановления docx, который дает достойное сообщение об ошибке, я был бы признателен за это. На самом деле я могу опубликовать это как отдельный вопрос.
ОБНОВЛЕНИЕ 4 (2017)
Я никогда не решал эту проблему. Я попробовал все инструменты, предложенные в ответах ниже, но никто из них не работал у меня.
С тех пор я немного продвинулся и обнаружил, что блок 0000
отсутствует при открытии .docx в Sublime Text. Подробнее в новом вопросе здесь: Что может быть причиной этого повреждения в файлах .docx во время httpwebrequest?