Поиск автономной библиотеки для форматирования HTML, который я могу использовать с кодом .NET

Мне приходится иметь дело с проблемами в плотно отформатированном HTML, который фактически не читается, поэтому я хочу, чтобы библиотека "красиво печатала", форматировала, украшала или все, что вы хотите назвать в приложении .NET, управляя этим HTML.

На данный момент я копирую и вставляю его в Visual Studio 2012 и отформатирую его, а затем вставляю обратно в приложение, но это становится немного утомительным.

Было бы также полезно, если бы он мог эффективно отменить процесс и удалить все пробелы, когда я исправил проблемы.

Кстати, я знаю, что изменение формата HTML иногда может привести к неожиданным результатам (я смотрю на вас IE), но я могу жить с этим.

Ответ 1

Отъезд Html Tidy для .NET/Mono

На странице проекта:

TidyManaged

Это управляемая оболочка .NET/Mono для открытой исходной, кросс-платформенной библиотеки Tidy, анализатора разметки HTML/XHTML/XML и чистого, первоначально созданного Дейвом Раггеттом.

И пример использования:

using System;
using TidyManaged;

public class Test
{
  public static void Main(string[] args)
  {
    using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>"))
    {
      doc.ShowWarnings = false;
      doc.Quiet = true;
      doc.OutputXhtml = true;
      doc.CleanAndRepair();
      string parsed = doc.Save();
      Console.WriteLine(parsed);
    }
  }
}

Похоже, он должен наилучшим образом удовлетворить ваши потребности.