Средство обнаружения дублирования кода

Я ищу инструмент дублирования кода, который является агностиком языка. Легко найти языковые инструменты для дублирования кода (для Java, C, PHP,...), но я бы хотел запустить некоторый анализ дублирования кода на шаблонах в пользовательском синтаксисе.

Мне не нужен расширенный синтаксический анализ синтаксиса, просто сравнение строк на строчной линии в порядке. Совпадение без пробелов будет плюсом, но не обязательным. (Не так уж сложно нормально нормализовать/исключить пробелы.)

Кто-нибудь знает инструмент, который может быть (неправильно) использован для чего-то вроде этого?

Спасибо.

Ответ 1

Посмотрите Simian, вы можете использовать его для Java, С#, C, С++, COBOL, Ruby, JSP, ASP, HTML, XML, Visual Basic, Groovy и даже текстовые файлы.

Кроме того, аналогичный вопрос здесь.