Фон
Глядя на автоматизацию создания доменов в JasperServer. Домены - это "представление" данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю понятным для пользователя способом.
Проблема
Есть более 2000 возможных данных, из которых организация теоретически может включить в отчет. Данные получены из не-человеческих имен, таких как:
payperiodmatchcode labordistributioncodedesc зависимая взаимосвязь действий actionendoptiondesc addresstype addresstypedesc historytype psaddresstype rolename bankaccountstatus bankaccountstatusdesc тип банковского счета bankaccounttypedesc beneficiaryamount выгодоприобретатель Преимущества Benefubiaryclass Benefificiaryclassdesc useactioncode benefitactioncodedesc benefitagecontrol benefitagecontroldesc ageconrolagelimit ageconrolnoticeperiod
Вопрос
Как вы автоматически измените такие имена на:
- код соответствия периода оплаты
- код распределения рабочей силы desc
- зависимая взаимосвязь
Идеи
-
Использовать Google Вы имели в виду движок, однако я думаю, что это нарушает их TOS:
lynx -dump «url» | grep "Did you mean" | awk ...
Языки
Любой язык в порядке, но текстовые синтаксические анализаторы, такие как Perl, вероятно, будут хорошо подходящими. (Имена столбцов имеют только английский язык.)
Ненужная предварительная проверка
Цель состоит не в 100% -ном совершенствовании при разрыве слов; возможен следующий результат:
- enrollmenteffectivedate → Дата вступления в силу регистрации
- enrollmentenddate → Дата регистрации людей для регистрации
- enrollmentrequirementset → Набор требований к регистрации
Независимо от того, человеку нужно будет дважды проверить результаты и исправить многие. Сокращение набора из 2000 результатов до 600 исправлений будет значительным экономией времени. Зафиксировать в некоторых случаях, имеющих несколько возможностей (например, therapistname), совсем не хватать точки.