Программное обеспечение распознавания голоса для разработчиков

Ну, наконец, документы сказали это, мне нужно немного успокоиться на моем запястье в течение нескольких месяцев. Будучи тем, что я .NET Developer, это может закончиться моей жизнью на некоторое время, что я не хочу делать. Тем не менее, есть ли хорошие варианты громкой связи для разработчиков? Кто-нибудь успешно использовал какое-либо программное обеспечение для распознавания речи?

POSTSCRIPT: Я снова поправил руку до такой степени, что двуручное программирование не является проблемой. Дракон Естественно, работал достаточно хорошо, но был медленнее, не так, как клавиатура, где я программировал быстрее, чем я думал.

Ответ 1

Он там, и он работает...

Существует довольно много программ распознавания речи, из которых Dragon NaturallySpeaking является, я думаю, одним из наиболее широко используемых. Я использовал его сам и был впечатлен его качеством. Это было пару лет назад, я думаю, что до сих пор все еще улучшилось.

... но это непросто...

Несмотря на то, что он работает удивительно хорошо, я не буду говорить, что это простое решение. Для подготовки программы требуется время, и даже тогда это будет делать ошибки. Это кропотливо медленнее по сравнению с типированием, поэтому мне пришлось постоянно говорить себе: "Не хватай клавиатуру, не хватай клавиатуру..." (после чего я все равно хватаю клавиатуру). Я сам склонен немного бормотать, что не улучшило ситуацию:-). Особенно первые недели могут расстраивать. Вы даже можете получить проблемы с голосом, если вы слишком сильно меняете свой голос.

... особенно для программистов!

В целом, это, безусловно, приемлемое решение для людей, которые пишут обычный текст/прозу. Как программист, вы находитесь в совершенно другой сфере, для которой нет реальных решений. Возможно, теперь все изменилось, но я был бы удивлен, если бы они были.

Какая проблема? Большинство программных средств SR созданы для распознавания нормального языка. Программисты пишут очень загадочные вещи, и трудно, если не невозможно, найти программное обеспечение, которое выполняет преобразование между нормальным языком и кодом. Например, как бы вы диктовали:

if (somevar == 'a')
{
   print('You pressed a!');
}

Используя команды в вашей средней программе SR, это огромная боль: "если пробел оставил скобку, равный знаку, равный знак апострофа, заклинание апострофа...". И я даже не говорю о навигации по вашему коду. Вы когда-нибудь замечали, как много вы используете клавиатуру во время программирования, и насколько отличается от использования обычным пользователем клавиатуры?

Как сделать все возможное

До сих пор я работал только с Dragon NaturallySpeaking (DNS), поэтому я могу говорить только за этот продукт. Есть несколько интересных дополнений и веб-сайтов, предназначенных для таких людей, как программисты:

  • Vocola - неофициальный плагин, который позволяет вам легко добавлять свои собственные команды в DNS. Я счел это необходимым, в основном. Вы также сможете находить наборы команд, написанные другими программистами, например. навигационный код. Он основан на программном пакете, написанном на Python, поэтому есть и несколько более продвинутых и привлекательных пакетов. Также проверьте Vocola Страница ресурсов. (Предупреждение: когда я использовал его, возникли некоторые проблемы с установкой Vocola, ознакомьтесь с новостной группой ниже для информации!)
  • SpeechComputing.com - форум/группа новостей с большим количеством интересных обсуждений. Хорошее место для начала.

Заключительные замечания

Кажется, что наилучшим решением этой проблемы является:

  • Найдите способы фактического кодирования.
  • Попробуйте восстановить. Я несколько неохотно рекомендую эту книгу, но, похоже, она отлично работает для людей с RSI/carpal tunnel и другими проблемами хронической боли: J.E. Sarno, рецепт Mindbody. Я сейчас работаю над этим, и я думаю, что это определенно стоит прочитать.

Ответ 2

Я диктую VB.net и TSQL с помощью Dragon NaturallySpeaking 10 Professional. VB.net по своей сути ближе к "разговорному" языку, но я не вижу причин, почему он не мог работать на С# или других. Я начинаю с совершенно пустой лексики и строю ее с нуля, чтобы удовлетворить мои потребности (именно поэтому я использую профессиональную версию).

Вот основные этапы (предполагается, что вы уже создали и обучили пользователя):

  • Создайте новый словарь на основе "Base General - Empty Dictation".
  • Не проверяйте документы или электронную почту.
  • Добавить списки ключевых слов с произношением, специфичным для вашего языка программирования (Dim, ByVal\by-val и т.д.).
  • Создайте документ .txt, содержащий все ваши комментарии минус-код.
  • Убирайте слова из этого документа и добавляйте их с произношениями.
  • Используйте документ для обучения языковой модели словаря.

Я напишу что-то более подробно, когда у меня появится шанс, если кто-то заинтересован.

Edit:

Вот как диктовать код SQL. Список слов, созданный здесь, может быть включен в другие словари, если вы разработчик базы данных.

Ответ 4

Еще одна идея - найти другого хорошего разработчика для совместной работы с программой. Это сработало очень хорошо для меня. Я получаю, чтобы отдохнуть руками, не обязательно замедляя работу, в конечном итоге создавая более качественный код - или, по крайней мере, не нужно пересматривать его.

Ответ 5

Для всех пользователей Linux я хотел бы поделиться некоторыми ссылками.

Начните с Simon - программное обеспечение для распознавания речи с открытым исходным кодом:

и некоторые другие:

и

Ответ 6

Я знаю, что я немного не по теме, и ничего не знаю о программном обеспечении для распознавания голоса; однако вам может показаться полезным исследовать изменение клавиатуры на макет Dvorak, о котором я слышал, гораздо больше на запястьях.

http://en.wikipedia.org/wiki/Dvorak_Simplified_Keyboard

Ответ 7

Я попробовал Дракона пару лет назад, и это был кошмар из раздутых слов и фраз - не рекомендуется. Я понимаю, что это было самое лучшее, что происходит в этот момент времени, поэтому я не оптимист.

Как человек-страдальщик, рекомендации будут следующими:

  • Найдите работу, которая требует как можно меньше OT
  • Попробуйте различные клавиатуры. По моему опыту, работа на ноутбуке с полной занятостью работала лучше всего.
  • Начните программу тяжелой атлетической атлетики.

Ответ 8

Что касается проблемы с запястьем, я узнал, что с помощью мыши обеими руками около 10 лет назад.

Это удивительно легко и существенно облегчает натяжение. В настоящее время я использую ноутбук и нажатие кнопки тачпада напрягает мой большой палец.

Будьте осторожны. Эти проблемы могут длиться дольше, чем можно было бы подумать.


p.s. вы можете добавить тег "эргономика" или что-то в этом роде - название может рассматриваться как разработка для распознавания голоса.

Ответ 9

Как упоминалось выше, Dragon Naturally Speaking является лучшим программным обеспечением для распознавания речи, однако Microsoft Speech Recognition не отстает и поставляется вместе с Vista.

Недавно Vocola был перенесен в MSR и имеет функцию интеграции .Net.

Несколько советов

  • Обучение диктованию требует определенного времени. Просто потому, что вы можете говорить, это не значит, что вы знаете, как использовать программное обеспечение для распознавания речи.
  • Получение опыта с сочетанием SR и клавиатуры/мыши намного проще, чем полная работа в режиме громкой связи.
  • Используйте CodeRush или эквивалент типа less.

Ответ 10

Золотой стандарт для программирования голосом VoiceCode. Если я правильно помню, они поддерживают С++ и Python.

Ответ 11

Я начал использовать свою левую руку для мыши, это не только помогло мне немного, но и позволило мне использовать мою правую руку более свободно, если вы напишете много материала dwon, пока вы это кодируете, это вам очень помогает. вы можете прокручивать и записывать одновременно...

Когда начались мои проблемы, я поставил под мой запястье мешок с водой, мне понравилось! сумка у меня была идеальная, она была длинной, и я положил ее перед клавиатурой, чтобы я мог одеть мои запястья там.... пока однажды не наступит на нее...

Ответ 12

Дракон Естественно Говоря Предпочтительный и Vocola. Autohotkey для автоматизации в максимально возможной степени. Нелегко программировать. Я пытался; почти невозможно. Отъезд Джон Сарно Лечение боли в спине. Это сделало меня лучше. Я возвращаюсь к программированию весь день!

Ответ 13

Еще один бит вне темы здесь, я обнаружил, что расщепленный кебар на две части и другие специальные клавиатуры помогают, просто проверьте кинезис. Я собрал информацию о таком оборудовании в режиме diigo:

Как насчет прямых ссылок:

Еще одна вещь! Помните о перерывах в упражнениях. Регулярные упражнения (например, небольшие упражнения - каждая половина и час другой) сделать действительно действительно лучше!

Ответ 15

Я использовал Dragon Dictate в 1996 году по той же причине, что и вы. Это было медленно, но лучше, чем не работать. Мне было проще писать код, заполнив белую доску 4x8 кодом, а затем заставляя кого-то еще вводить ее. Затем я использовал DD для отладки.

И пока вы на нем, вы можете посмотреть книги Дебора Култерта о RSI. Они очень информативны.

Ответ 16

Я не могу найти ссылку на один (я действительно смотрел), но есть клавиатура с 5 ключами, позволяющая вводить одну руку, я предполагаю, что у вас только одно плохое запястье.

Если я найду ссылку, я попытаюсь сообщить вам.