The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Релиз свободной системы распознавания речи Simon 0.4

31.12.2012 17:47

После двух лет разработки представлен релиз системы распознавания речи Simon 0.4, позволяющей организовать управление десктопом при помощи голосовых команд без необходимости использования клавиатуры и мыши. Средства для голосового управления рабочим столом доступы для Windows и окружений на базе X11. Код системы распространяется под лицензией GPLv2. Разработка Simon ведётся в рамках проекта KDE в составе рабочей группы KDE Accessibility.

В составе проекта развиваются инструменты для создания голосовых и акустических моделей, распознавания речи и организации управления голосом. Кроме функций управления рабочим столом наработки проекта Simon также используются в таких областях как аутентификация по голосу, голосовые диалоговые системы, организация голосового управления роботами и различными аппаратными устройствами. Ключевой областью применения Simon является предоставление средств для работы с компьютером людей с ограниченными возможностями. Из интересных проектов, реализованных на базе Simon можно отметить робота ECHORD для помощи по дому и медиа-центр для дома престарелых.

Процесс распознавания в Simon построен на статических алгоритмах - для начала поддержки нового языка достаточно сформировать акустическую и языковую модели, которые в совокупности составляют речевую модель. Если речевая модель уже создана, для начала распознавания команд достаточно пятиминутной тренировки для адаптации системы к особенностям речи конкретного пользователя. Simon может быть легко адаптирован для голосового управления любым приложением, в том числе для организации голосового ввода текста, что, например, позволяет обездвиженным людям с ограниченными возможностями просматривать сайты и отправлять электронные сообщения.

Ключевые особенности новой версии:

  • Проведена большая работа по улучшению юзабилити. Интерфейс стал более удобен и понятен, как для новичков, так и для давно знакомых с системой пользователей. Проведена реорганизация основного окна управления Simon, наиболее важные опции вынесены на основной базовый экран;
  • Поддержка нового формата (.sbm) для хранения базовых голосовых моделей и средства для интеграции с online-репозиториями базовых моделей GHNS существенно упростили начальную конфигурацию системы голосового управления. Для настройки Simon от установки до получения полностью работающей конфигурации теперь требуется менее пяти минут без проведения каких-либо предварительных действий;

  • Обеспечение поддержки CMU SPHINX в качестве бэкенда для распознавания речи. Поддержка ранее доступных бэкендов для систем HTK и Julius продолжена в полном объёме, тем не менее новые скомпилированные для Simon модели по умолчанию рассчитаны на использование бэкенда SPHINX. Для сборки собственных речевых моделей больше нет необходимости в установке проприетарного пакета HTK. Необходимый для работы Simon бэкенд выбирается автоматически в зависимости от конфигурации текущей системы;
  • Ключевой проблемой открытых систем распознавания речи всегда было отсутствие свободнодоступных высококачественных речевых моделей. Основным источником свободных акустических моделей для различных языков уже много лет является проект Voxforge, но качество этих моделей оставляет желать лучшего. Поэтому, кроме возможности работы с уже готовой моделью от проекта Voxforge, в версии Simon 0.4 добавлены средства для участия в улучшении акустических моделей Voxforge. В частности, Simon позволяет отправлять на сервер Voxforge результаты локальной тренировки голосовых моделей.
  • Средства для учёта контекста в процессе распознавания речевых команд. В зависимости от изменения текущей ситуации для увеличения точности Simon может на лету переконфигурировать себя, включать и выключать дополнительные сценарии, микрофоны и данные, полученные в результате тренировки модели;
  • Новая диалоговая система, позволяющая определять сценарии взаимодействия на языке JavaScript, интегрируемая с движками обработки данных Plasma, поддерживающая задание шаблонов и предоставляющая возможности по озвучиванию текста (text-to-speech);
  • Для пользователей KDE представлен новый плазмоид "Simonoid" для запуска и управления Simon.


  1. Главная ссылка к новости (http://simon-listens.blogspot....)
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/35731-simon
Ключевые слова: simon, kde, voice
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (19) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, _Vitaly_ (ok), 19:20, 31/12/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +4 +/
    https://www.youtube.com/watch?v=18iq0YbL4mw
     
     
  • 2.2, filosofem (ok), 20:18, 31/12/2012 [^] [^^] [^^^] [ответить]  
  • +/
    https://www.youtube.com/watch?v=lu88J5JL8Hw
     
     
  • 3.6, anonymous (??), 22:56, 31/12/2012 [^] [^^] [^^^] [ответить]  
  • +/
    http://youtu.be/65rcmF3MDB0
     

  • 1.3, жабабыдлокодер (ok), 20:19, 31/12/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    На Voxforge русский язык есть. Можно попробовать...
     
  • 1.4, KDE Power (?), 20:28, 31/12/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +5 +/
    Классный проект, реально полезный. Когда добавят в Kubuntu?
     
     
  • 2.9, Аноним (-), 23:49, 31/12/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Удобнее мышка и клавиатура, чем орать на комп
     
     
  • 3.11, идиот (?), 08:04, 01/01/2013 [^] [^^] [^^^] [ответить]  
  • +2 +/
    а если нет рук? Все мышка удобнее?
     
     
  • 4.13, Joe Average (?), 22:36, 01/01/2013 [^] [^^] [^^^] [ответить]  
  • +/
    > а если нет рук? Все мышка удобнее?

    Сейчас эти интерфейсы пихают куда ни попадя, и позиционируются они "для всех", а не для людей с физическими отклонениями. И работают, честно говоря, в лучшем случае через раз.

    Это как если начнут выпускать ТОЛЬКО мониторы со шрифтом Брайля, кто-то напишет "Нафик не нужно, пока есть визуальные мониторы", а вы ответите "А если слепой? Всем визуальные удобнее?"

     
     
  • 5.17, zerot (??), 12:05, 03/01/2013 [^] [^^] [^^^] [ответить]  
  • +1 +/
    как сказать
    в форточках несколько лет назад для ворда ставилось дополнение, позволявшее надиктовывать текст без клавиатуры. на англицком правда. и работало оно не через раз, а каждый раз
     

  • 1.5, alex (??), 20:58, 31/12/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В голой консоли работать не будет. Неклассно.
     
  • 1.7, Аноним (-), 23:03, 31/12/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    А есть такое же но без гуя? Чисто под голосовое управление чем попало, типа кофеварки?
     
     
  • 2.15, Crazy Alex (??), 12:01, 02/01/2013 [^] [^^] [^^^] [ответить]  
  • +/
    Угу, интересный вопрос. надо глядеть, как они там орхитектуру сваяли - едро + кедоспецифика или всё в одной куче. Предполагаю второе, конечно...
     

  • 1.8, Аноним (-), 23:35, 31/12/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    С интересом слежу за проектом, после того как про него была новость, что он под крыло KDE переходит. И очень здорово, что избавились от проприетарного бэкенда.
     
  • 1.12, Аноним (-), 15:51, 01/01/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    > улучшению юзабилити

    улучшению удобства использования

     
     
  • 2.14, anonim (?), 04:40, 02/01/2013 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Ну хоть кто-то ещё за чистоту русского языка борется! Спасибо!
     
  • 2.16, Аноним (-), 12:14, 02/01/2013 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >> улучшению юзабилити
    > улучшению удобства использования

    повышению удобства использования

     

  • 1.18, Аноним (-), 11:18, 05/01/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    обучить прогу осилил, а вот как ею пользоваться - нет. ниодну программу не могу настроить
     
  • 1.19, Аноним (-), 20:15, 05/01/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Сири от богом проклятого Яббла ну никак покоя не дает :)))))))))))))))))
     
  • 1.20, Борис (??), 12:33, 04/03/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    На сколько возможно применение видео-фильтров для повышения качества распознавания речи? как тут: http://www.youtube.com/user/RealSpeakerTV
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру