The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Для Linux представлена система голосового и визуального управления Alena AIS

28.09.2013 21:08

Отечественная компания Selina представила проект Alena AIS, в рамках которого для Linux разработана система для голосового и визуального управления. Помимо основной функции по распознаванию голосовых команд для Alena AIS подготовлен модуль для организации управления указателем мыши через движение головы перед web-камерой.

Управление производится через графический интерфейс, который позволяет настраивать программу и добавлять голосовые команды. Программа написана на языке Python и распространяется бесплатно, но без указания лицензии. Из поддерживаемых дистрибутивов отмечаются Debian и Ubuntu (среди зависимостей - Apache, MySQL, php, Python, Sox).

Примечание редакции: Содержимое устанавливаемого пакета говорит о том, что Alena AIS не обладает собственной системой распознавания образов и речи, а использует сторонние разработки. В частности, для определения голосовых команд практикуется обращение к сервису Google Voice API, а для отслеживания объектов перед web-камерой используется OpenCV с модулем определения лиц от Modesto Castrillon-Santana.

  1. Главная ссылка к новости (http://selina-corp.com/aais...)
  2. OpenNews: Для Linux подготовлена система распознавания речевых команд, использующая Google Voice API
  3. OpenNews: Релиз свободной системы распознавания речи Simon 0.4
  4. OpenNews: Открытая реализация метода Виолы-Джонса для обнаружения лиц на фотографиях
  5. OpenNews: Первый релиз библиотеки ccv для выявления объектов на фотографиях
Автор новости: selina-corp
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/38021-opencv
Ключевые слова: opencv
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (46) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.2, Омский линуксоид (ok), 23:06, 28/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Я знал, я верил, что сила свободного ПО доделает это!
    P.S. пользователь eviacam (подобного проекта, но без голоса)
     
     
  • 2.22, pavlinux (ok), 03:08, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +6 +/
    > Я знал, я верил,

    Уже лет 20 идут попытки внедрения голосового управления. Начиналось с Венды95,
    была под неё хрень - "Горыныч" называлась, тупая как валенок  http://www.youtube.com/watch?v=_zgWFkyvWvE
    И кроме как поиграться применения не имеет. Ибо реально заё....шся обучать, болтать,
    Голос должен быть ровный, разборчивый, чётки, что реально утомляет.  

     
     
  • 3.30, arisu (ok), 10:25, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > была под неё хрень — «Горыныч» называлась, тупая как валенок

    зато сейчас dragon в связке со swype нехило рулят. ах, да: «горыныч» — это такой DragonDictate, только «с адаптацией». в чём заключалась адаптация — я так и не понял в своё время.

     
     
  • 4.47, pavlinux (ok), 13:45, 30/09/2013 [^] [^^] [^^^] [ответить]  
  • +2 +/
    >> была под неё хрень — «Горыныч» называлась, тупая как валенок
    > зато сейчас dragon в связке со swype нехило рулят.

    Гугло поиском пользуетесь? На всю улицу орёте "Где ближайшая пивнушка"? :)

     
     
  • 5.48, arisu (ok), 13:53, 30/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    > Гугло поиском пользуетесь? На всю улицу орёте «Где ближайшая пивнушка»? :)

    ты знаешь, есть и другие применения, кроме гуглопоиска. и другие места, кроме улиц.

     

  • 1.5, Аноним (-), 23:35, 28/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А мускуль зачем? Нельзя sqlite использовать?
     
     
  • 2.9, angra (ok), 01:05, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +15 +/
    В книжках пишут только про php+mysql, а значит для 90% кодеров sqlite просто не существует.
     
     
  • 3.14, Аноним (-), 01:37, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ну и правильно. А то начнут пихать его куда попало.
    Видеть мускул там, где должен быть скулайт, или там, где должен быть постгрес - неприятно.
    Но гораздо страшнее видеть скулайт на месте постгреса и наоборот.
     
     
  • 4.26, Аноним (-), 07:20, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Но гораздо страшнее видеть скулайт на месте постгреса и наоборот.

    Мсье знает толк в извращениях.

     
  • 4.31, arisu (ok), 10:27, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Но гораздо страшнее видеть скулайт на месте постгреса и наоборот.

    ещё страшнее видеть SQL там, где хватило бы простой дисковой хэш-таблицы или чистых B+ trees.

     
  • 3.49, doc_x (?), 16:57, 30/09/2013 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Причем здесь пых, если написано на питоне?
     
     
  • 4.51, Led (ok), 06:10, 01/10/2013 [^] [^^] [^^^] [ответить]  
  • +/
    > Причем здесь пых, если написано на питоне?

    Ты так говоришь, как будто "на питоне" - лучше.

     

  • 1.6, anonymous (??), 00:09, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +8 +/
    Меня искренне смущает необходимость всех описанных зависимостей, но даже если забыть об этом, то использование google voice api ставит под сомнение полную открытость проекта.
     
     
  • 2.28, Аноним (-), 10:17, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Не под сомнение, а просто хоронит проект. Как черновая реализация интерфейса с (несуществующему?) движку распознавания голоса пойдет.
     

  • 1.7, Аноним (-), 00:15, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    "- DFace Control
    Модуль позволяет управлять указателем мышки через веб камеру, плавными движениями головы. Достаточно чуть отклонить голову и в ту сторону будет двигаться указатель
    - Search Internet
    Поиск в интернете через голосовую команду"

    Слабо представляю зачем нужно первое и не считаю особо полезным второе. Пока скорее какой-то набросок идеи, чем готовый проект.

     
     
  • 2.8, Аноним (-), 00:20, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    В смартфонах от Гнимуса такое уже реализовано
     
     
  • 3.27, Аноним (-), 07:21, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > В смартфонах от Гнимуса такое уже реализовано

    Подозреваю что у них для этого не требуется вкрячивать в систему мускул, апач, пых, питон и чего я там еще забыл.

     
  • 2.15, MrClon (ok), 01:53, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    > Слабо представляю зачем нужно первое

    Для людей с ограниченными возможностями может быть крайне полезно. Вертишь головой, подмигиваешь, вот тебе и мышка. говоришь в микрофон, вот и клава. Что ещё нужно для полноценного использования компа.

     
     
  • 3.17, Аноним (-), 01:57, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Для людей с ограниченными возможностями может быть крайне полезно. Вертишь головой, подмигиваешь,
    > вот тебе и мышка. говоришь в микрофон, вот и клава. Что
    > ещё нужно для полноценного использования компа.

    Чтобы все это было сделано не через задницу и работало соответственно. Тады да.

     
     
  • 4.18, MrClon (ok), 02:05, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • –3 +/
    >> Для людей с ограниченными возможностями может быть крайне полезно. Вертишь головой, подмигиваешь,
    >> вот тебе и мышка. говоришь в микрофон, вот и клава. Что
    >> ещё нужно для полноценного использования компа.
    > Чтобы все это было сделано не через задницу и работало соответственно. Тады
    > да.

    Ну да, какой-бы потенциально полезной ни была-бы программа, если она не работает толку от неё нет.
    С другой стороны если программа работает, то не так уж важно насколько она кривая.
    Но здесь кажется тот случай когда программа скорее не работает (а может это только линуксовая версия такая кривая).

     
  • 3.38, Аноним (-), 18:17, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    Ну, тут я понимаю, но реализовано ли это подмигивание? Просто не увидел в описание, как работает щелчок мышью и по-умолчанию подумал, что он не реализован)
     
  • 2.20, YetAnotherOnanym (ok), 02:45, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Слабо представляю зачем нужно первое и не считаю особо полезным второе

    Чтобы это понять, нужно быть Стивеном Хокингом.

     
     
  • 3.37, Аноним (-), 18:16, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    У него вроде шевелится только 1 палец ... Так что мимо)
     
  • 2.32, arisu (ok), 10:29, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Слабо представляю зачем нужно первое и не считаю особо полезным второе.

    попробуй представить, что ты спьяну сверзился с лестницы. а сверху на тебя упал твой друг и мусорный бачок. и теперь ты лежишь дома, руки-ноги в гипсе. гипс, конечно, снимут, ничего страшного — но скучно же лежать.

     
     
  • 3.33, тоже Аноним (ok), 11:31, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    Есть опасность создать интересный медийный повод. Например, "чувак накачал себе шею толще бедра" или "а вы смогли бы получить сотрясение мозга лежа?".
     

  • 1.10, Guest683 (ok), 01:09, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +11 +/
    Да это же быдлоподелка клоунокодеров. Откройте исходники, посмейтесь! Аффтары применили все свои скилы в рисовании кнопочек на PyQt. А вот отправить реквест на сервер не смогли, пришлось применить быдлонавыки быдлоPHP. Склеить всё это пришлось башем.

    Ей богу, клоуны!

     
     
  • 2.11, Аноним (-), 01:19, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Наверно отличная отзывчивость системы ...
     
     
  • 3.12, Guest683 (ok), 01:22, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    Не знаю, у меня не заработало ничего, кроме окошка. Видимо из-за того, что у меня микрофонов больше, чем 1, а настроек нет =)
     
  • 2.16, Аноним (-), 01:56, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +7 +/
    > Да это же бы́длоподелка клoунокодеров. Откройте исходники, посмейтесь! Aффтары применили все свои скилы в рисовании кнопочек на PyQt. А вот отправить реквест на сервер не смогли, пришлось применить бы́длонавыки бы́длоPHP. Склеить всё это пришлось башем.

    Походу, эта selena - помесь каноникал с роснано :-\

     
     
  • 3.19, Sergey (??), 02:20, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +3 +/
    > Походу, эта selena - помесь каноникал с роснано :-\

    Тут ещё Дениской попахивает.

     
  • 2.39, Аноним (-), 18:22, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    Баян, но вы сделали мой день ... xD Прошибло)
     

  • 1.13, vitalif (ok), 01:33, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    "Алёна даст"...
     
     
  • 2.36, nur (?), 16:09, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • –1 +/
    +1
     

  • 1.21, Аноним (-), 02:49, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +6 +/
    Зачем апач? ЗАЧЕМ тут вообще веб-сервер?
     
     
  • 2.42, Аноним (-), 20:25, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +/
    >Зачем апач? ЗАЧЕМ тут вообще веб-сервер?

    Это чтобы если вы чего не того компу сболтнули - компетентные органы сразу бы узнали.

     

  • 1.23, pavlinux (ok), 03:17, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +5 +/
    > В частности, для определения голосовых команд практикуется обращение
    > к сервису Google Voice API, а для отслеживания объектов перед web-камерой
    > используется OpenCV с модулем определения лиц от Modesto Castrillon-Santana."

    И какое отношение эта Alena AIS имеет к системам распознавания?
    Так можно и каждого Гентушника называть создателем операционной системы

     
     
  • 2.25, Аноним (-), 07:18, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Учитывая объем вкалывания типичного гентушника это будет не настолько уж и неправдой.
     
     
  • 3.40, kurokaze (ok), 19:45, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • –1 +/
    >Учитывая объем вкалывания типичного гентушника

    Чего? По вечерам что ли грядки копают, а по ночам вагоны разгружают?

    > это будет не настолько уж и неправдой.

    Какой то слабый наброс :)

     

  • 1.24, Аноним (-), 07:18, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    >  бесплатно, но без указания лицензии.

    - А на каких условиях?
    - После узнаете...

    > среди зависимостей - Apache, MySQL, php, Python, Sox.

    Нихрена себе система. Оно наверное умеет режим автопилота и вообще пользователя заменять может.

     
  • 1.29, arisu (ok), 10:23, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > Google Voice API

    давай, до свидания.

     
  • 1.35, Яйцассыром (?), 15:11, 29/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Зачем там мерзкая анимешная картинка?
     
     
  • 2.41, kurokaze (ok), 19:46, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > Зачем там мерзкая анимешная картинка?

    Чтоб ватников тролить. В следующем релизе это будут пони - инфа 100%

     
     
  • 3.43, Аноним (-), 20:27, 29/09/2013 [^] [^^] [^^^] [ответить]  
  • +3 +/
    >В следующем релизе это будут пони - инфа 100%

    А, так вот кто эту Алёну запилил...

     

  • 1.44, EuPhobos (ok), 08:20, 30/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > Программа написана на языке Python
    > среди зависимостей - php

    Однако..

     
  • 1.45, SpiritOfStallman (ok), 12:26, 30/09/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • –1 +/
    Прочитав заголовок так обрадовался, ибо давно мечтаю о хорошем распознавателе речи (ну и без всяких там корпораций, да).
    Но новость вы и сами видели...
     
     
  • 2.46, Andrey Mitrofanov (?), 13:37, 30/09/2013 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >так обрадовался, ибо давно мечтаю о хорошем распознавателе речи

    Марш отсюда общаться с духами Питера Брауна http://lwn.net/Articles/387167/ , тт. из гнома http://lwn.net/Articles/473007/ .

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру