URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 91905
[ Назад ]

Исходное сообщение
"Для Linux представлена система голосового и визуального упра..."

Отправлено opennews , 28-Сен-13 23:04 
Отечественная компания Selina представила проект Alena AIS (http://selina-corp.com/aais), в рамках которого для Linux разработана система для голосового и визуального управления. Помимо основной функции по распознаванию голосовых команд для Alena AIS подготовлен модуль для организации управления указателем мыши через движение головы перед web-камерой.


Управление производится через графический интерфейс, который позволяет настраивать программу и добавлять голосовые команды.
Программа написана на языке Python и распространяется бесплатно, но без указания лицензии. Из поддерживаемых дистрибутивов отмечаются Debian и Ubuntu (среди зависимостей - Apache, MySQL, php, Python, Sox).

Примечание редакции: Содержимое устанавливаемого пакет говорит о том, что Alena AIS не обладает собственной системой распознавания образов и речи, а использует сторонние разработки. В частности, для определения голосовых команд практикуется обращение к сервису Google Voice API, а для отслеживания объектов перед web-камерой используется OpenCV (http://opencv.org/) с модулем определения лиц от Modesto Castrillon-Santana (http://mozart.dis.ulpgc.es/Gias/modesto.html?lang=0).

URL: http://selina-corp.com/aais
Новость: http://www.opennet.me/opennews/art.shtml?num=38021


Содержание

Сообщения в этом обсуждении
"Для Linux представлена система голосового и визуального упра..."
Отправлено Омский линуксоид , 28-Сен-13 23:06 
Я знал, я верил, что сила свободного ПО доделает это!
P.S. пользователь eviacam (подобного проекта, но без голоса)

"Для Linux представлена система голосового и визуального упра..."
Отправлено pavlinux , 29-Сен-13 03:08 
> Я знал, я верил,

Уже лет 20 идут попытки внедрения голосового управления. Начиналось с Венды95,
была под неё хрень - "Горыныч" называлась, тупая как валенок  http://www.youtube.com/watch?v=_zgWFkyvWvE
И кроме как поиграться применения не имеет. Ибо реально заё....шся обучать, болтать,
Голос должен быть ровный, разборчивый, чётки, что реально утомляет.  


"Для Linux представлена система голосового и визуального..."
Отправлено arisu , 29-Сен-13 10:25 
> была под неё хрень — «Горыныч» называлась, тупая как валенок

зато сейчас dragon в связке со swype нехило рулят. ах, да: «горыныч» — это такой DragonDictate, только «с адаптацией». в чём заключалась адаптация — я так и не понял в своё время.


"Для Linux представлена система голосового и визуального..."
Отправлено pavlinux , 30-Сен-13 13:45 
>> была под неё хрень — «Горыныч» называлась, тупая как валенок
> зато сейчас dragon в связке со swype нехило рулят.

Гугло поиском пользуетесь? На всю улицу орёте "Где ближайшая пивнушка"? :)


"Для Linux представлена система голосового и визуального..."
Отправлено arisu , 30-Сен-13 13:53 
> Гугло поиском пользуетесь? На всю улицу орёте «Где ближайшая пивнушка»? :)

ты знаешь, есть и другие применения, кроме гуглопоиска. и другие места, кроме улиц.


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 28-Сен-13 23:35 
А мускуль зачем? Нельзя sqlite использовать?

"Для Linux представлена система голосового и визуального упра..."
Отправлено angra , 29-Сен-13 01:05 
В книжках пишут только про php+mysql, а значит для 90% кодеров sqlite просто не существует.

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 01:37 
Ну и правильно. А то начнут пихать его куда попало.
Видеть мускул там, где должен быть скулайт, или там, где должен быть постгрес - неприятно.
Но гораздо страшнее видеть скулайт на месте постгреса и наоборот.

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 07:20 
> Но гораздо страшнее видеть скулайт на месте постгреса и наоборот.

Мсье знает толк в извращениях.


"Для Linux представлена система голосового и визуального..."
Отправлено arisu , 29-Сен-13 10:27 
> Но гораздо страшнее видеть скулайт на месте постгреса и наоборот.

ещё страшнее видеть SQL там, где хватило бы простой дисковой хэш-таблицы или чистых B+ trees.


"Для Linux представлена система голосового и визуального упра..."
Отправлено doc_x , 30-Сен-13 16:57 
Причем здесь пых, если написано на питоне?

"Для Linux представлена система голосового и визуального упра..."
Отправлено Led , 01-Окт-13 06:10 
> Причем здесь пых, если написано на питоне?

Ты так говоришь, как будто "на питоне" - лучше.


"Для Linux представлена система голосового и визуального упра..."
Отправлено anonymous , 29-Сен-13 00:09 
Меня искренне смущает необходимость всех описанных зависимостей, но даже если забыть об этом, то использование google voice api ставит под сомнение полную открытость проекта.

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 10:17 
Не под сомнение, а просто хоронит проект. Как черновая реализация интерфейса с (несуществующему?) движку распознавания голоса пойдет.

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 00:15 
"- DFace Control
Модуль позволяет управлять указателем мышки через веб камеру, плавными движениями головы. Достаточно чуть отклонить голову и в ту сторону будет двигаться указатель
- Search Internet
Поиск в интернете через голосовую команду"

Слабо представляю зачем нужно первое и не считаю особо полезным второе. Пока скорее какой-то набросок идеи, чем готовый проект.


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 00:20 
В смартфонах от Гнимуса такое уже реализовано

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 07:21 
> В смартфонах от Гнимуса такое уже реализовано

Подозреваю что у них для этого не требуется вкрячивать в систему мускул, апач, пых, питон и чего я там еще забыл.


"Для Linux представлена система голосового и визуального упра..."
Отправлено MrClon , 29-Сен-13 01:53 
> Слабо представляю зачем нужно первое

Для людей с ограниченными возможностями может быть крайне полезно. Вертишь головой, подмигиваешь, вот тебе и мышка. говоришь в микрофон, вот и клава. Что ещё нужно для полноценного использования компа.


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 01:57 
> Для людей с ограниченными возможностями может быть крайне полезно. Вертишь головой, подмигиваешь,
> вот тебе и мышка. говоришь в микрофон, вот и клава. Что
> ещё нужно для полноценного использования компа.

Чтобы все это было сделано не через задницу и работало соответственно. Тады да.


"Для Linux представлена система голосового и визуального упра..."
Отправлено MrClon , 29-Сен-13 02:05 
>> Для людей с ограниченными возможностями может быть крайне полезно. Вертишь головой, подмигиваешь,
>> вот тебе и мышка. говоришь в микрофон, вот и клава. Что
>> ещё нужно для полноценного использования компа.
> Чтобы все это было сделано не через задницу и работало соответственно. Тады
> да.

Ну да, какой-бы потенциально полезной ни была-бы программа, если она не работает толку от неё нет.
С другой стороны если программа работает, то не так уж важно насколько она кривая.
Но здесь кажется тот случай когда программа скорее не работает (а может это только линуксовая версия такая кривая).


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 18:17 
Ну, тут я понимаю, но реализовано ли это подмигивание? Просто не увидел в описание, как работает щелчок мышью и по-умолчанию подумал, что он не реализован)

"Для Linux представлена система голосового и визуального упра..."
Отправлено YetAnotherOnanym , 29-Сен-13 02:45 
> Слабо представляю зачем нужно первое и не считаю особо полезным второе

Чтобы это понять, нужно быть Стивеном Хокингом.


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 18:16 
У него вроде шевелится только 1 палец ... Так что мимо)

"Для Linux представлена система голосового и визуального..."
Отправлено arisu , 29-Сен-13 10:29 
> Слабо представляю зачем нужно первое и не считаю особо полезным второе.

попробуй представить, что ты спьяну сверзился с лестницы. а сверху на тебя упал твой друг и мусорный бачок. и теперь ты лежишь дома, руки-ноги в гипсе. гипс, конечно, снимут, ничего страшного — но скучно же лежать.


"Для Linux представлена система голосового и визуального..."
Отправлено тоже Аноним , 29-Сен-13 11:31 
Есть опасность создать интересный медийный повод. Например, "чувак накачал себе шею толще бедра" или "а вы смогли бы получить сотрясение мозга лежа?".

"Для Linux представлена система голосового и визуального упра..."
Отправлено Guest683 , 29-Сен-13 01:09 
Да это же быдлоподелка клоунокодеров. Откройте исходники, посмейтесь! Аффтары применили все свои скилы в рисовании кнопочек на PyQt. А вот отправить реквест на сервер не смогли, пришлось применить быдлонавыки быдлоPHP. Склеить всё это пришлось башем.

Ей богу, клоуны!


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 01:19 
Наверно отличная отзывчивость системы ...

"Для Linux представлена система голосового и визуального упра..."
Отправлено Guest683 , 29-Сен-13 01:22 
Не знаю, у меня не заработало ничего, кроме окошка. Видимо из-за того, что у меня микрофонов больше, чем 1, а настроек нет =)

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 01:56 
> Да это же бы́длоподелка клoунокодеров. Откройте исходники, посмейтесь! Aффтары применили все свои скилы в рисовании кнопочек на PyQt. А вот отправить реквест на сервер не смогли, пришлось применить бы́длонавыки бы́длоPHP. Склеить всё это пришлось башем.

Походу, эта selena - помесь каноникал с роснано :-\


"Для Linux представлена система голосового и визуального упра..."
Отправлено Sergey , 29-Сен-13 02:20 
> Походу, эта selena - помесь каноникал с роснано :-\

Тут ещё Дениской попахивает.


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 18:22 
Баян, но вы сделали мой день ... xD Прошибло)

"Для Linux представлена система голосового и визуального упра..."
Отправлено vitalif , 29-Сен-13 01:33 
"Алёна даст"...

"Для Linux представлена система голосового и визуального упра..."
Отправлено nur , 29-Сен-13 16:09 
+1

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 02:49 
Зачем апач? ЗАЧЕМ тут вообще веб-сервер?

"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 20:25 
>Зачем апач? ЗАЧЕМ тут вообще веб-сервер?

Это чтобы если вы чего не того компу сболтнули - компетентные органы сразу бы узнали.


"Для Linux представлена система голосового и визуального упра..."
Отправлено pavlinux , 29-Сен-13 03:17 
> В частности, для определения голосовых команд практикуется обращение
> к сервису Google Voice API, а для отслеживания объектов перед web-камерой
> используется OpenCV с модулем определения лиц от Modesto Castrillon-Santana."

И какое отношение эта Alena AIS имеет к системам распознавания?
Так можно и каждого Гентушника называть создателем операционной системы


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 07:18 
Учитывая объем вкалывания типичного гентушника это будет не настолько уж и неправдой.

"Для Linux представлена система голосового и визуального упра..."
Отправлено kurokaze , 29-Сен-13 19:45 
>Учитывая объем вкалывания типичного гентушника

Чего? По вечерам что ли грядки копают, а по ночам вагоны разгружают?

> это будет не настолько уж и неправдой.

Какой то слабый наброс :)


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 07:18 
>  бесплатно, но без указания лицензии.

- А на каких условиях?
- После узнаете...

> среди зависимостей - Apache, MySQL, php, Python, Sox.

Нихрена себе система. Оно наверное умеет режим автопилота и вообще пользователя заменять может.


"Для Linux представлена система голосового и визуального..."
Отправлено arisu , 29-Сен-13 10:23 
> Google Voice API

давай, до свидания.


"Для Linux представлена система голосового и визуального упра..."
Отправлено Яйцассыром , 29-Сен-13 15:11 
Зачем там мерзкая анимешная картинка?

"Для Linux представлена система голосового и визуального упра..."
Отправлено kurokaze , 29-Сен-13 19:46 
> Зачем там мерзкая анимешная картинка?

Чтоб ватников тролить. В следующем релизе это будут пони - инфа 100%


"Для Linux представлена система голосового и визуального упра..."
Отправлено Аноним , 29-Сен-13 20:27 
>В следующем релизе это будут пони - инфа 100%

А, так вот кто эту Алёну запилил...


"Для Linux представлена система голосового и визуального упра..."
Отправлено EuPhobos , 30-Сен-13 08:20 
> Программа написана на языке Python
> среди зависимостей - php

Однако..


"Для Linux представлена система голосового и визуального упра..."
Отправлено SpiritOfStallman , 30-Сен-13 12:26 
Прочитав заголовок так обрадовался, ибо давно мечтаю о хорошем распознавателе речи (ну и без всяких там корпораций, да).
Но новость вы и сами видели...

"Для Linux представлена система голосового и визуального упра..."
Отправлено Andrey Mitrofanov , 30-Сен-13 13:37 
>так обрадовался, ибо давно мечтаю о хорошем распознавателе речи

Марш отсюда общаться с духами Питера Брауна http://lwn.net/Articles/387167/ , тт. из гнома http://lwn.net/Articles/473007/ .