URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 89149
[ Назад ]

Исходное сообщение
"Для Linux подготовлена система распознавания речевых команд,..."

Отправлено opennews , 18-Мрт-13 00:19 
После закрытого бета-тестирования переведён (https://plus.google.com/109027253925936825710/posts/1egSKw9BBbm) в разряд свободных проект по созданию системы распознавания речевых команд на базе Google Voice API. Например, система позволяет через управление голосом запускать программы, выполнять операции с файлами, открывать сайты, находить ответы на произвольные вопросы, создавать электронные письма, диктовать текст для документов и т.д.


Изначально проект развивался независимым энтузиастом для организации речевого управления Ubuntu, но в текущем виде проект не привязан к особенностям данной системы и может быть адаптирован для любых дистрибутивов. Код проекта (https://github.com/JamezQ/ubuntu-speech-recognition)  написан на языке Python и открыт под лицензией GPLv3. Распознавание речи осуществляется через обращение к Google Voice API, который демонстрирует достаточно неплохие результаты и для русского языка.

<center><iframe width="640" height="360" src="http://www.youtube.com/embed/HfrQrjH3AGw?rel=0" frameborder="0" allowfullscreen></iframe></center>


URL: https://plus.google.com/109027253925936825710/posts/1egSKw9BBbm
Новость: http://www.opennet.me/opennews/art.shtml?num=36419


Содержание

Сообщения в этом обсуждении
"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено ip1981 , 18-Мрт-13 00:19 
> через обращение к Google Voice API

То есть, ничего и не написано. А зонд имеется.

Что толку от GPL тут!


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 00:25 
Google Voice пожалуй единственная система, которая нормально распознаёт русский язык.
На телефоне с Android очень удобно вводить текст и выполнять поиск через голосовой ввод, если чётко проговаривать слова то почти не ошибается. Например, просто говоришь "Какая погода в Сочи" и телефон отвечает. Будущее наступило.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Константавр , 18-Мрт-13 00:31 
Проблема в том, что за удобство платить приходится свободой. Бесплатное и свободное это не синонимы.
Хотя альтернативы то какие? Сфинкс? он под лицензией BSD. Много где используют, но своих наработок не открывают.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 09:54 
> Проблема в том, что за удобство платить приходится свободой.

Времена меняются. А папуасы и бусы остаются. Просто бусы переименовываются иногда.

Что самое дикое - есть минимум несколько проектов, умеющих локально распознавать голос. В лине и не только. Но, понятное дело, папуасовским скрипткиддикам проще данные с микрофона в гугл сливать.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено YetAnotherOnanym , 18-Мрт-13 11:00 
Не оскорбляйте жителей Папуа сравнением с писателями убогих поделок.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 11:18 
угу, только их учить надо и даже после обучения результат будет хуже гугловского. Нет сравнимого локального распознавания за сколько-нибудь терпимые деньги. Тем более на русском - им никто толком не занимался просто-напросто.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 12:22 
> угу, только их учить надо и даже после обучения результат будет хуже гугловского.

Ну как бы при отпадении интернета результат с гуглем будет вообще *нулевым*. Ну то-есть, гугле то выгодно примотать папуасов (простите, жители Папуа) к своим сервисам, предложив новые модные бусы. Это то не отнять.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 21:32 
Мышь, клавиатуру и что там у вас еще есть никто не отбирает.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено DiTsi , 18-Мрт-13 02:12 
Чего стоит бояться при использовании этой программы? Google узнает о чем я говорю с компом?
Вроде "Open Clementine", "Open MC", "Close Window".. Зачитывать серьёзные документы, я думаю, никто не станет с помощью этой программы.
Я не программист, но насколько понимаю, кроме моего голоса Google от меня так ничего и не получит в случае с этой программой. Поправьте, в чем не прав.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено asd , 18-Мрт-13 05:34 
Сильно не прав, при этом...

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено DiTsi , 18-Мрт-13 08:25 
> Сильно не прав, при этом...

Лучшей аргументации я и не ожидал.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 11:43 
Тебя спросили "в чем", а отвечаешь на вопрос "как". Если не можешь даже понять, о чем тебя спрашивают, незачем засорять форум.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 05:47 
> Поправьте, в чем не прав.

Поправляю. Совсем недавно народ не понимал как можно доверить перевод денег компьютерам, без бумаги, печати и подписи двух свидетелей ...
Скоро уже будете голосом оплачивать счета и вводить пароли - никуда не денетесь :)


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Loooooker , 18-Мрт-13 11:33 
В приватбанковском (Украина) приложении для Андройда уже можно

"никуда не денетесь :)"
Отправлено aes.ultimum , 18-Мрт-13 11:47 
>голосом … вводить пароли

Это небезопасно.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 12:42 
> Поправляю. Совсем недавно народ не понимал как можно доверить перевод денег компьютерам,
> без бумаги, печати и подписи двух свидетелей ...

Вообще, документальное подтверждение операций лишний раз может спасти от уймы головняка. Малейший сбой базы, кардерство или что там еще - и вы очень долго доказываете с пеной у рта что вы не верблюд. Но некоторые, конечно, понимают лишь когда факап уже случился.

Особенно касается всяких коммунальщиков и прочих, которые могут попросту проглючить и объявить что вы им резко задолжали. И одно дело если у вас есть физический пруф операций и другое - если это какие-то эфемерные записи в БД. Уровень гемора будет принципиально разный.

> Скоро уже будете голосом оплачивать счета и вводить пароли

У меня телефон умеет распознавать голос уже около 10 лет. Но я не пользуюсь данной возможностью. Потому что надежность распознавания в реальных условиях с фоновым шумом и чем там еще - средненькая, сама операция не очень быстрая, да и вообще, чувствешь себя полным идиотом бубня куда-то в пустоту. Выбрать контакт в адресбуке оказалось намного быстрее, проще и комфортнее. Поэтому при покупке телефона/смарта последнее на что я обращаю внимание - это на умение распознавать голос. Более того, распознавание голоса есть с незапамятных версий винды. Но где же массовый юзеж оного? Правильно - оно опять же оказалось невостребованным. А то что пудакам из гугля хочется в зависимость от себя - так это их проблемы.

> - никуда не денетесь :)

А вы пришлете надзирателей и овчарок? Или как вы меня заставите то? Иначе я просто покажу фак и не буду пользоваться. И хрен оспоришь.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Сергей , 18-Мрт-13 16:49 
> У меня телефон умеет распознавать голос уже около 10 лет.

Он у вас умеет только определать, тот ли звук вы произвели, что при настроке.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 09:56 
> Чего стоит бояться при использовании этой программы?

Того что интернет упадет и ты останешься без привычного управления. Того что гугл перекроет сервис или завинтит конские условия использования. Того что гугл будет шпионить и накапливать статистику. И хрен его знает кому и почем сие продаст или раздаст.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 21:34 
ну перейдешь на непривычное управление. А от ора "Следующий трек" охренеть как много статистики он насобирает. Особенно учитывая, что никакой авторизации для пользования сервисом не надо, голый post.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено ip1981 , 18-Мрт-13 10:21 
> Чего стоит бояться при использовании этой программы? Google узнает о чем я
> говорю с компом?
> Вроде "Open Clementine", "Open MC", "Close Window".. Зачитывать серьёзные документы, я
> думаю, никто не станет с помощью этой программы.
> Я не программист, но насколько понимаю, кроме моего голоса Google от меня
> так ничего и не получит в случае с этой программой. Поправьте,
> в чем не прав.

Дело не в том, чтобы бояться.

Никогда "интренет" не отрубался?


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 12:43 
> Никогда "интренет" не отрубался?

И главное если электричество еще можно запасти впрок аккумулятором или сгенерировать скажем солнечной батарейкой, то вот с интернетом так совсем не катит. Интернет и гугл в нем не забэкапишь и не сгенерируешь "по месту". И это таки проблема.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 14:40 
нет дело именно в том, изначально это реплика про "зонд" и интересно какой такой новый зонд в этом есть.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено DiTsi , 18-Мрт-13 17:40 
> нет дело именно в том, изначально это реплика про "зонд"

Спасибо за понимание. Стало легче, когда прочитал ваш и этот (http://www.opennet.me/openforum/vsluhforumID3/89149.html#55) комментарии.

Мой комментарий был вопросом всем кричащим про зонды.. Но посмотрев на ответы, я понял, что можно было и не спрашивать, ведь отвечают те же кричащие...
Я спрашивал про ТЕКУЩИЙ момент - не про будущее! Про ЭТУ программу!, с РАБОТАЮЩИМ, ..., интернетом! Какая еще реклама? О_о    Мне и так её показывают!
Вот уж правда "Мы говорим на одном языке, но в речи друг друга не разбираем ни слова"


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено kosha , 18-Мрт-13 10:46 
Чем больше собрано информации тем точечнее будет реклама. А реклама это деньги. За эти деньги живёт Гугл.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 19:10 
да, в принципе, ну и черт с ней с рекламой, хорошая таргетированая реклама - это хорошо, да вот только гугл скармливает всякий шлак на интернет-магазины однодневки, да фишинговые сайты.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 22:18 
> Вроде "Open Clementine", "Open MC", "Close Window".. Зачитывать серьёзные документы, я
> думаю, никто не станет с помощью этой программы.
> Я не программист, но насколько понимаю, кроме моего голоса Google от меня
> так ничего и не получит в случае с этой программой. Поправьте,
> в чем не прав.

Вот Вам для размышлений ссылочка: http://www.securitylab.ru/news/392935.php и, если лень по ней ходить, цитата в две строчки:
"Американские ученые разработали программу для распознавания звуков нажатия на клавиши клавиатуры. Программа записывает звуки, сопровождающие процесс печати, и воссоздает текст, который набирал пользователь."
Так что да, сливайте звуки гуглю, у них мощностей для обработки хватит ;)


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Michael Shigorin , 18-Мрт-13 22:22 
> Программа записывает звуки, сопровождающие процесс печати

На том же хосте смысла не особо много, особенно если можно открыть невидимое окошко ввода на весь $DISPLAY (кажется, так в своё время Митник над одним японским экспертом по безопасности подшутил).


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 19-Мрт-13 01:34 
>> Программа записывает звуки, сопровождающие процесс печати
> На том же хосте смысла не особо много, особенно если можно открыть
> невидимое окошко ввода на весь $DISPLAY (кажется, так в своё время
> Митник над одним японским экспертом по безопасности подшутил).

Да я не совсем об этом. Я о том, что для работы этой програмы, если я правильно понимаю суть процесса, нужно постоянно гнать аудиопоток с микрофона гуглю для анализа и выделения ключевых слов. При этом микрофон ловит кучу т.н. "фоновых шумов", анализ которых может очень много рассказать и о месте пребывания, и о предпочтениях (самых разных, например, в музыке) пользователя этой программы. Как в том фильме с Харатьяном
http://www.youtube.com/watch?v=3CHQA-1cuSA#t=4203s
Правда там были "новые знатоки", в роли которых у гугля будет вычислительное облако с сответствующими алгоритмами и базами данных, которые они уже успели насобирать.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 00:23 
> в разряд свободных

...
> Google Voice API.

Взаимоисключающие параграфы + подмена понятий. Вендорлокин во весь рост. А потом гугль скажет - мол, недостаточно народа пользуется. Давайте его прибьем. Корочен на мыло этих питонистов. Вместе с их долбаным гуглем.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 00:28 
Тьфу. Ну вот когда/если закроет - тогда и надо будет решать, что делать. А чего сейчас не пользоваться-то?

P.S. Правда, так и не смог придумать на кой мне голосовое управление компьютером.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено anonymous , 18-Мрт-13 03:09 
> А чего сейчас не пользоваться-то?

Во избежание баттхёрта в будущем. Ты к врачу идёшь только когда температура уже под 42 и костлявая на пороге весело косой помахивает?


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 03:21 
Ну ты сравнил. Одно - критичное для жизни, а другое - фитюлька, на которую можно забить и забыть.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено asd , 18-Мрт-13 05:35 
> Ну ты сравнил. Одно - критичное для жизни, а другое - фитюлька,
> на которую можно забить и забыть.

А другое - критичное движение для моей свободы.



"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 11:10 
О да, то, что добавилась альтернатива (которая в будущем теоретически может исчезнуть) - это, конечно, очень печально для вашей свободы.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено iFRAME , 18-Мрт-13 12:41 
свободы? Если ты (не)будешь пользоваться Google Voice, тебя в тюрьму за это посадят, или что?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 12:44 
> посадят, или что?

Нет, просто появляется зависимость от вендора и тот может выкручивать руки. Ну а что, к его сервису же все гвоздями прибито - куда ж вы денетесь? Вот такие сервисы - идут нафиг по возможности.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено iFRAME , 18-Мрт-13 20:50 
>> посадят, или что?
> Нет, просто появляется зависимость от вендора и тот может выкручивать руки. Ну
> а что, к его сервису же все гвоздями прибито - куда
> ж вы денетесь? Вот такие сервисы - идут нафиг по возможности.

Вендор? Руки? Вы, очевидно, путаете гопников из соседней подворотни с крупными производителями софта и железа. С последними есть очень эффективный метод борьбы:  выкинуть в окно компьютер, планшет, телефон, etc, вспомнить, что есть RL и пойти заниматься своими делами.

Проще говоря, компьютер ни в коем случае не вещь жизненно необходимая. И ограничения, накладываемые кем то в виртуальном мире, никак не ограничивают вашу личную свободу. А вот если Вас наручниками к батарее приковали, то это уже повод побеспокоиться, да.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 09:48 
> Ну ты сравнил. Одно - критичное для жизни, а другое - фитюлька,

Как бы, компьютыре нынче используются много где. И насколько та или иная фитюлька будет критична или не критична - заранее хрен угадаешь.

Кроме того,
1) Неудобно остаться без управления если интернет отпал.
2) Идея посылать запись с микрофона в гугл выглядит очень сомнительной с точки зрения зондов.
3) Зависимость от работоспособности каких-то серверов в каком-то тутуево для того чтобы работало базовое управление компьютером - отдает маразмом.

В общем такой подход называется халтурой. Сделать "управлялку голосом", технично забив на самую сложную часть (собственно, распознавание) путем подставы пользователей. Про такое говорят: КГ/АМ.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 11:08 
Ну так то, что там гугл используется - никто не скрывает, дело пользователя - решать, устраивает его или нет. А сама возмжность - это хорошо.

Кроме того:

1) ну да, неудобно. Но, во-первых, отпавший интернет - это дикость, и без него много чего становится неудобно, во-вторых, клавиатуру с мышью при включении этой штуки никто не отбирает.

2) А что тут сомнительного? Там даже логинов никаких не надо, насколько я помню. Молоти POST-запрос, да и всё. Впрочем, это год или два назад так было, могло и поменяться. Но никакой "живой" записи там нет точно. Да и в целом - крайне маловероятно, чо они с этим голосом смогут ещё что-то сделать.

3) Если это базовое управление (у инвалида какого) - да, надо этот вопрос учитывать. Но там вообще много чего учитывать надо. А если это способ прикрикнуть на комп, когда возишься на кухне и руки в фарше - то никаких проблем.

В общем, решение как решение. Недостатки никто не скрывает, но право на жизнь оно имеет. Преимущейства тоже есть: отличный движок распознавания, работает даже на слабых машинах, не нужно обучать голосу пользователя.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 12:59 
> Ну так то, что там гугл используется - никто не скрывает, дело пользователя - решать,
> устраивает его или нет. А сама возмжность - это хорошо.

Возможность папуаса продаться в рабство - это не "хорошо". Это "глупый низкоразвитый папуас". Ну а рабовладельцу, понятен фиг, профит. Внимание, вопрос: с хрена ли я должен испытывать симпатии к посреднику работорговца?

> Кроме того:
> 1) ну да, неудобно. Но, во-первых, отпавший интернет - это дикость,

Ну как бы случаи бывают разные. А чего такого дикого уехать подальше от цивилизации на краешек земли, где нет никаких вышек сотовой связи и отдохнуть от городской суеты? А вот если повседневный девайс превратится при этом в тыкву - будет неприятно. Вот ведроид в целом по этому поводу жестоко отсасывает.

Кроме того, бывают всякие внештатные ситуации. Типа технических сбоев и прочая. Вон в москве слетало питание на половину города. Разумеется сети у опсосов в два счета упали. Вот будет мило если при этом еще и девайс превратится в тыкву. Если запас энергии можно взять в аккумуляторах, то вот с интернетом и особенно сервисами гугля так вообще не катит.

> и без него много чего становится неудобно, во-вторых, клавиатуру с мышью при
> включении этой штуки никто не отбирает.

Это не отменяет того факта что у гугля появится лишняя мерзенькая властишка и возможность диктовать папуасам свои требования. Иначе бусы не дадут.

> 2) А что тут сомнительного? Там даже логинов никаких не надо, насколько
> я помню. Молоти POST-запрос, да и всё.

Сомнительно тут то, что далее делает гугель с этими данными. Таки властишка над папуасами которые прыгают на задних лапках чтобы бусы получить у них появляется. Что дальше с папуасами делать - на их усмотрение уже. Можно в трюм погрузить и выгодно перепродать вон тем рекламерам.

> Впрочем, это год или два назад так было, могло и поменяться. Но никакой "живой" записи
> там нет точно. Да и в целом - крайне маловероятно, чо
> они с этим голосом смогут ещё что-то сделать.

Я бы сказал что крайне вероятно что они накапливают статистику и ведут бизнес-аналитику. А может и не только бизнес.

> 3) Если это базовое управление (у инвалида какого) - да, надо этот
> вопрос учитывать. Но там вообще много чего учитывать надо. А если
> это способ прикрикнуть на комп, когда возишься на кухне и руки
> в фарше - то никаких проблем.

Ага, вот привык ты к тому что комп на вопли реагирует. Руки в фарше, надо срочно нечто сделать. А тут - чпокс! Облом. Подобные штуки все-таки должны быть failsafe, имхо.

> на слабых машинах,

У меня распознавание голоса работает на мобиле десятилетней давности. Там проц в разы слабее любого самого занюханного raspberry pi, не говоря уж о больших системниках. Почему-то мощности ему хватило.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено kurokaze , 18-Мрт-13 20:03 
>Руки в фарше, надо срочно нечто сделать. А тут - чпокс! Облом. Подобные штуки все-таки должны быть failsafe, имхо.

А вдруг твой домашний серверный шкаф полетит? А вдруг ЭМИ тебе сосед под дверью (за стенкой) организует? А вдруг тебе в окна ворвется спецназ и повыдирает штепсели из розеток?
И тут - чпокс! Облом.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 21:38 
Отличаем "продаваться в рабство" от "использовать возможность, когда она есть". Или жизнь без аддикции не можете себе представить? Власти гугловской тут - ноль. По крайней мере над теми, у кого мозги на месте. А у кого их нет - тем ничгео не поможет.

Ну и если вы умудритесь придумать, что гугл сможет набрать за статистику из дестяка команд - это будет поистине гениально. А если отрубится сервис когда у меня руки в фарше - значит в этот момент я потеряю это удобство и пойду либо руки мыть либо потерплю не нравящуюся песню какое-то время. Не критично, знаете ли.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено YetAnotherOnanym , 18-Мрт-13 10:17 
Внезапно - есть люди с "ограниченными возможностями". Когда я был студнем, у нас на кафедре была аспирантка с ДЦП. С умственными способностями всё нормально, а вот текст набирать для неё было мученьем. А теперь представим, что она обучила распознавалку (с дикцией у неё тоже было не очень, всё потому же), приноровилась диктовать формулы в TeX'е, и вдруг бах - Гугл закрывает лавочку. Обидно, да?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 11:00 
Конечно обидно. Лучше всё время до гипотетического закрытия лавочки сидеть воообще без приличной распознавалки (коммерческие она по цене не потянет наверняка). И, кстати, насколько мне известно гугловская распознавалка не требует обучения.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено ovg , 18-Мрт-13 09:33 
>> А чего сейчас не пользоваться-то?
> Ты к врачу идёшь только когда температура уже под 42 и костлявая на пороге весело косой помахивает?

Не поверите, но так оно и есть. Только с температурой 40 я уже никуда не иду а вызываю врача. Авось поможет. А по пустякам чего докторов то беспокоить?



"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 14:26 
:) А тут чего опасаешься? Что доктор сам без вызова придет?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Paver , 18-Мрт-13 08:01 
> не смог придумать на кой мне голосовое управление компьютером.

А "диктовать текст для документов"?


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 09:44 
> А "диктовать текст для документов"?

Печатать не в пример быстрее и эффективнее.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 11:12 
Вы, наверное, не пробовали :-) Впрочем, одно применение я надумал - прикрикнуть на комп, когда готовишь и руки замазаны в чём-то. Песню там на следующую переключить или рецепт глянуть.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено бедный буратино , 18-Мрт-13 12:23 
> Вы, наверное, не пробовали :-) Впрочем, одно применение я надумал - прикрикнуть на комп, когда готовишь и руки замазаны в чём-то. Песню там на следующую переключить или рецепт глянуть.

Круто. Только я делал это в windows году в 1997, с помощью пакета, раздававшегося с сайта MS (немного побаловавшись, мне это надоело, и за последние 15 лет я это ни разу не использовал). А в OS/2 это было из коробки.

Вот хорошая тексточиталка - это, на мой взгляд интереснее. В этом отношении трёхмегабайтный rhvoice впечатляет.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено ovg , 18-Мрт-13 09:29 
Вам тяжело понять, потому что вы недостаточно ленивы. Много руками работаете. А это подходит больше для работников языкового фронта. :-)

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 09:43 
> Тьфу. Ну вот когда/если закроет - тогда и надо будет решать,

Несомненно, некоторые предпочитают лечить шишку на лбу от грабель вместо того чтобы грабли заранее обойти. А так для голосового управления есть немало софта который не гоняет данные ни в какие гугли. Просто на бидончике такой софт писать больно уж несподручно - цифровая обработка сигналов таки требует скорострельности и сложных алгоритмов. Поэтому бидонистам проще вот так вот.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 11:13 
Ни халявного, ни дешевого сравнимого качества - нет, увы. А для русского языка - не уверен, что вообще есть.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 13:00 
> Ни халявного, ни дешевого сравнимого качества - нет, увы.

Ага, я же говорю - папуасы и бусы. Ну вот дайте мне этот красивый ништяк! Денег нет, натурой отработаю!


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено kurokaze , 18-Мрт-13 20:08 
> Ага, я же говорю - папуасы и бусы. Ну вот дайте мне
> этот красивый ништяк! Денег нет, натурой отработаю!

Не, не подойдет твоя натура, плати денежку или сиди молча.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено VoDA , 18-Мрт-13 12:28 
> А так для голосового управления есть немало софта который не гоняет данные ни в какие гугли.

Пруф будте добры, только чтобы также бесплатно для пользователя. Пока с распознаванием русской речи или плохо или никак. Гугловский распознаватель самое адекватное, что я нашел.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено хрюкотающий зелюк , 18-Мрт-13 00:31 
оно использует сервера гугла или делает это софтово прямо на клиентском устройстве?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено ВовкаОсиист , 18-Мрт-13 03:09 
На серверах гугла.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Vernat , 18-Мрт-13 00:55 
в Казани под аналог этого получили грант на 9 млн http://lionet.livejournal.com/124739.html

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено CSRedRat , 18-Мрт-13 01:27 
Спросил у автора про поддержку русского - говорит что пока нет, поддержка различных языков пока только в планах.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено VoDA , 18-Мрт-13 09:19 
Поскольку распознование делает гугл, а у него русский реализован хорошо, то и сабж практически на 100% поддерживает русский. Нужно только еще один параметр в API отправлять - язык для распознавания.

Вуаля ;)


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено хрюкотающий зелюк , 18-Мрт-13 02:12 
я на Android очень высоко оцениваю работу распознавания речи, единственный плюс наверное

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 08:11 
Телефон гуглу отдал, где живу показал, что мне нравится сказал, но свой голос не дам...

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 09:51 
> голос не дам...

Эй, а кто в рабство продаваться будет в обмен на очередные "бусы"? Совсем офигеои?!


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 10:24 
Нах не нужно, т.к. для работы требует интернет.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 14:00 
Тю! Ачо сейчас можно без инета? Ось общего назначения поставить на локалхост? :)))))))))))))))))))))))))))))

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Онанимлигивон , 18-Мрт-13 10:44 
Парад параноиков.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 11:15 
Вообще непонятная истерика, как будто возможность кто-то отбирает, а не добавляет.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Константавр , 18-Мрт-13 12:53 
Какаая истерика? Представьте тоже приложение, что разработал этот чел, но под сфинкс. Все были бы довольны, потому что компьютер остаётся самодостаточным. Но он пошёл более лёгким путём. Но насколько это оправдано? Экосистема опенсорса начинает всё больше зависеть от закрытых проектов, поддерживаемых акулами бизнеса. А свои наработки при этом отсыхают. Сколько таких примеров...
И представьте, я прикручу гугловский поисковик для семантического поиска в моих файлах. это как? нормально? безопасно?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено kurokaze , 18-Мрт-13 20:10 
> Какаая истерика? Представьте тоже приложение, что разработал этот чел, но под сфинкс.

Так вперёд, разрабатывай, солнце еще высоко, я разрешаю


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 21:43 
Не все были бы довольны. Распознавание у сфинкса... как бы это сказать... не фонтан. При малейшем фоне всё становится печально.

А по поводу поисковика - смотря какая задача. Если у вас оно будет искать там, где приватных данных нет или прайваси некритична - то что тут плохого? Допустим, индексируете вы собрание сочинений Толстого - чего бы и нет?


В общем, отучайтесь от фанатизма и учитесь оценивать конкретную ситуацию и приемлемые в ней решения.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Константавр , 18-Мрт-13 22:59 
Да зачем вообще что-то разрабатывать? Всё! Счастье наступило! Гугл разрешает всем пользоваться!
Никогда не будет сфинкс лучше, пока есть такие проекты и все сломя голову бегут туда и наступает краткая эйфория. Конечно у Гугла лучше распознавание! А знаете почему? Потому что он использует голоса всех кто им пользуется для совершенствования распознавания. А разработчики сфинкса днём с огнём не могут найти людей готовых зачитать текст на микрофон, чтобы те же люди могли его потом использовать.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 13:02 
> Вообще непонятная истерика, как будто возможность кто-то отбирает, а не добавляет.

Добавляет. Вещь под названием vendor lockin в области где его необходимость откровенно высосана из пальца. Ибо мой телефон десятилетней давности вполне себе уже распознавал голос локально. Без всякого интернета и гуглей с их навязшими на зубах попытках вымурыжить из себя еще 10 причин по которым они все нужны. Вон юзеры гуглоридера уже кажется ощутят последствия на своей попе ща. Ну так никто и не обещал что рабовладелец - обязательно добрым и хорошим будет.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Evtomax , 18-Мрт-13 11:33 
Вот так поставишь это, настроишь, привыкнешь. А потом гугль возьмёт и внезапно отключит свои сервисы. Писать программы на основе онлайн-сервисов с нестандартизированным апи - это хуже, чем писать программы на основе закрытых либ.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 14:01 
> Вот так поставишь это, настроишь, привыкнешь. А потом гугль возьмёт и внезапно
> отключит свои сервисы. Писать программы на основе онлайн-сервисов с нестандартизированным
> апи - это хуже, чем писать программы на основе закрытых либ.

Google != Красный Крест, Inc.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Michael Shigorin , 18-Мрт-13 16:15 
Ваши глубокомысленные утверждения про Google, Inc удаляются как спам, а не потому, что они неверны.  Но здесь позвольте оставить :)

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Evtomax , 18-Мрт-13 17:40 
Ну если не хотят заботиться о своей репутации - их право, а я поищу альтернативу :)

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 11:34 
Чувачилы, а что, никто не увидел одной вещи? Как Сири-то всех занозила и кинулись воспроизводить "А у нас тож есть!" у поганого Яббла фенечку-свистоперделочку?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено CSRedRat , 18-Мрт-13 12:09 
Распознавание голоса и голосовой помощник - разные вещи. Голос - это способ ввода, а помощник - это приложение-банк знаний.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 14:02 
> Распознавание голоса и голосовой помощник - разные вещи. Голос - это способ
> ввода, а помощник - это приложение-банк знаний.

Тащемта, передергивание. Это части одного целого. И одна техно.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 19:15 
>> Распознавание голоса и голосовой помощник - разные вещи. Голос - это способ
>> ввода, а помощник - это приложение-банк знаний.
> Тащемта, передергивание. Это части одного целого. И одна техно.

и, по-вашему, распознавание речи придумали эппл? да вы, яблофаги, похлеще религиозных фанатиков пургу несете.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено VoDA , 18-Мрт-13 12:31 
Кто знает - может есть программа, которая речь (голосовую часть веб-бинара) может перегнать в текст через Гугл АПИ?

Оченно полезно было бы ))


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено pavlinux , 18-Мрт-13 14:49 
А жесты в картинки?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Анонист , 18-Мрт-13 13:45 
я лучше в дуум поиграю

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 14:02 
> я лучше в дуум поиграю

Лучше поДУУУУУУУМАЙ. :))))))


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено sKotenok , 18-Мрт-13 15:10 
Код проекта (https://github.com/JamezQ/ubuntu-speech-recognition)
>  написан на языке Python и открыт под лицензией GPLv3. Распознавание
> речи осуществляется через обращение к Google Voice API, который демонстрирует достаточно
> неплохие результаты и для русского языка.

Ковырял кто-нибудь уже исходники? Хотел посмотреть, как это все устроено, но там всего 2 исполняемых файла нашёл - один на питоне, другой на сях. Я думаю, все интересное находится в ../Recognition/dictionary.c, но со звуком никогда не работал и логику совершенно не понял..


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Serg , 18-Мрт-13 18:56 
Кстати, по поводу прикрикнуть на комп из кухни - а не боитесь, что на ваш комп, например, телевизор из спальни прикрикнет? И, главное, непонятно, ЧТО он ему крикнет... Напоминает наши давние приколы над сотрудниками одной мини-типографии - из-за спины крикнуть "shutdown... yes" на их чудо-компы с включенным голосовым управлением.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 21:31 
Не "из кухни", а на кухонный комп. Нет, не боюсь - за отсутствием телевизора и привычки включать звук на большую громкость. А вот на кухне аудиокнигу или лекцию запустить - в самый раз.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 19:04 
> через обращение к Google Voice API

Что оно отвалилось как Google reader как только корпорашка захочет больше денег? Лесом.


"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено kurokaze , 18-Мрт-13 20:23 
Жопоголизм в комментариях развеселил

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Аноним , 18-Мрт-13 20:36 
Какая скорость интернета достаточна для их сервиса?
2 Мегабита (256 Килобайт) в секунду хватит?

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено Crazy Alex , 18-Мрт-13 21:31 
На мобилах оно на едже работает более-менее.

"Для Linux подготовлена система распознавания речевых команд,..."
Отправлено paulus , 18-Мрт-13 23:58 
Да закроют ваш Google Voice API завтра, как и другие проекты, и что будете делать? Петь деферамбы гуглу?