После закрытого бета-тестирования переведён (https://plus.google.com/109027253925936825710/posts/1egSKw9BBbm) в разряд свободных проект по созданию системы распознавания речевых команд на базе Google Voice API. Например, система позволяет через управление голосом запускать программы, выполнять операции с файлами, открывать сайты, находить ответы на произвольные вопросы, создавать электронные письма, диктовать текст для документов и т.д.
Изначально проект развивался независимым энтузиастом для организации речевого управления Ubuntu, но в текущем виде проект не привязан к особенностям данной системы и может быть адаптирован для любых дистрибутивов. Код проекта (https://github.com/JamezQ/ubuntu-speech-recognition) написан на языке Python и открыт под лицензией GPLv3. Распознавание речи осуществляется через обращение к Google Voice API, который демонстрирует достаточно неплохие результаты и для русского языка.<center><iframe width="640" height="360" src="http://www.youtube.com/embed/HfrQrjH3AGw?rel=0" frameborder="0" allowfullscreen></iframe></center>
URL: https://plus.google.com/109027253925936825710/posts/1egSKw9BBbm
Новость: http://www.opennet.me/opennews/art.shtml?num=36419
> через обращение к Google Voice APIТо есть, ничего и не написано. А зонд имеется.
Что толку от GPL тут!
Google Voice пожалуй единственная система, которая нормально распознаёт русский язык.
На телефоне с Android очень удобно вводить текст и выполнять поиск через голосовой ввод, если чётко проговаривать слова то почти не ошибается. Например, просто говоришь "Какая погода в Сочи" и телефон отвечает. Будущее наступило.
Проблема в том, что за удобство платить приходится свободой. Бесплатное и свободное это не синонимы.
Хотя альтернативы то какие? Сфинкс? он под лицензией BSD. Много где используют, но своих наработок не открывают.
> Проблема в том, что за удобство платить приходится свободой.Времена меняются. А папуасы и бусы остаются. Просто бусы переименовываются иногда.
Что самое дикое - есть минимум несколько проектов, умеющих локально распознавать голос. В лине и не только. Но, понятное дело, папуасовским скрипткиддикам проще данные с микрофона в гугл сливать.
Не оскорбляйте жителей Папуа сравнением с писателями убогих поделок.
угу, только их учить надо и даже после обучения результат будет хуже гугловского. Нет сравнимого локального распознавания за сколько-нибудь терпимые деньги. Тем более на русском - им никто толком не занимался просто-напросто.
> угу, только их учить надо и даже после обучения результат будет хуже гугловского.Ну как бы при отпадении интернета результат с гуглем будет вообще *нулевым*. Ну то-есть, гугле то выгодно примотать папуасов (простите, жители Папуа) к своим сервисам, предложив новые модные бусы. Это то не отнять.
Мышь, клавиатуру и что там у вас еще есть никто не отбирает.
Чего стоит бояться при использовании этой программы? Google узнает о чем я говорю с компом?
Вроде "Open Clementine", "Open MC", "Close Window".. Зачитывать серьёзные документы, я думаю, никто не станет с помощью этой программы.
Я не программист, но насколько понимаю, кроме моего голоса Google от меня так ничего и не получит в случае с этой программой. Поправьте, в чем не прав.
Сильно не прав, при этом...
> Сильно не прав, при этом...Лучшей аргументации я и не ожидал.
Тебя спросили "в чем", а отвечаешь на вопрос "как". Если не можешь даже понять, о чем тебя спрашивают, незачем засорять форум.
> Поправьте, в чем не прав.Поправляю. Совсем недавно народ не понимал как можно доверить перевод денег компьютерам, без бумаги, печати и подписи двух свидетелей ...
Скоро уже будете голосом оплачивать счета и вводить пароли - никуда не денетесь :)
В приватбанковском (Украина) приложении для Андройда уже можно
>голосом … вводить паролиЭто небезопасно.
> Поправляю. Совсем недавно народ не понимал как можно доверить перевод денег компьютерам,
> без бумаги, печати и подписи двух свидетелей ...Вообще, документальное подтверждение операций лишний раз может спасти от уймы головняка. Малейший сбой базы, кардерство или что там еще - и вы очень долго доказываете с пеной у рта что вы не верблюд. Но некоторые, конечно, понимают лишь когда факап уже случился.
Особенно касается всяких коммунальщиков и прочих, которые могут попросту проглючить и объявить что вы им резко задолжали. И одно дело если у вас есть физический пруф операций и другое - если это какие-то эфемерные записи в БД. Уровень гемора будет принципиально разный.
> Скоро уже будете голосом оплачивать счета и вводить пароли
У меня телефон умеет распознавать голос уже около 10 лет. Но я не пользуюсь данной возможностью. Потому что надежность распознавания в реальных условиях с фоновым шумом и чем там еще - средненькая, сама операция не очень быстрая, да и вообще, чувствешь себя полным идиотом бубня куда-то в пустоту. Выбрать контакт в адресбуке оказалось намного быстрее, проще и комфортнее. Поэтому при покупке телефона/смарта последнее на что я обращаю внимание - это на умение распознавать голос. Более того, распознавание голоса есть с незапамятных версий винды. Но где же массовый юзеж оного? Правильно - оно опять же оказалось невостребованным. А то что пудакам из гугля хочется в зависимость от себя - так это их проблемы.
> - никуда не денетесь :)
А вы пришлете надзирателей и овчарок? Или как вы меня заставите то? Иначе я просто покажу фак и не буду пользоваться. И хрен оспоришь.
> У меня телефон умеет распознавать голос уже около 10 лет.Он у вас умеет только определать, тот ли звук вы произвели, что при настроке.
> Чего стоит бояться при использовании этой программы?Того что интернет упадет и ты останешься без привычного управления. Того что гугл перекроет сервис или завинтит конские условия использования. Того что гугл будет шпионить и накапливать статистику. И хрен его знает кому и почем сие продаст или раздаст.
ну перейдешь на непривычное управление. А от ора "Следующий трек" охренеть как много статистики он насобирает. Особенно учитывая, что никакой авторизации для пользования сервисом не надо, голый post.
> Чего стоит бояться при использовании этой программы? Google узнает о чем я
> говорю с компом?
> Вроде "Open Clementine", "Open MC", "Close Window".. Зачитывать серьёзные документы, я
> думаю, никто не станет с помощью этой программы.
> Я не программист, но насколько понимаю, кроме моего голоса Google от меня
> так ничего и не получит в случае с этой программой. Поправьте,
> в чем не прав.Дело не в том, чтобы бояться.
Никогда "интренет" не отрубался?
> Никогда "интренет" не отрубался?И главное если электричество еще можно запасти впрок аккумулятором или сгенерировать скажем солнечной батарейкой, то вот с интернетом так совсем не катит. Интернет и гугл в нем не забэкапишь и не сгенерируешь "по месту". И это таки проблема.
нет дело именно в том, изначально это реплика про "зонд" и интересно какой такой новый зонд в этом есть.
> нет дело именно в том, изначально это реплика про "зонд"Спасибо за понимание. Стало легче, когда прочитал ваш и этот (http://www.opennet.me/openforum/vsluhforumID3/89149.html#55) комментарии.
Мой комментарий был вопросом всем кричащим про зонды.. Но посмотрев на ответы, я понял, что можно было и не спрашивать, ведь отвечают те же кричащие...
Я спрашивал про ТЕКУЩИЙ момент - не про будущее! Про ЭТУ программу!, с РАБОТАЮЩИМ, ..., интернетом! Какая еще реклама? О_о Мне и так её показывают!
Вот уж правда "Мы говорим на одном языке, но в речи друг друга не разбираем ни слова"
Чем больше собрано информации тем точечнее будет реклама. А реклама это деньги. За эти деньги живёт Гугл.
да, в принципе, ну и черт с ней с рекламой, хорошая таргетированая реклама - это хорошо, да вот только гугл скармливает всякий шлак на интернет-магазины однодневки, да фишинговые сайты.
> Вроде "Open Clementine", "Open MC", "Close Window".. Зачитывать серьёзные документы, я
> думаю, никто не станет с помощью этой программы.
> Я не программист, но насколько понимаю, кроме моего голоса Google от меня
> так ничего и не получит в случае с этой программой. Поправьте,
> в чем не прав.Вот Вам для размышлений ссылочка: http://www.securitylab.ru/news/392935.php и, если лень по ней ходить, цитата в две строчки:
"Американские ученые разработали программу для распознавания звуков нажатия на клавиши клавиатуры. Программа записывает звуки, сопровождающие процесс печати, и воссоздает текст, который набирал пользователь."
Так что да, сливайте звуки гуглю, у них мощностей для обработки хватит ;)
> Программа записывает звуки, сопровождающие процесс печатиНа том же хосте смысла не особо много, особенно если можно открыть невидимое окошко ввода на весь $DISPLAY (кажется, так в своё время Митник над одним японским экспертом по безопасности подшутил).
>> Программа записывает звуки, сопровождающие процесс печати
> На том же хосте смысла не особо много, особенно если можно открыть
> невидимое окошко ввода на весь $DISPLAY (кажется, так в своё время
> Митник над одним японским экспертом по безопасности подшутил).Да я не совсем об этом. Я о том, что для работы этой програмы, если я правильно понимаю суть процесса, нужно постоянно гнать аудиопоток с микрофона гуглю для анализа и выделения ключевых слов. При этом микрофон ловит кучу т.н. "фоновых шумов", анализ которых может очень много рассказать и о месте пребывания, и о предпочтениях (самых разных, например, в музыке) пользователя этой программы. Как в том фильме с Харатьяном
http://www.youtube.com/watch?v=3CHQA-1cuSA#t=4203s
Правда там были "новые знатоки", в роли которых у гугля будет вычислительное облако с сответствующими алгоритмами и базами данных, которые они уже успели насобирать.
> в разряд свободных...
> Google Voice API.Взаимоисключающие параграфы + подмена понятий. Вендорлокин во весь рост. А потом гугль скажет - мол, недостаточно народа пользуется. Давайте его прибьем. Корочен на мыло этих питонистов. Вместе с их долбаным гуглем.
Тьфу. Ну вот когда/если закроет - тогда и надо будет решать, что делать. А чего сейчас не пользоваться-то?P.S. Правда, так и не смог придумать на кой мне голосовое управление компьютером.
> А чего сейчас не пользоваться-то?Во избежание баттхёрта в будущем. Ты к врачу идёшь только когда температура уже под 42 и костлявая на пороге весело косой помахивает?
Ну ты сравнил. Одно - критичное для жизни, а другое - фитюлька, на которую можно забить и забыть.
> Ну ты сравнил. Одно - критичное для жизни, а другое - фитюлька,
> на которую можно забить и забыть.А другое - критичное движение для моей свободы.
О да, то, что добавилась альтернатива (которая в будущем теоретически может исчезнуть) - это, конечно, очень печально для вашей свободы.
свободы? Если ты (не)будешь пользоваться Google Voice, тебя в тюрьму за это посадят, или что?
> посадят, или что?Нет, просто появляется зависимость от вендора и тот может выкручивать руки. Ну а что, к его сервису же все гвоздями прибито - куда ж вы денетесь? Вот такие сервисы - идут нафиг по возможности.
>> посадят, или что?
> Нет, просто появляется зависимость от вендора и тот может выкручивать руки. Ну
> а что, к его сервису же все гвоздями прибито - куда
> ж вы денетесь? Вот такие сервисы - идут нафиг по возможности.Вендор? Руки? Вы, очевидно, путаете гопников из соседней подворотни с крупными производителями софта и железа. С последними есть очень эффективный метод борьбы: выкинуть в окно компьютер, планшет, телефон, etc, вспомнить, что есть RL и пойти заниматься своими делами.
Проще говоря, компьютер ни в коем случае не вещь жизненно необходимая. И ограничения, накладываемые кем то в виртуальном мире, никак не ограничивают вашу личную свободу. А вот если Вас наручниками к батарее приковали, то это уже повод побеспокоиться, да.
> Ну ты сравнил. Одно - критичное для жизни, а другое - фитюлька,Как бы, компьютыре нынче используются много где. И насколько та или иная фитюлька будет критична или не критична - заранее хрен угадаешь.
Кроме того,
1) Неудобно остаться без управления если интернет отпал.
2) Идея посылать запись с микрофона в гугл выглядит очень сомнительной с точки зрения зондов.
3) Зависимость от работоспособности каких-то серверов в каком-то тутуево для того чтобы работало базовое управление компьютером - отдает маразмом.В общем такой подход называется халтурой. Сделать "управлялку голосом", технично забив на самую сложную часть (собственно, распознавание) путем подставы пользователей. Про такое говорят: КГ/АМ.
Ну так то, что там гугл используется - никто не скрывает, дело пользователя - решать, устраивает его или нет. А сама возмжность - это хорошо.Кроме того:
1) ну да, неудобно. Но, во-первых, отпавший интернет - это дикость, и без него много чего становится неудобно, во-вторых, клавиатуру с мышью при включении этой штуки никто не отбирает.
2) А что тут сомнительного? Там даже логинов никаких не надо, насколько я помню. Молоти POST-запрос, да и всё. Впрочем, это год или два назад так было, могло и поменяться. Но никакой "живой" записи там нет точно. Да и в целом - крайне маловероятно, чо они с этим голосом смогут ещё что-то сделать.
3) Если это базовое управление (у инвалида какого) - да, надо этот вопрос учитывать. Но там вообще много чего учитывать надо. А если это способ прикрикнуть на комп, когда возишься на кухне и руки в фарше - то никаких проблем.
В общем, решение как решение. Недостатки никто не скрывает, но право на жизнь оно имеет. Преимущейства тоже есть: отличный движок распознавания, работает даже на слабых машинах, не нужно обучать голосу пользователя.
> Ну так то, что там гугл используется - никто не скрывает, дело пользователя - решать,
> устраивает его или нет. А сама возмжность - это хорошо.Возможность папуаса продаться в рабство - это не "хорошо". Это "глупый низкоразвитый папуас". Ну а рабовладельцу, понятен фиг, профит. Внимание, вопрос: с хрена ли я должен испытывать симпатии к посреднику работорговца?
> Кроме того:
> 1) ну да, неудобно. Но, во-первых, отпавший интернет - это дикость,Ну как бы случаи бывают разные. А чего такого дикого уехать подальше от цивилизации на краешек земли, где нет никаких вышек сотовой связи и отдохнуть от городской суеты? А вот если повседневный девайс превратится при этом в тыкву - будет неприятно. Вот ведроид в целом по этому поводу жестоко отсасывает.
Кроме того, бывают всякие внештатные ситуации. Типа технических сбоев и прочая. Вон в москве слетало питание на половину города. Разумеется сети у опсосов в два счета упали. Вот будет мило если при этом еще и девайс превратится в тыкву. Если запас энергии можно взять в аккумуляторах, то вот с интернетом и особенно сервисами гугля так вообще не катит.
> и без него много чего становится неудобно, во-вторых, клавиатуру с мышью при
> включении этой штуки никто не отбирает.Это не отменяет того факта что у гугля появится лишняя мерзенькая властишка и возможность диктовать папуасам свои требования. Иначе бусы не дадут.
> 2) А что тут сомнительного? Там даже логинов никаких не надо, насколько
> я помню. Молоти POST-запрос, да и всё.Сомнительно тут то, что далее делает гугель с этими данными. Таки властишка над папуасами которые прыгают на задних лапках чтобы бусы получить у них появляется. Что дальше с папуасами делать - на их усмотрение уже. Можно в трюм погрузить и выгодно перепродать вон тем рекламерам.
> Впрочем, это год или два назад так было, могло и поменяться. Но никакой "живой" записи
> там нет точно. Да и в целом - крайне маловероятно, чо
> они с этим голосом смогут ещё что-то сделать.Я бы сказал что крайне вероятно что они накапливают статистику и ведут бизнес-аналитику. А может и не только бизнес.
> 3) Если это базовое управление (у инвалида какого) - да, надо этот
> вопрос учитывать. Но там вообще много чего учитывать надо. А если
> это способ прикрикнуть на комп, когда возишься на кухне и руки
> в фарше - то никаких проблем.Ага, вот привык ты к тому что комп на вопли реагирует. Руки в фарше, надо срочно нечто сделать. А тут - чпокс! Облом. Подобные штуки все-таки должны быть failsafe, имхо.
> на слабых машинах,
У меня распознавание голоса работает на мобиле десятилетней давности. Там проц в разы слабее любого самого занюханного raspberry pi, не говоря уж о больших системниках. Почему-то мощности ему хватило.
>Руки в фарше, надо срочно нечто сделать. А тут - чпокс! Облом. Подобные штуки все-таки должны быть failsafe, имхо.А вдруг твой домашний серверный шкаф полетит? А вдруг ЭМИ тебе сосед под дверью (за стенкой) организует? А вдруг тебе в окна ворвется спецназ и повыдирает штепсели из розеток?
И тут - чпокс! Облом.
Отличаем "продаваться в рабство" от "использовать возможность, когда она есть". Или жизнь без аддикции не можете себе представить? Власти гугловской тут - ноль. По крайней мере над теми, у кого мозги на месте. А у кого их нет - тем ничгео не поможет.Ну и если вы умудритесь придумать, что гугл сможет набрать за статистику из дестяка команд - это будет поистине гениально. А если отрубится сервис когда у меня руки в фарше - значит в этот момент я потеряю это удобство и пойду либо руки мыть либо потерплю не нравящуюся песню какое-то время. Не критично, знаете ли.
Внезапно - есть люди с "ограниченными возможностями". Когда я был студнем, у нас на кафедре была аспирантка с ДЦП. С умственными способностями всё нормально, а вот текст набирать для неё было мученьем. А теперь представим, что она обучила распознавалку (с дикцией у неё тоже было не очень, всё потому же), приноровилась диктовать формулы в TeX'е, и вдруг бах - Гугл закрывает лавочку. Обидно, да?
Конечно обидно. Лучше всё время до гипотетического закрытия лавочки сидеть воообще без приличной распознавалки (коммерческие она по цене не потянет наверняка). И, кстати, насколько мне известно гугловская распознавалка не требует обучения.
>> А чего сейчас не пользоваться-то?
> Ты к врачу идёшь только когда температура уже под 42 и костлявая на пороге весело косой помахивает?Не поверите, но так оно и есть. Только с температурой 40 я уже никуда не иду а вызываю врача. Авось поможет. А по пустякам чего докторов то беспокоить?
:) А тут чего опасаешься? Что доктор сам без вызова придет?
> не смог придумать на кой мне голосовое управление компьютером.А "диктовать текст для документов"?
> А "диктовать текст для документов"?Печатать не в пример быстрее и эффективнее.
Вы, наверное, не пробовали :-) Впрочем, одно применение я надумал - прикрикнуть на комп, когда готовишь и руки замазаны в чём-то. Песню там на следующую переключить или рецепт глянуть.
> Вы, наверное, не пробовали :-) Впрочем, одно применение я надумал - прикрикнуть на комп, когда готовишь и руки замазаны в чём-то. Песню там на следующую переключить или рецепт глянуть.Круто. Только я делал это в windows году в 1997, с помощью пакета, раздававшегося с сайта MS (немного побаловавшись, мне это надоело, и за последние 15 лет я это ни разу не использовал). А в OS/2 это было из коробки.
Вот хорошая тексточиталка - это, на мой взгляд интереснее. В этом отношении трёхмегабайтный rhvoice впечатляет.
Вам тяжело понять, потому что вы недостаточно ленивы. Много руками работаете. А это подходит больше для работников языкового фронта. :-)
> Тьфу. Ну вот когда/если закроет - тогда и надо будет решать,Несомненно, некоторые предпочитают лечить шишку на лбу от грабель вместо того чтобы грабли заранее обойти. А так для голосового управления есть немало софта который не гоняет данные ни в какие гугли. Просто на бидончике такой софт писать больно уж несподручно - цифровая обработка сигналов таки требует скорострельности и сложных алгоритмов. Поэтому бидонистам проще вот так вот.
Ни халявного, ни дешевого сравнимого качества - нет, увы. А для русского языка - не уверен, что вообще есть.
> Ни халявного, ни дешевого сравнимого качества - нет, увы.Ага, я же говорю - папуасы и бусы. Ну вот дайте мне этот красивый ништяк! Денег нет, натурой отработаю!
> Ага, я же говорю - папуасы и бусы. Ну вот дайте мне
> этот красивый ништяк! Денег нет, натурой отработаю!Не, не подойдет твоя натура, плати денежку или сиди молча.
> А так для голосового управления есть немало софта который не гоняет данные ни в какие гугли.Пруф будте добры, только чтобы также бесплатно для пользователя. Пока с распознаванием русской речи или плохо или никак. Гугловский распознаватель самое адекватное, что я нашел.
оно использует сервера гугла или делает это софтово прямо на клиентском устройстве?
На серверах гугла.
в Казани под аналог этого получили грант на 9 млн http://lionet.livejournal.com/124739.html
Спросил у автора про поддержку русского - говорит что пока нет, поддержка различных языков пока только в планах.
Поскольку распознование делает гугл, а у него русский реализован хорошо, то и сабж практически на 100% поддерживает русский. Нужно только еще один параметр в API отправлять - язык для распознавания.Вуаля ;)
я на Android очень высоко оцениваю работу распознавания речи, единственный плюс наверное
Телефон гуглу отдал, где живу показал, что мне нравится сказал, но свой голос не дам...
> голос не дам...Эй, а кто в рабство продаваться будет в обмен на очередные "бусы"? Совсем офигеои?!
Нах не нужно, т.к. для работы требует интернет.
Тю! Ачо сейчас можно без инета? Ось общего назначения поставить на локалхост? :)))))))))))))))))))))))))))))
Парад параноиков.
Вообще непонятная истерика, как будто возможность кто-то отбирает, а не добавляет.
Какаая истерика? Представьте тоже приложение, что разработал этот чел, но под сфинкс. Все были бы довольны, потому что компьютер остаётся самодостаточным. Но он пошёл более лёгким путём. Но насколько это оправдано? Экосистема опенсорса начинает всё больше зависеть от закрытых проектов, поддерживаемых акулами бизнеса. А свои наработки при этом отсыхают. Сколько таких примеров...
И представьте, я прикручу гугловский поисковик для семантического поиска в моих файлах. это как? нормально? безопасно?
> Какаая истерика? Представьте тоже приложение, что разработал этот чел, но под сфинкс.Так вперёд, разрабатывай, солнце еще высоко, я разрешаю
Не все были бы довольны. Распознавание у сфинкса... как бы это сказать... не фонтан. При малейшем фоне всё становится печально.А по поводу поисковика - смотря какая задача. Если у вас оно будет искать там, где приватных данных нет или прайваси некритична - то что тут плохого? Допустим, индексируете вы собрание сочинений Толстого - чего бы и нет?
В общем, отучайтесь от фанатизма и учитесь оценивать конкретную ситуацию и приемлемые в ней решения.
Да зачем вообще что-то разрабатывать? Всё! Счастье наступило! Гугл разрешает всем пользоваться!
Никогда не будет сфинкс лучше, пока есть такие проекты и все сломя голову бегут туда и наступает краткая эйфория. Конечно у Гугла лучше распознавание! А знаете почему? Потому что он использует голоса всех кто им пользуется для совершенствования распознавания. А разработчики сфинкса днём с огнём не могут найти людей готовых зачитать текст на микрофон, чтобы те же люди могли его потом использовать.
> Вообще непонятная истерика, как будто возможность кто-то отбирает, а не добавляет.Добавляет. Вещь под названием vendor lockin в области где его необходимость откровенно высосана из пальца. Ибо мой телефон десятилетней давности вполне себе уже распознавал голос локально. Без всякого интернета и гуглей с их навязшими на зубах попытках вымурыжить из себя еще 10 причин по которым они все нужны. Вон юзеры гуглоридера уже кажется ощутят последствия на своей попе ща. Ну так никто и не обещал что рабовладелец - обязательно добрым и хорошим будет.
Вот так поставишь это, настроишь, привыкнешь. А потом гугль возьмёт и внезапно отключит свои сервисы. Писать программы на основе онлайн-сервисов с нестандартизированным апи - это хуже, чем писать программы на основе закрытых либ.
> Вот так поставишь это, настроишь, привыкнешь. А потом гугль возьмёт и внезапно
> отключит свои сервисы. Писать программы на основе онлайн-сервисов с нестандартизированным
> апи - это хуже, чем писать программы на основе закрытых либ.Google != Красный Крест, Inc.
Ваши глубокомысленные утверждения про Google, Inc удаляются как спам, а не потому, что они неверны. Но здесь позвольте оставить :)
Ну если не хотят заботиться о своей репутации - их право, а я поищу альтернативу :)
Чувачилы, а что, никто не увидел одной вещи? Как Сири-то всех занозила и кинулись воспроизводить "А у нас тож есть!" у поганого Яббла фенечку-свистоперделочку?
Распознавание голоса и голосовой помощник - разные вещи. Голос - это способ ввода, а помощник - это приложение-банк знаний.
> Распознавание голоса и голосовой помощник - разные вещи. Голос - это способ
> ввода, а помощник - это приложение-банк знаний.Тащемта, передергивание. Это части одного целого. И одна техно.
>> Распознавание голоса и голосовой помощник - разные вещи. Голос - это способ
>> ввода, а помощник - это приложение-банк знаний.
> Тащемта, передергивание. Это части одного целого. И одна техно.и, по-вашему, распознавание речи придумали эппл? да вы, яблофаги, похлеще религиозных фанатиков пургу несете.
Кто знает - может есть программа, которая речь (голосовую часть веб-бинара) может перегнать в текст через Гугл АПИ?Оченно полезно было бы ))
А жесты в картинки?
я лучше в дуум поиграю
> я лучше в дуум поиграюЛучше поДУУУУУУУМАЙ. :))))))
Код проекта (https://github.com/JamezQ/ubuntu-speech-recognition)
> написан на языке Python и открыт под лицензией GPLv3. Распознавание
> речи осуществляется через обращение к Google Voice API, который демонстрирует достаточно
> неплохие результаты и для русского языка.Ковырял кто-нибудь уже исходники? Хотел посмотреть, как это все устроено, но там всего 2 исполняемых файла нашёл - один на питоне, другой на сях. Я думаю, все интересное находится в ../Recognition/dictionary.c, но со звуком никогда не работал и логику совершенно не понял..
Кстати, по поводу прикрикнуть на комп из кухни - а не боитесь, что на ваш комп, например, телевизор из спальни прикрикнет? И, главное, непонятно, ЧТО он ему крикнет... Напоминает наши давние приколы над сотрудниками одной мини-типографии - из-за спины крикнуть "shutdown... yes" на их чудо-компы с включенным голосовым управлением.
Не "из кухни", а на кухонный комп. Нет, не боюсь - за отсутствием телевизора и привычки включать звук на большую громкость. А вот на кухне аудиокнигу или лекцию запустить - в самый раз.
> через обращение к Google Voice APIЧто оно отвалилось как Google reader как только корпорашка захочет больше денег? Лесом.
Жопоголизм в комментариях развеселил
Какая скорость интернета достаточна для их сервиса?
2 Мегабита (256 Килобайт) в секунду хватит?
На мобилах оно на едже работает более-менее.
Да закроют ваш Google Voice API завтра, как и другие проекты, и что будете делать? Петь деферамбы гуглу?