The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Компания Mozilla представила движок распознавания речи DeepSpeech 0.9"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Компания Mozilla представила движок распознавания речи DeepSpeech 0.9"  +/
Сообщение от opennews (??), 09-Ноя-20, 11:39 
Опубликован выпуск развиваемого компанией Mozilla движка распознавания речи DeepSpeech 0.9, реализующего одноимённую архитектуру распознавания речи, предложенную исследователями из компании Baidu.  Реализация написана на языке Python с использованием платформы машинного обучения TensorFlow и распространяется под свободной лицензией MPL 2.0...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=54053

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Аноним (1), 09-Ноя-20, 11:39   –8 +/
Пусть в мобильный браузер хоть встроят, там и "помощник" есть.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #38

2. Сообщение от Zenitur (ok), 09-Ноя-20, 11:45   –1 +/
Фрунзик Мкртчян
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #85, #7

5. Сообщение от Аноним (5), 09-Ноя-20, 11:58   +4 +/
Пусть лучше браузер здорового человека представят.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #8, #11, #30, #39, #83

6. Сообщение от lockywolf (ok), 09-Ноя-20, 11:59   –4 +/
В CMU Sphinx контрибутить неее, это недостаточно NIH.
Ответить | Правка | Наверх | Cообщить модератору

7. Сообщение от nshmyrev (ok), 09-Ноя-20, 11:59   +4 +/
Кстати, заметьте, что точность распознавания не измеряют и не публикуют. А дело в том, что точность упала, хуже, чем в версии 0.7:

version/set        0.7     0.9

tedlium           18.03    18.80
tedlium-tflite    19.58    21.15
librispeech       6.12     7.27

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

8. Сообщение от Аноним (8), 09-Ноя-20, 12:10   –3 +/
Это скучно и нехайпово.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5

9. Сообщение от Голуб4ик (?), 09-Ноя-20, 12:16   +/
В перспективе этим можно субтитры к youtube видео делать?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #31

10. Сообщение от Аноним (10), 09-Ноя-20, 12:17   –3 +/
Звук не ждать.
Ответить | Правка | Наверх | Cообщить модератору

11. Сообщение от Аноним (11), 09-Ноя-20, 12:22   –4 +/
Ну... Это аж целых шерстяного и тобика нанимать.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #13

12. Сообщение от Аноним (12), 09-Ноя-20, 12:40   +2 +/
Let me deep speak from my deep throat.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #19, #23, #41

13. Сообщение от Аноним (5), 09-Ноя-20, 12:44   –4 +/
У них браузер некрозофила получается.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #11

14. Сообщение от Nicholasemail (?), 09-Ноя-20, 12:49   +/
Когда они уже запилят переводчик в Firefox
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #45, #56

15. Сообщение от Аноним (85), 09-Ноя-20, 13:03   +6 +/
Кто-нибудь говорит с браузерами?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #18, #21, #37, #52, #53, #54

16. Сообщение от YetAnotherOnanym (ok), 09-Ноя-20, 13:05   –3 +/
> Реализация написана на языке Python
> Производительности достаточно для использования движка

А как это?
> Из недостатков DeepSpeech упоминается низкая производительность

Они бы там как-то определились бы...

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #20, #25

17. Сообщение от Аноним (18), 09-Ноя-20, 13:08   +/
А браузер они не пробовали представить?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #73

18. Сообщение от Аноним (18), 09-Ноя-20, 13:08   +/
Будут.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #15 Ответы: #26

19. Сообщение от YetAnotherOnanym (ok), 09-Ноя-20, 13:10   –1 +/
Miss Lovelace, please, do log in.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #12

20. Сообщение от Аноним (20), 09-Ноя-20, 13:11   +/
о, завсегдатай иксперт опеннета, ты tensorflow-то кроме как в строках новостей на опеннете видел? а почему рот весь в тупых комментариях?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16

21. Сообщение от Аноним (-), 09-Ноя-20, 13:15   +7 +/
Изолировать надо от общества таких.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #15 Ответы: #29

23. Сообщение от Ordu (ok), 09-Ноя-20, 13:20   –2 +/
Ok, just do not try to speak all of your deep mind, stick to a surface level.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #12

24. Сообщение от Аноним (24), 09-Ноя-20, 13:24   +/
We need to go deeper
Ответить | Правка | Наверх | Cообщить модератору

25. Сообщение от JustCurious (?), 09-Ноя-20, 13:34   +1 +/
Насколько я понял, низкая производительность - это именно про архитектуру нейронки DeepSpeech, а не про какие то проблемы в реализации их одноименного движка.

А насчёт Python - это врядли узкое место. TensorFlow написан на С++, а Python - это просто интерфейс. Кроме того, в TensorFlow вы сначала задаёте граф вычислений, а перед выполнением он "компилируется" для максимальной производительности, поэтому даже между операциями графа нет никакого оверхеда от Python.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16 Ответы: #50

26. Сообщение от Аноним (26), 09-Ноя-20, 13:43   +3 +/
это печально
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #18

27. Сообщение от istepan (ok), 09-Ноя-20, 13:50   –1 +/
В Common Voice мало текста для русского, но можно дополнять.
Ответить | Правка | Наверх | Cообщить модератору

29. Сообщение от Аноним (18), 09-Ноя-20, 13:53   +5 +/
Уже сделано, ты общаешься сейчас через браузер, а не лично.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21 Ответы: #55

30. Сообщение от rshadow (ok), 09-Ноя-20, 13:55   –3 +/
В целом то они это для браузера и пилят. Уже чайники по команде закипать умеют. А браузер до сих пор любимый канал ютубчика открыть не может.
</sarcasm>
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #43

31. Сообщение от rshadow (ok), 09-Ноя-20, 13:56   +/
В ютубе и так автоматические субтитры давно есть. И качество тоже не ахти.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #9 Ответы: #47, #99

32. Сообщение от Аноним (85), 09-Ноя-20, 14:41   +/
Лучше бы вернули назад просто хороший браузер. А не это фиолетовое смузи, которое кроят всё последнее время.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #34, #40

34. Сообщение от Аноним (18), 09-Ноя-20, 14:46   –1 +/
Некогда им браузер делать, они смузихлёбные языки разрабатывают.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32 Ответы: #93

36. Сообщение от Im banana man (?), 09-Ноя-20, 14:59   +/
Компания оправдывает свое название на все 100% )
Ответить | Правка | Наверх | Cообщить модератору

37. Сообщение от Im banana man (?), 09-Ноя-20, 15:00   +1 +/
Инвалиды?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #15

38. Сообщение от Аноним (-), 09-Ноя-20, 15:02   +39 +/
> В предложенной модели наилучший результат распознавания достигается при чистой записи мужского голоса с американским акцентом в окружении без посторонних шумов.

Забыли добавить, что говорить должен белый гетеросексуальный мужчина. Если говорит нeгp, то количество ошибок удваивается, а если он еще и гoмoceк, то утраивается.

#whitelivesmatter

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1

39. Сообщение от Аноним (-), 09-Ноя-20, 15:04   +6 +/
Так сделано уже. Firefox называется.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5 Ответы: #44, #107

40. Сообщение от Аноним (40), 09-Ноя-20, 15:05   +1 +/
Мне нравится новая тема оформления (Firefox Alpenglow). Я так считаю, это главное достижение Мозиллы за последние 15 лет.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #32 Ответы: #76

41. Сообщение от Аноним (41), 09-Ноя-20, 15:06   +/
Извращенцы! Забанить вас всех надо...
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #12

43. Сообщение от Аноним (5), 09-Ноя-20, 15:26   +3 +/
> А браузер до сих пор любимый канал ютубчика открыть не может.

УМВР. ЧЯДНТ?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #30 Ответы: #95, #106

44. Сообщение от Аноним (5), 09-Ноя-20, 15:26   –4 +/
Он скатился.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #39

45. Сообщение от Аноним (5), 09-Ноя-20, 15:28   +/
Зачем тащить его в браузер? Без этого пуля недостаточно серебряная?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #14

47. Сообщение от n00by (ok), 09-Ноя-20, 15:50   +5 +/
Отличное качество. Клип "Денег мало, длинный шмель, ты в кибитку не ходи" не даст соврать.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #31

48. Сообщение от NotaBug (ok), 09-Ноя-20, 15:51   –2 +/
Мля, ещё один зонд. Как же достало при каждом обновлении перелопачивать about:config, так они ещё и шифруются, постоянно меняя названия переменных.
Ответить | Правка | Наверх | Cообщить модератору

49. Сообщение от rvs2016 (ok), 09-Ноя-20, 15:53   –1 +/
Подождём, когда в этом движке наваяют распознавателя русской речи без бубна.
Ответить | Правка | Наверх | Cообщить модератору

50. Сообщение от n00by (ok), 09-Ноя-20, 15:54   +/
Цитата без купюр:

низкая производительность и высокое потребление памяти
_в_ _декодировщике_, а также существенные ресурсы для обучения модели

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #25 Ответы: #87, #89

52. Сообщение от Anonim (??), 09-Ноя-20, 16:16   +1 +/
Tolko esli otkryt opennet.ru
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #15

53. Сообщение от Урри (ok), 09-Ноя-20, 16:16   +/
Зачем? Браузеры и без этого вас спокойно слушают.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #15 Ответы: #98

54. Сообщение от Kuromi (ok), 09-Ноя-20, 17:00   +/
Они сами слушать будут.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #15

55. Сообщение от Аноним (55), 09-Ноя-20, 18:20   +/
Думаешь, вот сейчас это тебе браузер написал?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #29

56. Сообщение от TrickyFoxy (ok), 09-Ноя-20, 18:20   +/
Попробуйте https://addons.mozilla.org/ru/firefox/addon/traduzir-paginas.../
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #14

60. Сообщение от anonymous (??), 09-Ноя-20, 19:39   +/
А можно тупо надрать голоса с ютуб-ролков? Или там какие-то проблемы с легальностью?
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #64

61. Сообщение от Аноним (61), 09-Ноя-20, 19:42   +1 +/
Полезная вещь. Если прикрутить к браузеру, то тот сможет в дополнительной телеметрии передавать все, что он о себе услышал.  :)
Ответить | Правка | Наверх | Cообщить модератору

63. Сообщение от Аноним (63), 09-Ноя-20, 19:52   –1 +/
На python будет тормозить
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #88

64. Сообщение от Lex (??), 09-Ноя-20, 20:18   –1 +/
Там не только голос нужен, но и текст, который этот «голос» говорит
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #60 Ответы: #67, #101

65. Сообщение от Аноним (65), 09-Ноя-20, 20:54   –1 +/
Лучше бы нормальную tts с качественными голосами написали, а то кроме убогого фестиваля больше ничего нет.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #66

66. Сообщение от ПэЖэ (?), 09-Ноя-20, 21:03   –1 +/
>Лучше бы нормальную tts с качественными голосами написали, а то кроме убогого фестиваля больше ничего нет.

про RHVoice не слышал что ли?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #65 Ответы: #71, #72

67. Сообщение от anonymous (??), 09-Ноя-20, 21:17   +/
Ну текст записать не проблема.

Вот голос взять откуда-нибудь - это беда. Это хрому хорошо, его пользователи рады вставлять себе зонды, и можно тупо собрать их голоса. А вот пользователи мозиллы шифруются и отдавать голоса не станут.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #64 Ответы: #74

68. Сообщение от Аноним (85), 09-Ноя-20, 21:18   –2 +/
Firefox Browser 82.0.3
Вышел.
Ответить | Правка | Наверх | Cообщить модератору

71. Сообщение от Аноним (61), 09-Ноя-20, 21:43   +/
RHVoice качественным можно только назвать по сравнению с фестивалем.

У Мозилы есть свой достаточно технологичный TTS проект, но до практического применения там, боюсь, еще далеко:
https://github.com/mozilla/TTS

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66

72. Сообщение от Аноним (65), 09-Ноя-20, 21:45   +/
>про RHVoice не слышал что ли?

Я про него забыл. Он конечно намного лучше фестиваля, но всё равно сильно режет слух.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #66

73. Сообщение от Kuromi (ok), 09-Ноя-20, 22:41   +/
> А браузер они не пробовали представить?

Они пробовали. Но там сейчас проблемка - они с помпой пообещали WebRender и аппаратное ускорение на всех платформах, а теперь выяснилось что это больно занудно делать и пошел тихий откат к софтверному-всему.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #17

74. Сообщение от Lex (??), 09-Ноя-20, 23:17   +/
Чего «не проблема» ?
-Перед скармливанием каждого ютубовского ролика внимательно его прослушивать и делать норм расшифровку аудио.. )

Тогда уж проще написать скрипт, который бы парсил сайты с текстами песен, искал бы по авторам и названиям сами аудиозаписи и эти пары скармливал системе( тогда и голосов много разных будет и шумов. Авось распознавать лучше станет ).

Но есть смутное подозрение, что каждое слово должно быть привязано к конкретному моменту времени в треке, что уже едва ли просто автоматизировать( а вручную - ппц как муторно расставлять )

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #67 Ответы: #75

75. Сообщение от Аноним (75), 10-Ноя-20, 00:00   +1 +/
> скрипт, который бы парсил скрипт, который бы парсил сайты с текстами песен, искал бы по авторам и названиям сами аудиозаписи и эти пары скармливал системе

Правда, тогда для правильного распознавания текст петь нужно будет ;)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #74 Ответы: #94

76. Сообщение от Аноним (18), 10-Ноя-20, 01:09   +/
> за последние 15 лет

Когда-то между Спутником и Гагариным понадобилось всего 4 года. Сейчас 15 лет пилят тему...

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #40

77. Сообщение от Аноним (77), 10-Ноя-20, 01:45   +1 +/
Русские модели не найдутся? Интересная вещь
Ответить | Правка | Наверх | Cообщить модератору

83. Сообщение от Аноним (83), 10-Ноя-20, 07:13   +2 +/
Chrome (не Chromium)

/thread

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #5

84. Сообщение от Аноним12345 (?), 10-Ноя-20, 07:59   +/
Про русский как всегда забыли
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #86, #97

85. Сообщение от Аноним (85), 10-Ноя-20, 08:53   +/
Очень нужное.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #2

86. Сообщение от Аноним (86), 10-Ноя-20, 09:09   +/
Не забыли.

> Для других языков можно обучить систему самостоятельно по прилагаемой инструкции, используя голосовые данные, собранные проектом Common Voice.

Просто лично ты систему не обучил.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #84

87. Сообщение от Аноним (20), 10-Ноя-20, 09:20   +/
и к чему эта цитата?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #50

88. Сообщение от Аноним (20), 10-Ноя-20, 09:21   +/
ты будешь тормозить
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #63

89. Сообщение от YetAnotherOnanym (ok), 10-Ноя-20, 09:23   +/
И? Вы берётесь утверждать, что "_декодировщик_" не является частью продукта, о котором идёт речь?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #50 Ответы: #96

90. Сообщение от Брат Анон (?), 10-Ноя-20, 09:37   +/
Я правильно понимаю, что запилить распознователь речи -- это теперь интереснее, чем доделать хруст?))
--
Если серьёзно, то это скакание с темы на тему очень похоже на один психиатрический диагноз, который не сулит мазилке ничего хорошего. Хоть что-то бы доделали до конца.
Ответить | Правка | Наверх | Cообщить модератору

91. Сообщение от Аноним (85), 10-Ноя-20, 09:55   +1 +/
Файрфокс своё уже отколбасил. Всё.
Ответить | Правка | Наверх | Cообщить модератору

93. Сообщение от Аноним (85), 10-Ноя-20, 10:00   +/
Лижут гуглу. Кой-чего.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #34

94. Сообщение от Lex (??), 10-Ноя-20, 12:52   +/
> Правда, тогда для правильного распознавания текст петь нужно будет ;)

Где-то петь, где-то - по барабанам стучать. Так, пожалуй, даже веселее будет :)

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #75

95. Сообщение от rshadow (ok), 10-Ноя-20, 12:56   +/
Работает голосовое управление в лисе? Или ты из тех которые в контекст беседы не умеют?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #43 Ответы: #108

96. Сообщение от n00by (ok), 10-Ноя-20, 14:32   +/
Увы, Вы не угадали, не берусь. Берусь утверждать, что название является частью продукта.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #89

97. Сообщение от Аноним (85), 10-Ноя-20, 14:44   +/
Вам какой русский, Шнурова или Джигурды?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #84

98. Сообщение от InuYasha (??), 10-Ноя-20, 14:57   +/
Так эффективность же! Так-то браузер должен довольно толстый звук отсылать, а с ДипСпичом - коротенькие текстики, которые в общем трафике даже не заметишь. )
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #53

99. Сообщение от васьок (?), 10-Ноя-20, 15:21   +/
Я регулярно лунтика смотрю - субтитры просто жэсть. В некоторых серияфх еще ничего - видно что человек помогал.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #31

100. Сообщение от Ingeneremail (??), 10-Ноя-20, 15:51   –1 +/
Ну движок и движок. Представила компания Мозалла и представила. Мне пофиг. Мне не нужно. Мне некуда его заюзать. На в raspberry 3, ни в raspberry 4. Ни в LeTomato. Ну обновили и окей.
Ответить | Правка | Наверх | Cообщить модератору

101. Сообщение от 1 (??), 10-Ноя-20, 17:22   +/
аудиокнижек накачать и оригиналы тут же ?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #64

102. Сообщение от Аноним (102), 10-Ноя-20, 18:09   +/
ска, 2020 объявлен годом префикса Deep. Кол-во DeepThorat запросов в гугле увеличилось вдвое.
Ответить | Правка | Наверх | Cообщить модератору
Ответы: #103, #104

103. Сообщение от Аноним (102), 10-Ноя-20, 18:10   +/
*DeepThroat, очепятка.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #102

104. Сообщение от Ordu (ok), 10-Ноя-20, 18:20   +1 +/
Мне кажется, ты отстаёшь от трендов. Deep суётся во все IT-щели уже лет пять как.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #102

105. Сообщение от АнонимусШифропанк (?), 10-Ноя-20, 19:17   +/
Есть примеры, как это подружить с чем-нибудь вроде openHub?
Ответить | Правка | Наверх | Cообщить модератору

106. Сообщение от arthi747 (ok), 10-Ноя-20, 23:20   +/
У мя фирефокс примерно минут через 15 на ютубе начинат тупить и потом видео совсем останавливается. При этом htop говорит что свободных ресурсов дофига. Чистить профиль и удалять дополнения не помогает. На том же железе хромые браузеры просто работают. Я понимаю что есть важные и неотложные дела типа инклюзивных названий но может сделают уже элементарные вещи?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #43 Ответы: #109

107. Сообщение от Аноним (85), 11-Ноя-20, 00:45   +/
Да. Был такой браузер.
И сейчас стоит. Но пользоваться не хочется. Как бы двусмысленно это не звучало.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #39

108. Сообщение от Аноним (5), 12-Ноя-20, 15:19   +/
При чем тут голосовое управление?!
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #95

109. Сообщение от Александр (??), 15-Ноя-20, 21:58   +/
На всех компах и ноутах использую лису, ни разу с таким глюком не встречался. ЧЯДНТ?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #106


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру