Вариант для распечатки |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от opennews (?), 22-Дек-18, 23:08 | ||
Разработчики из лаборатории искусственного интеллекта Facebook AI Research представили (https://code.fb.com/ai-research/wav2letter/) первый выпуск (https://github.com/facebookresearch/wav2letter/releases) новой системы распознавания речи Wav2letter++ (https://github.com/facebookresearch/wav2letter/), построенной с использованием свёрточной нейронной сети. В отличие от опубликованного (https://www.opennet.me/opennews/art.shtml?num=47842) в январе начального прототипа, реализация wav2letter++ полностью переписана на языке C++ с использованием библиотек ArrayFire (https://github.com/arrayfire/arrayfire) и Flashlight (https://github.com/facebookresearch/flashlight) (первый прототип был в форме Torch-модуля на языке Lua). Код проекта распространяется (https://github.com/facebookresearch/wav2letter) под лицензией BSD. Доступны уже натренированные модели (1 (https://s3.amazonaws.com/wav2letter/models/librispeech-glu-h...), 2 (https://s3.amazonaws.com/wav2letter/models/librispeech-glu-h...), 3 (https://s3.amazonaws.com/wav2letter/models/librispeech-glu-l...)) для английского языка. | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения по теме | [Сортировка по времени | RSS] |
3. "Facebook опубликовал открытую систему распознавания речи Wav..." | +8 +/– | |
Сообщение от DHCPep (?), 22-Дек-18, 23:55 | ||
Подскажите незнающему, а вот этот продукт возможно на рядовой писюк без всяких там ускоряющих жпу поставить и условно: | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
8. "Facebook опубликовал открытую систему распознавания речи Wav..." | +13 +/– | |
Сообщение от Аноним (8), 23-Дек-18, 04:24 | ||
Так не получится. Как минимум тебе ещё потребуется языковая модель, которую можно рассматривать условно как чёрный ящик, в который ты грузишь предложение (по букве, или по слову -- зависит от модели), а он тебе предсказывает продолжение, она нужна для того, чтобы, грубо говоря, взять возможные интерпретации невнятно произнесённого слова и ориентируясь на предложение в целом выбрать наиболее правдоподобную интерпретацию. | ||
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору |
40. "Facebook опубликовал открытую систему распознавания речи Wav..." | +4 +/– | |
Сообщение от DHCPep (?), 23-Дек-18, 20:37 | ||
Вот это ответ, так ответ! Всем ответам ответ! :) | ||
Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору |
10. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Анон Анонов (?), 23-Дек-18, 04:54 | ||
В теории, эту штуку можно и в браузер встроить. Правда придётся потрудиться. Плюсы можно легко собрать в wasm, но для этого придётся выпилить работу с GPU, потоками, ассемблером, если есть, файловой системой. Отдельно нужно будет подготовить модель и загрузить её в браузер. Вроде есть форматы какие-то для этого. | ||
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору |
11. "Facebook опубликовал открытую систему распознавания речи Wav..." | +4 +/– | |
Сообщение от commiethebeastie (ok), 23-Дек-18, 05:15 | ||
Если именно встроить, то я думаю лучше использовать как библиотеку, а не извращаться как хипстеры. | ||
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору |
14. "Facebook опубликовал открытую систему распознавания речи Wav..." | –1 +/– | |
Сообщение от Андрей (??), 23-Дек-18, 08:17 | ||
> Отдельно нужно будет подготовить модель и загрузить её в браузер. Вроде есть форматы какие-то для этого. | ||
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору |
41. "Facebook опубликовал открытую систему распознавания речи Wav..." | +2 +/– | |
Сообщение от Аноним (41), 23-Дек-18, 22:04 | ||
Не надо ничего встраивать в браузер!!!!11 | ||
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору |
13. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Аноним3 (?), 23-Дек-18, 07:31 | ||
А есть ли что-то попроще, если не нужно распознавать речь, а только точно локализовывать начало и конец реплик и по возможности чей голос (просто номер), что важно если кусочки реплик накладываются? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
46. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Аноним (46), 24-Дек-18, 12:58 | ||
не попроще (speaker recognition/speech recognition), попроще можно привязать к другой биометрии | ||
Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору |
47. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Аноним (46), 24-Дек-18, 14:38 | ||
вообщем, как-то так это выглядит: speaker diarization system (sad/vad + change point detection in time series + counting + indexing + segmentation + homogeneous model forming + reducing the dimensionality + clustering + re-segmentation + tracking) | ||
Ответить | Правка | ^ к родителю #46 | Наверх | Cообщить модератору |
50. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Андрей (??), 26-Дек-18, 17:53 | ||
Да-с, выходит как бы с нуля начинать. | ||
Ответить | Правка | ^ к родителю #47 | Наверх | Cообщить модератору |
51. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Аноним (46), 26-Дек-18, 20:25 | ||
https://pastebin.com/pystDU4C | ||
Ответить | Правка | ^ к родителю #50 | Наверх | Cообщить модератору |
52. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Аноним3 (?), 27-Дек-18, 01:28 | ||
Спасибо! Но в списке, вроде, большинство научные пробы или общие библиотеки для работы с аудио: кое-что старое (yaafe, CLAM), кое-что активное (librosa). | ||
Ответить | Правка | ^ к родителю #51 | Наверх | Cообщить модератору |
53. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Аноним (46), 27-Дек-18, 11:49 | ||
самое интересное можно оставить на потом, в начале возможен модульный pipeline с максимальной разбивкой по задачам, там как раз старые библиотеки пригодятся даже sox c ffmpeg, только не ждите доброго от меня, старого дурака, вот еще вам https://www2.securecms.com/ICASSP2017/Papers/AcceptedPapers.asp http://www.redhenlab.org/home/the-cognitive-core-research-to... | ||
Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору |
19. "Facebook опубликовал открытую систему распознавания речи Wav..." | –1 +/– | |
Сообщение от Аноним (19), 23-Дек-18, 11:46 | ||
“facebook tracking how their libraries are used and implement features they can use for better user tracking” | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
36. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от corvuscor (ok), 23-Дек-18, 16:20 | ||
>Для ускорения проведения обучения поддерживается задействование GPU (CUDA) | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
39. "Facebook опубликовал открытую систему распознавания речи Wav..." | –2 +/– | |
Сообщение от Аноним (39), 23-Дек-18, 17:18 | ||
Без пяти минут неделя vs годами "production ready" еще и удивляются. | ||
Ответить | Правка | ^ к родителю #36 | Наверх | Cообщить модератору |
48. "Facebook опубликовал открытую систему распознавания речи Wav..." | –1 +/– | |
Сообщение от Аноним (48), 24-Дек-18, 20:16 | ||
OpenCL уже похоронили, теперь все верят в Vulkan | ||
Ответить | Правка | ^ к родителю #36 | Наверх | Cообщить модератору |
49. "Facebook опубликовал открытую систему распознавания речи Wav..." | +1 +/– | |
Сообщение от Владимир (??), 26-Дек-18, 13:53 | ||
С OpenGL не перепутал? | ||
Ответить | Правка | ^ к родителю #48 | Наверх | Cообщить модератору |
45. "Facebook опубликовал открытую систему распознавания речи Wav..." | +2 +/– | |
Сообщение от Аноним (-), 23-Дек-18, 23:59 | ||
> Facebook опубликовал открытую систему распознавания речи | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
54. "Facebook опубликовал открытую систему распознавания речи Wav..." | +/– | |
Сообщение от Аноним (54), 31-Дек-18, 11:06 | ||
Натренированные модели от предыдущей версии, с этой не стыкуются. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |