The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Обновление голосовых данных Mozilla Common Voice 19.0

22.09.2024 13:02

Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением объём речевого материала в коллекции увеличился с 31.8 до 32.6 тысяч часов речи, из которых более 20 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 129 до 131.

В подготовке материалов на английском языке приняли участие 93.9 тысяч человек, надиктовавших 3587 часов речи (было 93.3 тысячи участников и 3554 часа). Набор для белорусского языка охватывает 8444 участников и 1846 часов речевого материала (было - 8400 участников и 1815 часов), русского языка - 3296 участников и 278 часов (был 3241 участник и 277 часов), узбекского - 2200 участников и 265 часов (было 2189 участников и 265 часов), украинского языка - 1104 участника и 114 часов (было 1091 участник и 113 часов).

Проект Common Voice нацелен на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагается озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи без ограничений можно использовать в системах машинного обучения и в исследовательских проектах.

  1. Главная ссылка к новости (https://www.soeren-hentzschel....)
  2. OpenNews: Обновление голосовых данных Mozilla Common Voice 18.0
  3. OpenNews: NVIDIA инвестирует 1.5 млн долларов в проект Mozilla Common Voice
  4. OpenNews: Новый выпуск системы синтеза речи Silero
  5. OpenNews: Опубликована AI-модель ChatTTS для синтеза речи
  6. OpenNews: Mozilla развивает инструментарий для распознавания речи Whisperfile
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/61911-voice
Ключевые слова: voice, ai
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (21) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 13:21, 22/09/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Отлично! Используем для обхода биометрический идентификации.
     
     
  • 2.18, Аноним (18), 15:52, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Как именно набор данных может быть использован для обхода, если там, где им реально нужно, стоит охранник с автоматом, чтобы таких обходильщиков ловить, а где не реально нужно - там вообще пофиг на ваши обходы, можете хоть белый шум пускать, хоть Digalo Nikolai юзать.
     
     
  • 3.50, Аноним (1), 17:40, 23/09/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Ну так быстрее публикуй свой голос!
     
     
  • 4.51, Аноним (1), 17:45, 23/09/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Да не опубликует он! ... - это не мишки ворочить!
    Как минимум - его голос в рекламе извращенецев будут использовать, а максимум - в банке кридит онлайн оформят, а что ещё серьёзнее так это использование голоса в оппозициионых роликах - тут уже немдо шуток... Хотя тот аноним если написал - пускай выкладывает свой голос и стоит до конца.
     
  • 2.34, Аноним (34), 19:07, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    С этим уже нейросетки намного лучше справляются.
     

  • 1.3, Аноним (3), 13:25, 22/09/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    Помогать значит предлагают на халяву, а как попользоваться нужно будет тем же синтезатором речи, то в пролёте?!
     
     
  • 2.4, Аноним (4), 13:37, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Да все так не можешь сам синтезировать плати деньгу.
     
     
  • 3.12, Аноним (3), 13:52, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Да все так не можешь сам синтезировать плати деньгу.

    Могли бы хотя бы аккаунтам кто внёс значительный вклад дать бесплатный доступ, в качестве оплаты за работу. Это было бы справедливо. А то иначе какой-то абуз халявных хомячков получается.

     
     
  • 4.35, Аноним (34), 19:08, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    И чем это плохо?) Зачем платить, если можно не платить? *Иудей.жпг*
     
     
  • 5.40, Аноним (40), 22:37, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Вот у них и часов наговоренных мало.
     
  • 2.13, какая разница (?), 14:33, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    > данные опубликованы как общественное достояние

    Где здесь хотя бы намёк на слово "деньги"?

     
     
  • 3.14, Аноним (14), 15:28, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Могли бы дать доступа к сервису кто не силен в мышином лернинге и у кого нет нвидиа 4090.

    С другой стороны все исходники Мозилла выложила после курсов по мышиному лернингу можно и свой сервис сделать. А можно и без них.    

     
     
  • 4.33, Аноним (33), 19:06, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Какому сервису, экспертик? Это библиотека сырых голосовых данных. Полностью открытая. Тот факт, что тебе непонятно, что именно она из себя предсталяет - не проблема Мозиллы.
     
     
  • 5.36, Аноним (40), 21:16, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • +3 +/
    К любому который базируется на сабже, лол.
     
     
  • 6.41, Аноним (33), 22:49, 22/09/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Делай свой на основе этих открытых данных, лицензионо тут всё чистое - бери сколько влезет. Ну или жди, пока тебе подадут по пятницам, лол.
     
     
  • 7.45, Аноним (14), 07:42, 23/09/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Тебе уже выше сказали что это дорого и лениво для анонима, голову включи.
     
     
  • 8.48, Аноним (48), 13:02, 23/09/2024 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Это проблемы анонима ... текст свёрнут, показать
     
  • 4.44, Лолоним (?), 07:35, 23/09/2024 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Сервис с лоли.. с лёрнингом? С кунилёрнингом.
     
     
  • 5.46, Аноним (14), 07:43, 23/09/2024 [^] [^^] [^^^] [ответить]  
  • +/
    Вай нот, привлекли бы целевую аудиторию.
     

  • 1.54, Аноним (-), 20:20, 23/09/2024 Скрыто ботом-модератором [﹢﹢﹢] [ · · · ]     [к модератору]
  • +/
     
  • 1.55, InuYasha (??), 13:23, 25/09/2024 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    espeak
    - весит пару мегов
    - запускается на калькуляторе без ГПУ
    - да, звучит как пьяный робот

    но продолжаем хайповать по нейросеткам.

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру