The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Компания Google открыла недостающие исходные тексты для аудиокодека Lyra"
Версия для распечатки Пред. тема | След. тема
Форум Разговоры, обсуждение новостей
Исходное сообщение [ Отслеживать ]
Заметили полезную информацию ? Пожалуйста добавьте в FAQ на WIKI.
. "Компания Google открыла недостающие исходные тексты для ауди..." –1 +/
Сообщение от Ordu (ok), 02-Июл-21, 14:28 
> Снова эти негросети, снова искусственный идиот.

А человеческое восприятие симулировать без нейросеток не получается. То есть обработку звука, которую улитка в ухе производит, ещё можно повторить при помощи преобразования Фурье, может с небольшими дополнительными костылями, а вот вычленение звуков речи, как их слышит человек -- не, уже никак.

> А что если по голоовому каналу будут передавать не голос, кстати?

Это смотря как они кодек напишут. Можно вырезать, можно кодировать бОльшим битрейтом.

Если очень грубо описывать, то подход примерно такой. Берёшь со входа сигнал. Слушаешь, получаешь последовательность звуков записанных в каком-то символическом виде. (Например это может быть что-то типа IPA[1], только в удобном для процессора формате). Теперь подбираешь параметры для наилучшего воспроизведения этого символического звука (ну, типа, высота тона голоса, или любые другие параметры которые тебе понравились), так чтобы с этими параметрами описать максимум энтропии входного сигнала. Результат перегоняешь в звук, вычитаешь это из исходного сигнала. Теперь в этом остатке срезаешь лишние частоты, выкидываешь всё лишнее, кодируешь чем-нибудь, под произвольный звук заточенное. Передаёшь символы-звуки и этот дополнительный слой пожатого pcm. На той стороне символы перегоняются в звук, складываются с pcm, выводятся в наушник.

В реальности там всё интереснее, но я упрощая до упора. Что именно будет потеряно при этом -- это то, что ты захочешь потерять, как напишешь кодек, так и будет.

> Или неизвестный язык?

Похрен. У всех языков вместе взятых конечный набор звуков. Языки отличаются от других не столько тем, что они какие-то уникальные звуки имеют, сколько тем, что они каких-то звуков не имеют. Если они набор для обучения из 70 языков собирали, то, даже если они не консультировались с лингвистами, скорее всего они собрали все звуки.

[1] https://ru.wikipedia.org/wiki/%D0%9C%D0%...

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
Компания Google открыла недостающие исходные тексты для аудиокодека Lyra, opennews, 02-Июл-21, 11:47  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру