The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Опубликована AI-модель синтеза речи Zonos, поддерживающая клонирование голоса"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Опубликована AI-модель синтеза речи Zonos, поддерживающая клонирование голоса"  +/
Сообщение от opennews (??), 17-Фев-25, 12:23 
Компания Zyphra опубликовала под лицензией Apache 2.0 первый бета-выпуск  AI-модели для синтеза речи Zonos. Предлагаемый вместе с моделью инструментарий поддерживает функцию клонирования голоса, позволяющую  синтезировать речь желаемым голосом, для воспроизведения которого модели достаточно предоставить 30-секундную эталонную запись речи говорящего. Поддерживается синтез на английском, японском, китайском, французском и немецком языках...

Подробнее: https://www.opennet.me/opennews/art.shtml?num=62733

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


3. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –3 +/
Сообщение от Аноним (3), 17-Фев-25, 12:32 
открыл себе такой новость, а тебе хором четыре семпла с порога в уши долбят
Ответить | Правка | Наверх | Cообщить модератору

4. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +34 +/
Сообщение от Аноним (4), 17-Фев-25, 12:36 
потому что надо юзать Firefox :D
Ответить | Правка | Наверх | Cообщить модератору

6. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +3 +/
Сообщение от Аноним (6), 17-Фев-25, 12:44 
noscript
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

12. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +2 +/
Сообщение от Шарп (ok), 17-Фев-25, 13:08 
яшка.браузер. Автоматически ничего не воспроизводится. У тетя там lynx?
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

5. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (4), 17-Фев-25, 12:39 
Кто тестил, оно лучше XTTSv2 и F5-TTS?
Ответить | Правка | Наверх | Cообщить модератору

32. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (32), 17-Фев-25, 13:53 
На смартфоне может?
Ответить | Правка | Наверх | Cообщить модератору

7. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +7 +/
Сообщение от Аноним (7), 17-Фев-25, 12:45 
> Поддерживается синтез на английском, японском, китайском, французском
> и немецком языках.

этот терминатор бракованный, мою маму не обманет, несите следующего.

Ответить | Правка | Наверх | Cообщить модератору

8. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от EULA (?), 17-Фев-25, 12:48 
Меняй на Электроника - мальчика из чемодана.
Ответить | Правка | Наверх | Cообщить модератору

9. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (9), 17-Фев-25, 13:00 
С одной стороны интересно, но всё чаще такой "дипфейковый" прогресс вызывает настороженность:
https://en.wikipedia.org/wiki/Artificial_Intelligence_Act
Ответить | Правка | Наверх | Cообщить модератору

16. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от X86 (ok), 17-Фев-25, 13:20 
эти все лезут регулировать то, в чем не разбираются. Потом будут в OpenAI GPT свой "браузер" продвигать)
Ответить | Правка | Наверх | Cообщить модератору

21. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (9), 17-Фев-25, 13:32 
У Франции есть Le Chat от Mistral AI:
https://chat.mistral.ai/chat
https://en.wikipedia.org/wiki/Mistral_AI
Ответить | Правка | Наверх | Cообщить модератору

33. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +2 +/
Сообщение от Смузихлёб (ok), 17-Фев-25, 13:53 
> Le Chat от Mistral AI

Который недавно стал платным. Раньше годный продукт был, часто использовал, теперь оно даже более упоротое по лимитам, если сравнивать с чатгпт.

Ответить | Правка | Наверх | Cообщить модератору

58. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от X86 (ok), 17-Фев-25, 17:24 
> У Франции есть Le Chat от Mistral AI:
> https://chat.mistral.ai/chat
> https://en.wikipedia.org/wiki/Mistral_AI

гонял на локалке этот мистраль, не впечатлил совсем.

Ответить | Правка | К родителю #21 | Наверх | Cообщить модератору

34. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +4 +/
Сообщение от Смузихлёб (ok), 17-Фев-25, 13:56 
Это тот редкий случай, когда лучше зарегулировать. И чем раньше, тем лучше.
Ответить | Правка | К родителю #16 | Наверх | Cообщить модератору

46. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от take 100500 (?), 17-Фев-25, 16:10 
Неее... свобода!
Ответить | Правка | Наверх | Cообщить модератору

56. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –4 +/
Сообщение от Аноним (56), 17-Фев-25, 17:14 
Неее... Не надо!
Ответить | Правка | Наверх | Cообщить модератору

66. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +4 +/
Сообщение от corvuscor (ok), 17-Фев-25, 19:31 
Клонирование голоса по 30-секундной записи - это вообще портал в ад.
Ответить | Правка | К родителю #34 | Наверх | Cообщить модератору

84. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (84), 18-Фев-25, 04:39 
Еще лет 5 назад читал статью, где представили сетку, клонирующую голос за 5 секунд
Ответить | Правка | Наверх | Cообщить модератору

86. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Андрей (??), 18-Фев-25, 11:39 
Real-Time-Voice-Cloning на гитхабе. На самом деле подвох прост - всё это черри-пикинг, т.к. что прошлая, что данная модель дают уверенный результат только на 5% голосов, причём чем ближе к выборке, тем лучше. В реальных же применениях всё это как правило работает очень грустно. Касательно 30 секунд вместо 5 - оправдаю авторов тем, что RTVC делала клонирование в лоб(более примитивной моделью) и не учитывала многих качеств голоса, собственно обратите внимание на схему с моделью, где по меньшей мере упомянуты эмбеддинги для `Speaker ID`, `Emotion`, `Pitch`, а на деле там сидит ещё несколько, поэтому улучшение есть, но цена и сложность модели растут сильнее, чем качество и простота адаптации.
Ответить | Правка | Наверх | Cообщить модератору

67. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (67), 17-Фев-25, 19:46 
Ты зарегулируешь, а китай, хакеры и пр не зарегулируют и будут пользоваться. Только у тебя не будет профита от этого потому что тебе запретили. А у них будет.
Ответить | Правка | К родителю #34 | Наверх | Cообщить модератору

68. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (68), 17-Фев-25, 19:55 
Если кто-то откажется, тем надо выписывать санкции по самое небалуйся. И регулировать не всё подряд, а например, только этот момент с генерацией голоса, фоток и видео людей.
Ответить | Правка | Наверх | Cообщить модератору

69. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (9), 17-Фев-25, 19:56 
>а китай не зарегулируют

Что ? Полистайте список, КПК там повсюду:
https://www.tadviser.ru/index.php/%D0%A1%D1&#...)_%D0%B2_%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82%D0%B5._%D0%9E%D0%BF%D1%8B%D1%82_%D0%9A%D0%B8%D1%82%D0%B0%D1%8F

Ответить | Правка | К родителю #67 | Наверх | Cообщить модератору

71. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (9), 17-Фев-25, 19:57 
Корректная ссылка:
https://www.tadviser.ru/a/349521
Ответить | Правка | Наверх | Cообщить модератору

105. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от огнемётные казни (?), 18-Фев-25, 21:50 
Китай не зарегулируют. Китай - это "свобода". В понимании многих местных "свободных".
Ответить | Правка | К родителю #69 | Наверх | Cообщить модератору

10. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от поле Name (?), 17-Фев-25, 13:05 
Ну не знаю, из 4х семплов мне меньше всех понравился сабж. Слишком звучит как робот из колцентра, а добавленное мычание
звучит принужденно. Fish хороший.
Ответить | Правка | Наверх | Cообщить модератору

11. Скрыто модератором  +2 +/
Сообщение от Аноним (-), 17-Фев-25, 13:07 
Ответить | Правка | Наверх | Cообщить модератору

23. Скрыто модератором  +2 +/
Сообщение от тоже Анонимemail (ok), 17-Фев-25, 13:43 
Ответить | Правка | Наверх | Cообщить модератору

40. Скрыто модератором  –1 +/
Сообщение от Bottle (?), 17-Фев-25, 14:26 
Ответить | Правка | Наверх | Cообщить модератору

42. Скрыто модератором  +/
Сообщение от Аноним (9), 17-Фев-25, 14:35 
Ответить | Правка | К родителю #23 | Наверх | Cообщить модератору

27. Скрыто модератором  +3 +/
Сообщение от Аноним (27), 17-Фев-25, 13:48 
Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

62. Скрыто модератором  +/
Сообщение от Аноним (62), 17-Фев-25, 18:07 
Ответить | Правка | Наверх | Cообщить модератору

17. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (17), 17-Фев-25, 13:21 
А синтезатор, который можно заставить говорить мультяшным голосом, кто-нибудь может посоветовать?

Предполагаемое использование: глупый попугай, повторяющий на разные лады одну и ту же выученную фразу в рекламных роликах.

Magic Goody почти подходит, но этот голос заезженный и несвободный.

Ответить | Правка | Наверх | Cообщить модератору

28. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +5 +/
Сообщение от Аноним (27), 17-Фев-25, 13:50 
> мультяшным голосом

Для этого не нужны нейросети. Просто увеличь скорость воспроизведения на своём катушечном бобиннике.

Ответить | Правка | Наверх | Cообщить модератору

37. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +2 +/
Сообщение от Аноним (37), 17-Фев-25, 14:22 
Мультяшный голос делали из обычного ещё в дремучие годы, ускоряя плёнку.
Ответить | Правка | К родителю #17 | Наверх | Cообщить модератору

39. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (17), 17-Фев-25, 14:26 
> Мультяшный голос делали из обычного ещё в дремучие годы, ускоряя плёнку.

Я неправильно выразился. Тут нужен скорее не столько мультяшный, сколько "птичий" голос. Или трескучий, или "петушиный" голос, с резким различием высоты тона для ударных и безударных слогов. Примерно как espeak с задранным значением -P:

espeak -v Storm -p 99 -P 199 "Senior citizens, have, priority!"

Ответить | Правка | Наверх | Cообщить модератору

41. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (17), 17-Фев-25, 14:31 
>> Мультяшный голос делали из обычного ещё в дремучие годы, ускоряя плёнку.
> Я неправильно выразился. Тут нужен скорее не столько мультяшный, сколько "птичий" голос.
> Или трескучий, или "петушиный" голос, с резким различием высоты тона для
> ударных и безударных слогов. Примерно как espeak с задранным значением -P:
> espeak -v Storm -p 99 -P 199 "Senior citizens, have, priority!"

Или еще лучше:

espeak -w /tmp/input.wav -v Storm -p 99 -P 199 "Senior citizens, have, priority!"
sox /tmp/input.wav /tmp/output.wav pitch 300
aplay /tmp/output.wav

Ответить | Правка | Наверх | Cообщить модератору

18. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от bOOster (ok), 17-Фев-25, 13:22 
И все равно точно голос все эти поделки клонировать не могут.
Ответить | Правка | Наверх | Cообщить модератору

20. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (-), 17-Фев-25, 13:29 
Тенденция чтобы могло, если не сейчас и не у них так у других, и если не сейчас так позже.
Ответить | Правка | Наверх | Cообщить модератору

25. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +5 +/
Сообщение от Аноним (27), 17-Фев-25, 13:45 
Могут уже достаточно чтобы разводить людей мошенниками. Таких случаев полно уже не первый год. Особенно, когда звонят "родственники", которые оказались в сложном положении своим 80-летним бабушкам, которые бегут снимать миллионы. Одна южная "страна" очень хорошо в этом преуспела.
Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

87. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Андрей (??), 18-Фев-25, 11:41 
Но качество за пять лет нехилое
Ответить | Правка | К родителю #18 | Наверх | Cообщить модератору

22. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Уууууъъъ (?), 17-Фев-25, 13:34 
Архитектурная диаграмма понравилась, красиво!
Ответить | Правка | Наверх | Cообщить модератору

26. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (27), 17-Фев-25, 13:46 
Можно подумать там что-то понял.
Ответить | Правка | Наверх | Cообщить модератору

24. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +5 +/
Сообщение от Аноним (27), 17-Фев-25, 13:43 
> Для работы рекомендуется наличие GPU NVIDIA как минимум серии 3000 с 6 Гб видеопамяти.

Т.е. недоступно для большинства людей.

А бесплатно онлайн есть?

Ответить | Правка | Наверх | Cообщить модератору

38. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (9), 17-Фев-25, 14:22 
>недоступно для большинства

Ну самые доступные с 6gb gddr6 это GeForce RTX 3050, также есть Intel Arc A380.

Ответить | Правка | Наверх | Cообщить модератору

72. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (72), 17-Фев-25, 21:08 
> А бесплатно онлайн есть?

А сам-то как думаешь, будет ли кто-то держать кучу серваков с мощными GPU за бесплатно?

Вам прогу написали, натренировали, под открытой лицензией на блюдечке выложили, а вы "хочу бесплатно!". Совсем уже зажрались...

Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

73. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (9), 17-Фев-25, 21:19 
Как Лян Вэньфэн, который заявил, что создал DeepSeek всего за $6 млн.
https://3dnews.ru/1117636/
Ответить | Правка | Наверх | Cообщить модератору

75. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (72), 17-Фев-25, 22:41 
> А бесплатно онлайн есть?

Да, 100 бесплатных минут в месяц, дальше за деньги:

https://playground.zyphra.com/audio

Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

102. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –2 +/
Сообщение от Аноним (102), 18-Фев-25, 19:39 
300$ — космическая цена, да.
RTX 3060 на первом месте в стиме.
Ответить | Правка | К родителю #24 | Наверх | Cообщить модератору

103. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (27), 18-Фев-25, 20:42 
Это действительно большие деньги даже для Москвы. Просто кто-то умеет их считать, а кто-то спускает всё в кофе\бары\рестораны\игрушки\железо и живёт 29 дней в месяце на дошираке.
Ответить | Правка | Наверх | Cообщить модератору

104. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (102), 18-Фев-25, 21:36 
Видеокарту не каждый день покупают. И «спустить» раз в пару-тройку лет 300$ на видеокарту — не значит жить на дошираке, даже для РФ, даже для провинции (кстати, на дошираке жить крайне невыгодно).
Ответить | Правка | Наверх | Cообщить модератору

114. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (27), 19-Фев-25, 05:22 
> на дошираке жить крайне невыгодно

На фриганство перешел? По контейнерам лазишь? Хмм... а стоит ли оно того, чтобы ради видеокарты так опускаться по социальной лестнице)

Ответить | Правка | Наверх | Cообщить модератору

117. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (102), 19-Фев-25, 12:15 
Если вам из-за покупки видеокарты за триста баксов приходится лазить по контейнерам — с социальной лестницы падать уже некуда.
Ответить | Правка | Наверх | Cообщить модератору

31. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от mustai (ok), 17-Фев-25, 13:53 
> монотонной (как в аудиокнигах)

Такие аудиокниги невозможно долго слушать.

Ответить | Правка | Наверх | Cообщить модератору

44. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (44), 17-Фев-25, 15:19 
Блин, а можно было хотя бы не такую тупую фразу составлять на семпле?
Ответить | Правка | Наверх | Cообщить модератору

47. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +3 +/
Сообщение от Аноним (47), 17-Фев-25, 16:16 
всё это кончиться : "Мама, ты позвонила и сказала если придёт дядя Петя - передать ему деньги..  дядя Петя   приходил  , я деньги передала . дядя просил передать тебе спасибо!"
Ответить | Правка | Наверх | Cообщить модератору

48. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +2 +/
Сообщение от Ivan7 (ok), 17-Фев-25, 16:20 
Т.е. нам нужно минимум GPU RTX 4080 для работы в реальном времени, и при этом комп будет греться и шуметь как не в себя)) Т.е. надо ставить мини электростанцию рядом! Спасите планету!!!
Ответить | Правка | Наверх | Cообщить модератору

88. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от Андрей (??), 18-Фев-25, 11:42 
И что ? Аудиокниги начитывать и с задержкой можно
Ответить | Правка | Наверх | Cообщить модератору

99. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +2 +/
Сообщение от Аноним (68), 18-Фев-25, 14:48 
> Аудиокниги начитывать

У вас для аудиокниг, а у кого-то для обмана доверчивых пожилых людей.

Ответить | Правка | Наверх | Cообщить модератору

115. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Андрей (??), 19-Фев-25, 08:26 
>> Аудиокниги начитывать
> У вас для аудиокниг, а у кого-то для обмана доверчивых пожилых людей.

Так и что - не будет этой штуки останутся другие тысяча и один способ "обмана пожилых людей". Тут уж извините, но тут ничем не помочь, кроме как разъяснительными беседами с пожилыми людьми и доведения до них информации о том, что нужно быть осторожными или вовсе убеждать в том, что нельзя поднимать звонки с незнакомых номеров и пр. Поэтому конечно крутые нейронки увеличивают риски, но с другой стороны я бы рекомендовал больше за LLMки беспокоится, ибо голос ещё нужно скопировать, а вот в ролевую LLMку уже сейчас можно вгрузить фотки и инфу из соц сетей, так, что она в "вайбере", "ватцапе" может дурить родственников, так, что с трудом получится отличить от оригинала, не переходя на совсем уж личные темы. Ну и в целом, опять же - чтобы не дурили по телефону, нужно просто на белые списки переходить, дабы у и без того "непонятно кого", даже возможности не было предложить каверзные услуги или обмануть как-то иначе.

Ответить | Правка | Наверх | Cообщить модератору

53. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (53), 17-Фев-25, 16:58 
> "Для работы рекомендуется наличие GPU NVIDIA как минимум серии 3000 с 6 Гб видеопамяти!"

А как же владельцы карт от AMD?

Ответить | Правка | Наверх | Cообщить модератору

54. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –3 +/
Сообщение от Аноним (54), 17-Фев-25, 17:03 
Им для начала надо стать владельцами ВИДЕОКАРТЫ, а не Радеона.
Ответить | Правка | Наверх | Cообщить модератору

61. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +4 +/
Сообщение от ЛщЛ (?), 17-Фев-25, 18:03 
> Им для начала надо стать владельцами ВИДЕОКАРТЫ, а не Радеона.

А они и так самые настоящие владельцы видеокарт, а не комбаина для майнинга крипты и нейронок.

Ответить | Правка | Наверх | Cообщить модератору

109. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от огнемётные казни (?), 18-Фев-25, 22:11 
Но ведь радеоны не игровые! Они для запуска этих ваших вейляндов. И то под вопросом.
Ответить | Правка | Наверх | Cообщить модератору

89. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Андрей (??), 18-Фев-25, 11:44 
Ну готовый докер образ разворачивает докеровский pytorch под cuda - под ocl/vulkan pytorch придётся разворачивать самому
Ответить | Правка | К родителю #53 | Наверх | Cообщить модератору

111. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (111), 19-Фев-25, 01:09 
Переписывать под себя, естественно.
cuda на амд будет никогда, так что ручками всё, ручками
Ответить | Правка | К родителю #53 | Наверх | Cообщить модератору

60. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (62), 17-Фев-25, 18:00 
"Для работы рекомендуется наличие GPU NVIDIA как минимум серии 3000 с 6 Гб видеопамяти."

А чо, рыксы от AMD совсем в пролёте? А как жи рыксы опенсорснее и лучше под линуксами?

Или опенсорс такой дружный, что не может договориться друг с другом?

Ответить | Правка | Наверх | Cообщить модератору

63. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +2 +/
Сообщение от Аноним (63), 17-Фев-25, 18:27 
Ну так ты попробуй разобраться. Потыкать по ссылочкам, увидеть torch, нагуглить, работает ли он с AMD ROCm
Ответить | Правка | Наверх | Cообщить модератору

70. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (68), 17-Фев-25, 19:57 
Главное чтоб не вышло, когда что-то делают во благо или ради интереса, а потом это попадает в злые руки. В общем, опасная тенденция.
Ответить | Правка | Наверх | Cообщить модератору

79. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (79), 18-Фев-25, 01:37 
Уже попало, а почему это плохо?
Ответить | Правка | Наверх | Cообщить модератору

80. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –4 +/
Сообщение от Аноним (80), 18-Фев-25, 03:06 
Мне почему-то печально немного видеть такие комменты на wannabe-технарском сайте. Если тут такое происходит, то что ждать от простого населения, не жаждущего tech-stuff.

Или это такая интервенция политиков в it. Со страхов сноса правительств, и старых схем управления они пошли строчить комменты нейросетками по всему интернету.

Ответить | Правка | К родителю #70 | Наверх | Cообщить модератору

96. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (68), 18-Фев-25, 14:41 
Если бы ты не был таким приземлённым и думал не только о ближайших месяцах, то понял бы, почему умные люди беспокоятся о будущем — о годах и даже десятилетиях.
Ответить | Правка | Наверх | Cообщить модератору

90. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Андрей (??), 18-Фев-25, 11:55 
Почти любую вещь можно использовать как во зло так и во благо - вопрос только меры и воспитания.
Ответить | Правка | К родителю #70 | Наверх | Cообщить модератору

110. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от огнемётные казни (?), 18-Фев-25, 22:14 
Why so serious?
Ответить | Правка | К родителю #70 | Наверх | Cообщить модератору

74. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от Аноним (74), 17-Фев-25, 22:24 
Давайте угадаем с одного раза завезли ли русский язык
Ответить | Правка | Наверх | Cообщить модератору

76. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (72), 17-Фев-25, 22:56 
> Давайте угадаем с одного раза завезли ли русский язык

Давайте будем читать дальше заголовка.

Ответить | Правка | Наверх | Cообщить модератору

77. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (77), 18-Фев-25, 01:26 
Кому он нужен?
Ответить | Правка | К родителю #74 | Наверх | Cообщить модератору

81. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –1 +/
Сообщение от Аноним (80), 18-Фев-25, 03:07 
Кто заказал, тому завезли.
Ответить | Правка | К родителю #74 | Наверх | Cообщить модератору

78. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +4 +/
Сообщение от Аноним (79), 18-Фев-25, 01:34 
Хорошо что таки "опасные" вещи выкладываются в паблик, ибо они разрушают штуки куда более опасные, например аутентификацию голосом.
Ответить | Правка | Наверх | Cообщить модератору

82. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –3 +/
Сообщение от Аноним (80), 18-Фев-25, 03:17 
Представляете, как можно сегодня влиять на общественное мнение подобными разработками. Раньше-то было это не так сложно всё устроить. Тем, у кого есть ресурсы, конечно.

Идет всё ко "входу в интернет по паспорту", и "ограничению иностранного влияния в нашем сегменте"

Ответить | Правка | Наверх | Cообщить модератору

91. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Дарт Линус (?), 18-Фев-25, 12:00 
Какая-то у вас рекурсия.
Ответить | Правка | Наверх | Cообщить модератору

97. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +1 +/
Сообщение от Аноним (68), 18-Фев-25, 14:44 
> входу в интернет по паспорту

И это правильно, так и должно быть. Это для твоего же блага, потому что слишком много свободы — это плохо, и если бы ты немного подумал, то сам бы всё понял.

Ответить | Правка | К родителю #82 | Наверх | Cообщить модератору

94. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (94), 18-Фев-25, 13:44 
Аутенртификация голосом вообще ужасная идея с точки зрения опсека, как и все биометрические формы в прочем, из которых голосом - худшая.
Ответить | Правка | К родителю #78 | Наверх | Cообщить модератору

112. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  –2 +/
Сообщение от prokoudine (ok), 19-Фев-25, 02:33 
Иные биометрические формы "взломать" можно только методом ректального криптоанализа. Что прекрасно работает и с другими формами аутентификации.
Ответить | Правка | Наверх | Cообщить модератору

85. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (84), 18-Фев-25, 04:44 
Ну 30 секунд не показатель. 5+ лет назад уже представили сетку клонирующую голос за 5 секунд

https://www.youtube.com/watch?v=0sR1rU3gLzQ

Ответить | Правка | Наверх | Cообщить модератору

92. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Андрей (??), 18-Фев-25, 12:01 
Там была более примитивная модель, которая выдавала качественный результат по сути только на черрипиках, а по сути только на удачном тексте и достаточно похожем на голоса из выборки, в противном случае получалось очень плохо. Собственно говоря это как был так и пока остаётся только хороший маркетинг, но на деле обобщающие способности моделей довольно так себе. Собственно в данном случае ведь не случайно подсовывают голос трампа в примерах, ровно как пару лет назад на конференции Путина тоже показывали перетюненый фейк, но что пять лет назад, что сейчас пока модели довольно средние. Единственное, что удивляет - это поющая suno, в ней реально генерятся довольно крутые вещи, в том числе с голосом.
Ответить | Правка | Наверх | Cообщить модератору

98. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (68), 18-Фев-25, 14:46 
Оно работало чуть более, чем никак. Так, просто пруф оф концепт.
Ответить | Правка | К родителю #85 | Наверх | Cообщить модератору

101. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (101), 18-Фев-25, 17:41 
В этих 5 секундах, ложечка дегтя. И там же в видео говорится, что они достигли этого за счёт "тонны" аудио образцов с речью людей.

Если данная технология Zonos использует меньший объём тренировочных данных, но за счёт более умного алгоритма выруливает отсутствие такого же количества образцов, но она более передовая.

Ответить | Правка | К родителю #85 | Наверх | Cообщить модератору

116. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (116), 19-Фев-25, 09:39 
Kokoro TTS звучит приятней, и работает практически на всём, ресурсов жрет минимум
Ответить | Правка | Наверх | Cообщить модератору

118. "Опубликована AI-модель синтеза речи Zonos, поддерживающая кл..."  +/
Сообщение от Аноним (118), 19-Фев-25, 17:19 
Ну все теперь не определишь бот тебе звонит или спамер. Спамер человек плохо, но это хотя бы человек. Бот может 24/7 этим заниматься.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру