Компания Mozilla в рамках проекта Bergamot приступила к созданию системы машинного перевода, работающей на стороне браузера. Проект позволит интегрировать в Firefox самодостаточный движок перевода страниц, не обращающийся к внешним облачным сервисам и обрабатывающий данные исключительно на системе пользователя. Главной целью разработки является обеспечение конфиденциальности и защита данных пользователя от возможных утечек при переводе содержимого открываемых в браузере страниц...Подробнее: https://www.opennet.me/opennews/art.shtml?num=51718
Ну чёт полезное для разнообразия. Может даже не впустую попилят.
>самодостаточный движок перевода страниц, не обращающийся к внешним облачным сервисам и обрабатывающий данные исключительно на системе пользователяСколько этот движок будет весить? Терабайт или два?
Без терабайт памяти и петабайтов дискового пространства как у гугла/бинга, мозила сделает ПРОМТ-2020.
В лучшем случае.
>Mozilla развивает собственную систему машинного перевода
>>Сколько этот движок будет весить? Терабайт или два?Смотря как часто с ним разговаривать будеш.
*терабайтолионов и петабайтолионов. И вообще, эти байты можно было отдать пенсионерам и детям!
>ПРОМТ-2020Будто гуглопереводчик от оного далеко ушел.
На самом деле далеко. Причём, относительно недавно. Буквально за последний год уровень перевода в несколько вырос.
>сделает ПРОМТ-2020.Один раз переводил им руководство с материнки, получалось хорошо, для перевода надо пополнять словарь или изменять приоритет переводов слов.
Единственное чего там не хватало это удобного комплексного редактора словаря позволяющего сделать словарь содержащий только слова из переводимого текста(словарь всё равно подгоняется под текст, а так его будет удобно просматривать).
Если Мозилла сделает что либо такое и ещё сделает онлайн сервис для обмена словарями настроенными для перевода конкретных текстов то у ценителей может даже и гуглотранслятор забороть.
Новости не любишь читать, да?Гугл уже реализовал такое в ТЕЛЕФОНЕ. Оно не стучится в интернет и всё работает. Вылазий с криокамеры
не все работает - а довольно паршиво работает. интернет для аппа нужен, иначе хреновато переводит, важные вещи нельзя переводить. не так чтобы с интернетом лучше словаря на длине фраз работал, часто намного хуже. но все же
Чай с бергамотом довольно полезен.
>Разработку финансирует Евросоюз в рамках гранта, полученного по программе Horizon 2020. Размер гранта составляет три миллиона евро. Проект рассчитан на три года. В Mozilla открыта вакансия специалиста по системам машинного обучения для участия в разработке движка для перевода с одного языка на другой.Проще говоря - пилят грант.
Почему сразу пилят?
Потому что надо было похвастаться знанием устойчивого словосочетания "пилить гранты", а тут такой случай подвернулся.
потому что - этот проект не подразумевает готового результата, просто бумажные отписки от изысканиях.
Mozilla еще ни разу не завалила не один свой проект, все что она разрабатывали работало, другое дело, что монетизировать нормально они не смогли ни Firefox OS, ни Firefox Hello, ни Pocket (пока еще живой).
>монетизировать нормально они не смогли ни зонды, ни бэкдоры, ни данные пользователейСтранно, у гугла вроде получилось. Может быть стоило браузером заниматься в первую очередь?
У Гугла тоже полно провальных проектов и которые они закрыли
Эти мастера по закапыванию
>три миллиона евро. Проект рассчитан на три года.Это три с половиной разработчика на полное время.
Что вы ожидаете в результате? Скайнет?
>> три миллиона евро. Проект рассчитан на три года.
> Это три с половиной разработчика на полное время.Даже интересно стало, где и какие разработчики получают 70+ тыс. евро в месяц...
На этих двух разработчиков нужно пару менеджеров, пару аналитиков, тестировщики, еще и менеджер, а над ним еще менеджер...ну всё как обычно...
Миллион за год? Это три билла гейтса, что-ли?
Потому что сначала получили грант, а потом стали искать тех, кто это сможет сделать.
>Почему сразу пилят?Потому что 3 млн евро VS 1 вакансия.
Вдобавок, у мазилки своих денег достаточно, чтобы лишнего прогера взять. Так что налицо: планов решить эту задачу НЕТ. :(
Завидуйте молча
Очень круто, интересно и полезное дело.
Проект амбициозный ... но Мозилле сейчас бы браузер не протерять, не то что новые проеты пилить.
А это с прицелом на интеграцию в браузер. Убивают двух зайцев: во-первых, паритет с Хромом (там перевод есть, в Firefox пока нет, а это минуc), во-вторых, выгодное отличие от Хрома для тех, кто ценит приватность.
Ага, лишь бы осилили они эту задачу.. а то у них банально может не получиться довести до готового продукта
ну в яндексе есть свой перевод( браузер), но он и как гугл переводит онлайн. хотя мобильная версия вроде как может автономно. но тут нечто посложнее пилят. не чистый переводчик.
Им бы лучше чем-то полезные заняться чем браузер пилить. Браузер у них уже не получился.
Браузер у них получился. Но не взлетел из-за одной компании на букву Г, которая может себе позволить соррть деньгами нанраво и налево, если выхлоп от них - разорение конкурентов.
Ну, если их унесёт с браузера на всякие переводы, распознавания голоса и подобное - лично я (как давно сбежавший на pale moon) буду только рад и даже донейтить им начну - в отличие от браузеров в этом плане ничего открытого толком нет, и, опять же в отличие от браузеров, это не та тема, где всё достаточно хорошо, чтобы при нужде лет пять посидеть на старье, как я на той же опере 12 сидел.
Не потеряет. Там же rust (вторая часть - юмор)
Вот бы они для разнообразия развивали собственный браузер!
Я вот непойму, когда Mozilla развивает браузер все пищат: "НЕЕЕЕЕТ!! Верните как было!", а когда занимается чем то другим все ноют: "Нууууу!! Лиш бы браузером не заниматься!"
Это потому что ты путаешь развитие браузера и ломку пользовательских привычек хрен пойми зачем.
То вам розвитие подавай или сохранение традицый?
Вон опера насохранялась...
Если б они только движки апдейтили (а ещё лучше - при этом толком разнесли бы движки, какое-то минимальное ядро и аддоны, в которых и держали бы 90% морды) - это было бы развитие. Начиная с того, чтобы, например, пользователь для синхронизации аккаунта мог свой аддон подключить, работающий с конкретным хранилищем.А то, что они делают - это даже не "шаг вперёд, два шага назад", а какие-то безумные прыжки в неизвестном направении. С ддругой стороны их современные "сторонние" затеи - движок умного дома, голосовой софт, вот эта инициатива - довольно интересны и не направлены на то, чтобы угробить уже существующий вполне живой продукт.
> Я вот непойму, когда Mozilla развивает браузер все пищат: "НЕЕЕЕЕТ!! Верните как
> было!", а когда занимается чем то другим все ноют: "Нууууу!! Лиш
> бы браузером не заниматься!"Потому что она не развивает, а ломает. Ну, то есть, я тут даже не лицемерю ни капли, потому что с версии 68 он у меня просто перестал работать вообще. Окно стартует, заголовок окна рисуется, и где-то секунды через две, он вытягивает на себя 100% ЦПУ, и на этом всё заканчивается. Я его, для общей работоспособности системы, ограничил в 75%, чтобы не ставил систему раком, и подождал пару суток -- не прочихался.
Собирал с оптимизацией и без, дегуглифицировал, играл с параметрами -- хер, эффект один. Забил и сижу на eww большей частью, иногда вылезая в Хромиум. Будет время, запущу под дебаггером, а пока это всё дохлый номер.
> Проект позволит интегрировать в Firefox самодостаточный движок перевода страниц
> БД для русского языка занимает 637MB в сжатом виде и...Удачи!
Это база с примерами для обучения нейросети. Не такая уж и большая.
А зачем они переводчик от людей спрятали?
Чтобы аналитки на ОпенНете не опробовали раньше времени недоделанную систему и не начали орать "вот фигня же полная, деньги распилили, лучше бы браузер допиливали, мозила подыхает, всё плохо".
наверное, потому что там нужно API key вводить
который стоит денег
есть получить бесплатные, например, у того же яндекса translate.yandex.ru/developers/keys
Бесплатно - только насадка в мышеловке.
Потому что он не работает, только ошибки одни
> А зачем они переводчик от людей спрятали?Матом кроет всех, покашто.
Лестно и чудесно, что движков полно. Базы-то, базы где возьмут? (ежли чо, Paracrawl это не то)
На базе баз в базовой комплектацыи.
Проект сольется, как и другие потуги могиллы, можете скринить.
А браузер развивать когда начнут?!
Уже поздно пусть лучше занимаются чем-нибудь полезными. Например машинным обучением.
А есть конкретные предложения?
1. Быстро парсить закладки при импорте, а не зависать на 2-3 минуты от 3-5к закладок
2. Показывать в разрешениях сайта ВСЕ разрешения, а не как сейчас. Что бы что-нибудь изменить, нужно лезть в "информацию о странице"
3. Запилить возможность САМОСТОЯТЕЛЬНО указывать домены для контейнеров и редактировать список, вместо кликанья мышкой по всем сайтам гугла (вместо *.google.com)
4. Добавить нормальный диспетчер профилей. Просто кнопка в браузере как в хроме, а не отдельная уёбищная страница без функционала или флаг запуска
5. Не зависать от скачивания файлов буферизуемых в памяти, как с mega, например (когда в памяти, а не на диске, хранится 2 гига данных, из-за необходимости расшифровки). Не знаю как, но у хрома таких проблем нет, и вряд ли из-за того, что они архивы отправляют на свои серверы и вшивают зонды.
6. Сделать нормальную консоль разработчика. Ну хотя бы что бы когда листаю историю команд, курсор перебрасывало в самое начало кода и мне не приходилось жать ctrl+home. Ну и умный поиск свойств, что бы что-нибудь вроде document.body.qeA предлагало querySelectorAll.Этого уже было бы достаточно, что бы я начал вербовать вообще всех знакомых пересаживаться на лиса. Если кому-нибудь не всё равно - отправьте реквесты разрабам, мб вас они послушают.
Плюс нормально адекватно отключать обновление, многопроцессность, настройку не через задницу управлением дискового кеша и его перенос, освобождение памяти фоновых вкладок, запуск с ключами, жесты мыши, настраиваемый интерфейс и кнопки. Ну и нормальные классические расширения.
Ну и конечно жор памяти.
А ведь когда-то всё это было. С одной стороны я рад, что оно стало меньше тормозить, с другой, из неё выкинули всё, ради чего ей пользовались.
А что толку, что перестал тормозить?! Все, что у него было и за что его любили пользователи, у него не стало. Так зачем он такой теперь?! Для этого есть хром.
Убрать запись иконок в bookmarks.html, они только загромождают diff.
Бабло само не распилится.
> В Mozilla открыта вакансия специалиста по системам машинного обученияЧто характерно, требуется специалист отнюдь не по Rust.
Спецов по rust видимо каким-то странным образом у них и самих хватает...
Русский язык до будет? Чего там немцы смогут сваять, чтобы на русский адекватно переводило
Немцы Даль, Розенталь и Фасмер смотрят на тебя со страниц учебников удивленно.
Из перечисленных деятелей только Фасмер немец
Сын Johan Christian Dahl и July Freytag конечно русский, ага. Чистокровный. Чистота из ушей течет. Правда русский язык для него был иностранный и именно так он его изучал.Выросший в Берлине Дитмар Розенталь, сын Зигмунда Розенталя, тоже очень русский :-D
Что ты несешь, мля? Что ты несешь? Ты бы хоть немного изучил биографию трех столпов на которых держится современный русский язык.
> Сын Johan Christian Dahl и July Freytag конечно русский, ага.Сын обрусевшего датчанина и дочери коллежского асессора и "чиновника императорских театров" (жена которого, т.е. бабка Даля, известна переводами на русский язык Гесснера), родившийся, (окончивший кадет. корпус, университет, служивший и т.д.) в РИ - немец, изучавший русский язык как иностранный? o_O
> Что ты несешь, мля? Что ты несешь?
Зря стараются. Получится либо жуть, выдающая на русском подобие адекватного выражения, подменяя реально сказанное на то как выражаются у нас, либо будет кошмар и ужас прямого перевода. Вот как они могут перевести "хорошо" и "добро"? У них уже оформилось представление о добре и зле? Как они будут переводить с русского на их папуасские языки? Они же не знают что такое заимствовать слова, кроме водки. Они же так и пишут Izdeliye 30. Это над переводом надо толковый словарь целый выдать что это могло бы еще значить. Можно еще слов накидать, так что у них будет вечный сбой искуственного интеллекта, который им не скажет, что не поместится то, что больше, туда, где нет места. Вот еще слова, подтверждающие тупиковый путь развития иностранных языков. Суть, смысл, вдуматься, мысль.
Согласно статье гугла seq-to-seq давно выдавал очень недурные результаты и умел в словобразование и введение неологизмов для иностранных слов без перевода. Это всё ещё до того, как BERT появился.
Ну если добро и хорошо это одно слово, то не получится точно понять разницу. Хороший человек может просто делать все правильно и выглядеть хорошим, но не будет вести себя естественно. А вот "добро должно быть с кулаками" как он переведет это? Размышления о реальной сути происходящего натолкнули на мысль о принципиальной разнице между "хорошо быть здоровым" и "добро побеждает зло". Задолбаются переводить непереводимое.
>перевести "хорошо" и "добро"?ok/fine, изи
>представление о добре и зле
опять вы со своими выдуманными понятиями, не существует добра и зла, и машины это прекрасно понимают, если только их не научить лицемерию
>переводить с русского на их
так же как и все остальные, через английский и со стократным смысловым упрощением
Дальше пошла откровенная шизофазия - рекомендую не забывать принимать таблетки перед выходом в интернет.
Ok/fine это ближе к приемлимо и отлично. Хорошо это оценка самого человека что для него хорошо. Водку пить литрами может и приятно, но плохо для здоровья. А лекарство может и горье и неприятное, но помогает выздороветь, что хорошо. Добро тут не просто одно из высоких понятий. Человек может быть слаб после болезни и не способен себя защитить, что конечно является злом в какой-то степени. А добро это сила и если кто-то его защитит, то сделает доброе дело, потому что можно защитить и врага от укуса змеи, после чего враг может перестать быть таковым. И машины ничего не понимают, потому что нечем и даже если создать искуственный интеллект это будет просто программа, действующая в рамках известного и рационального. Упрощение это утрирование смысла, что может низвести понятие о мужчине до уровня самца в природе. Но когда нет представления о смысле, то все выглядит адекватно. Так что диагнозы вроде шизофрении ставьте себе. Переводить вопрос "как дела?", будто это приветствие, неправильно. Потому что это не совсем нормально отвечать "здравствуйте" иностранцу на вопрос. Пусть даже у них существует подмена понятий и вопрос используется как нечто, на что прямой ответ не ожидается, и "вопрос" служит лишь для формального начала разговора.
> Они же не знают что такое заимствовать слова, кроме водки.https://en.wikipedia.org/wiki/List_of_English_words_of_Russi...
Если чё, английский вообще очень толерантный язык и в нём дохренища французских и немецких слов. Я полагаю, что если поискать, то в английском можно найти слова любого языка.
Это русский язык не умеет заимствовать, потому что это же засорение языка! Духовность под угрозой! Скрепы ржавеют!
> Это русский язык не умеет заимствоватьНо панталоны, фрак, жилет
Всех этих слов на русском нет;
>> Это русский язык не умеет заимствовать
> Но панталоны, фрак, жилет
> Всех этих слов на русском нет;Это стёб был, меня просто забавляют все эти охранители языка, не замечающих, что половина "исконно русских" слов, на самом деле заимствованные слова.
нет, это не был стеб, во время написания тогда это был новомодный новояз а не часть языка
это теперь часть языка.
-Русский язык и мировые языки как правило как раз очень хорошо забирают к себе иностранные слова и понятия, и именно в этом их сила.Такое явление как "Пуризм языка" ограничивает его рост и комфорт-"уютность", но видно что в русском этого немного. В целом.
лифт это "лифт", а не "вверхподымальщик" и прочая бесконечная братия как в истинно "чистых" языках (компьютер, система, море их)
А они браузер развивать собираются? Всем что угодно маются, но не FF, который ведь когда-то всех порвал...
Уже поздно. Они пошли не той дорогой.
На той дороге деньги(монетизация) есть или есть только "спасибо" на форумах от благодарных пользователей?
На той дороге есть дерьмовый браузер. Все остальное пользователей не касается.
Посмотрим, насколько удачно будет реализовано, но дополнение очень полезное.
Они, надеюсь, это поделие сделают отдельным клиентом, а не вкорячят в браузер, а то мне как пользователю, частенько использующему переводы, как-то лучше, когда есть выбор, несекурно и неанонимно использовать онлайн переводчики, или локальные клиенты с базами от того же лингво, вместо того чтобы меня очередной раз ради вэба заставляли апгрейдить железо, будто я заправский мамкин игрун в 3д-шутаны, когда я и 3д графон на своём пк 99.9% времени не запускаю, от слова, совсем!
Хм... Вообще-то собираются именно вкорячить.
Теперь при запуске браузера будет всплывать окно, где будет рекомендовано нарастить память или сменить компьютер. После этого браузер будет закрываться.
Капитализм. Куча народа занимается одним и тем же, но раздельно. Дайте угадаю: потом будут в патентных войнах участвовать?
Проекту светлое будущее, если он будет открытым.
Так и не разобрался, как включить перевод в firefox...