|
Вариант для распечатки |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от opennews (??) on 23-Авг-16, 09:22 | ||
Лаборатория искусственного интеллекта Facebook объявила (https://code.facebook.com/posts/1438652669495149/fair-open-s.../) об открытии исходных текстов библиотеки fastText, предоставляющей средства для классификации текста с использованием методов машинного обучения. Код написан на языке C++ и открыт (https://github.com/facebookresearch/fastText) под лицензией BSD. Библиотека позволяет организовать автоматическое назначение категорий для произвольного текста, на основании предварительно проведённого обучения по наборам текстов с уже известными категориями. Например, fastText может оценить является ли письмо спамом или определить к какой категории относится статья (научная, спорт, финансы, развлечения и т.п.), после обучения по типовым базам спама и тематических статей. | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения по теме | [Сортировка по времени | RSS] |
1. "Facebook открыл код библиотеки классификации текста fastText" | +8 +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 09:22 | ||
Новости на Opennet и Хабре сразу классифицировать | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
4. "Facebook открыл код библиотеки классификации текста fastText" | +27 +/– | |
Сообщение от rob pike on 23-Авг-16, 09:45 | ||
Главное мудро выбрать классификацию. Для Опеннета подойдет такая | ||
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору |
8. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от jtad on 23-Авг-16, 10:33 | ||
to rob pike: про systemd не согласен, в остальном в точку | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
10. "Facebook открыл код библиотеки классификации текста fastText" | +6 +/– | |
Сообщение от rob pike on 23-Авг-16, 10:44 | ||
Про systemd вы согласны - либо с "нанес", либо с "улучшением". | ||
Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору |
21. "Facebook открыл код библиотеки классификации текста fastText" | +1 +/– | |
Сообщение от jtad on 23-Авг-16, 11:36 | ||
не заметил сарказма :). С улучшением конечно | ||
Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору |
19. "Facebook открыл код библиотеки классификации текста fastText" | +16 +/– | |
Сообщение от тоже Аноним (ok) on 23-Авг-16, 11:29 | ||
Маловато категорий. Незаслуженно забытые: | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
34. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 24-Авг-16, 00:20 | ||
- "Facebook открыл код ещё одной библиотеки, являющейся частью Skynet" | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
35. "Facebook открыл код библиотеки классификации текста fastText" | +1 +/– | |
Сообщение от xm (ok) on 24-Авг-16, 00:21 | ||
Про systemd "нанёс непоправимое очередное улучшение" будет точнее и правильнее :-) | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
42. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 26-Авг-16, 07:13 | ||
На коменты напустить. Классификация будет примерно такая: | ||
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору |
6. "Facebook открыл код библиотеки классификации текста fastText" | +1 +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 10:07 | ||
лучше комменты классифицировать, чтобы порядок. | ||
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору |
2. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 09:28 | ||
А иерархии тегов сайтов, сделанные этим fastText, доступны где-то в готовом виде? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
3. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от бедный буратино (ok) on 23-Авг-16, 09:43 | ||
а тип "хрень, которую и читать не стоит", там есть? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
5. "Facebook открыл код библиотеки классификации текста fastText" | +5 +/– | |
Сообщение от rob pike on 23-Авг-16, 09:57 | ||
С этим все очень и очень плохо. | ||
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору |
24. "Facebook открыл код библиотеки классификации текста fastText" | +1 +/– | |
Сообщение от cmp (ok) on 23-Авг-16, 11:59 | ||
Да ну ладно, в чем проблема построить "бинарный" классификатор? В тематических лентах новости появляются не так часто, а если пользователь жмет кнопку "еще", то значит подписывается на смежные тематики, как только перестанет, так сразу обозначит круг интересов и уровень вовлеченности. | ||
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору |
36. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 24-Авг-16, 00:23 | ||
Соцсети уже давно подсовывают посты, похожие на те, что вы чаще всего читаете, и/или из групп/пабликов, похожих на те, на которые вы подписаны. Похожесть паблика N на другие определяется либо по категориям, если они указаны, либо по тому, на что ещё подписано большинство подписчиков паблика N. | ||
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору |
37. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 24-Авг-16, 00:25 | ||
И да, можно нажать "Крестик"/"Не интересно", чтобы пост из ленты скрылся, тогда паблик получает минус к персональному скору для юзера и появляется реже, после достижения некоторого низкого значения скора – не показывается никогда. | ||
Ответить | Правка | ^ к родителю #36 | Наверх | Cообщить модератору |
43. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 26-Авг-16, 07:54 | ||
> по сути таким образом пользователю предлагается натренировать свою собственную нейросеть, | ||
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору |
7. "Facebook открыл код библиотеки классификации текста fastText" | +5 +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 10:09 | ||
Критерии такого типа неопределимы. Донцова не даст соврать. | ||
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору |
9. "Facebook открыл код библиотеки классификации текста fastText" | +1 +/– | |
Сообщение от Ivan (??) on 23-Авг-16, 10:43 | ||
Исходники донцовой будут опубликованы позже, когда она начнет проходить тест Тьюринга. А пока ценность ее свидетельств околонулевая. | ||
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору |
11. "Facebook открыл код библиотеки классификации текста fastText" | –1 +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 10:50 | ||
клоун: банальный поиск по ключевым словам теперь стал ещё быстрее. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
13. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Ан0ним on 23-Авг-16, 11:05 | ||
...а может ещё и криминал. Тут нужно осмотреть окружающие слова - контекст. | ||
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору |
14. "Facebook открыл код библиотеки классификации текста fastText" | –1 +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 11:07 | ||
клоун: для криминала будут другие ключевые слова. Один текст может иметь несколько тем. | ||
Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору |
15. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Ан0ним on 23-Авг-16, 11:19 | ||
Так и я о том же, по наличию слов дебет/кредитом нельзя однозначно сказать, что это текст по бухгалтерии. | ||
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору |
17. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Crazy Alex (ok) on 23-Авг-16, 11:27 | ||
Именно что можно. Другое дело, что это может быть кирминальная бухгалтерия, ну так это другой вопрос, решаемый отдельно. | ||
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору |
20. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 11:33 | ||
клоун: я привёл упрощённый пример. | ||
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору |
16. "Facebook открыл код библиотеки классификации текста fastText" | +8 +/– | |
Сообщение от бедный буратино (ok) on 23-Авг-16, 11:21 | ||
> Если нашёл слова "дебет", "кредит", "счёт", "отчётность", значит это "бухгалтерия". | ||
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору |
18. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Crazy Alex (ok) on 23-Авг-16, 11:28 | ||
Ну да, вот если б оно сами категории могло само формировать... | ||
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору |
|
25. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Crazy Alex (ok) on 23-Авг-16, 14:24 | ||
Ещё как нужно. Язык-то описан, только то, что реально ищешь - редко чётко куда-то попадает. Если я ищу всё о DIY-применении серводвигателей в быту - лучше, если мне ещё притащит (возможно, по просьбе) "соседнее" - шаговики, например, или соленоиды. Ну потому что функции у них иногда похожие. И вот на этом "иногда" подход через антологии и ломается. К примеру, что в других случаях для похожих задач используют вообще банки с водой (открытие форточек для теплиц). | ||
Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору |
26. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 14:58 | ||
клоун: поиск - это другая задача, более сложная по отношению к классификации. | ||
Ответить | Правка | ^ к родителю #25 | Наверх | Cообщить модератору |
27. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Crazy Alex (ok) on 23-Авг-16, 15:38 | ||
Ну так классификация нужна либо для поиска, либо для подкидывания "похожего"/"возможно интересного" - в случае Фейсбука и подобных уж точно. | ||
Ответить | Правка | ^ к родителю #26 | Наверх | Cообщить модератору |
28. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 16:41 | ||
клоун: в какую сторону расширять хочешь? | ||
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору |
29. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Crazy Alex (ok) on 23-Авг-16, 18:16 | ||
Да что попало - что рядом лежит по какой-то метрике в запрос добавить. И дать кнопочку возле каждого результата "убрать этот и похожие". В общем-то примерно так и происходит, когда гуглишь всерьёз - но когда пытаешься уточнять, руками подставляя/исключая слова, велики шансы пропустить какой-то раздел, который, в общем-то, нужен - в примере выше это были бы соленоиды, допустим. | ||
Ответить | Правка | ^ к родителю #28 | Наверх | Cообщить модератору |
30. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от анонимус (??) on 23-Авг-16, 19:38 | ||
Советую | ||
Ответить | Правка | ^ к родителю #29 | Наверх | Cообщить модератору |
32. "Facebook открыл код библиотеки классификации текста fastText" | –1 +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 21:39 | ||
клоун: где-то рядом всплывёт красный октябрь, "Охота за красным октябрём", устройство подводных лодок, а пользователь потом сидит и офигевает почему по запросу "отпуск в октябре" ему предлагают форум ветеранов-подводников. | ||
Ответить | Правка | ^ к родителю #30 | Наверх | Cообщить модератору |
33. "Facebook открыл код библиотеки классификации текста fastText" | +1 +/– | |
Сообщение от Crazy Alex (ok) on 23-Авг-16, 23:06 | ||
Ну вот поэтому на слишком общие запросы (ловить можно банально по числу подходящих страниц) дополнительное ничего добавлять не нужно. | ||
Ответить | Правка | ^ к родителю #32 | Наверх | Cообщить модератору |
23. "Facebook открыл код библиотеки классификации текста fastText" | +4 +/– | |
Сообщение от Аноним (??) on 23-Авг-16, 11:57 | ||
> к какой категории относится статья (научная... | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
31. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от adolfus (ok) on 23-Авг-16, 21:09 | ||
Прятно видеть человеческие суффиксы у файлов с исходниками. | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
38. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от АнонимХ (ok) on 24-Авг-16, 12:59 | ||
Это filename extension что ли? Чем .cc примечательнее? | ||
Ответить | Правка | ^ к родителю #31 | Наверх | Cообщить модератору |
39. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от Аноним (??) on 25-Авг-16, 01:08 | ||
Интересно, какая категория будет корнем в дереве категорий? Философия? | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
40. "Facebook открыл код библиотеки классификации текста fastText" | +1 +/– | |
Сообщение от Аноним (??) on 25-Авг-16, 07:50 | ||
>обучение fastText по базе Yahoo длится всего 5 секунд | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
41. "Facebook открыл код библиотеки классификации текста fastText" | +/– | |
Сообщение от 5kbps (ok) on 25-Авг-16, 20:24 | ||
> точность классификации 72.3%, | ||
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2024 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |