![]() |
Пред. тема | След. тема | ||
Форум Разговоры, обсуждение новостей | |||
---|---|---|---|
Изначальное сообщение | [ Отслеживать ] |
"В БД для обучения AI-моделей Common Crawl выявлено около 12 тысяч API-ключей и паролей" | +/– | ![]() |
Сообщение от opennews (??), 03-Мрт-25, 23:12 | ||
Исследователи из компании Truffle Security опубликовали результаты анализа публичного набора данных Common Crawl, используемого при обучении больших языковых моделей (например, DeepSeek). В исследовании использован декабрьский архив Common Crawl, включающий 400 терабайтов данных с содержимым 2.67 миллиардов web-страниц... | ||
Ответить | Правка | Cообщить модератору |
Оглавление |
Сообщения | [Сортировка по времени | RSS] |
1. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +12 +/– | ![]() |
Сообщение от Аноним (1), 03-Мрт-25, 23:12 | ||
Стоит заметить, что создатели оригинальной статьи поступили очень плохо и грязно, назвав её "Research finds 12,000 ‘Live’ API Keys and Passwords in DeepSeek's Training Data". Да, технически они правы, но на деле практически все современные языковые модели были обучены на CommonCrawl, это по сути самый популярный датасет для моделей вообще. Но Trufflehog, похоже, решили ещё раз показать именно в сторону Deepseek, что-то вида "вот видите, как у них всё плохо и небезопасно", так как из-за успеха Deepseek многие начали обвинять эту компанию во всех смертных грехах. | ||
Ответить | Правка | Наверх | Cообщить модератору |
![]() | ||
11. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +1 +/– | ![]() |
Сообщение от Аноним (11), 04-Мрт-25, 01:27 | ||
Нельзя поступить плохо и грязно обвиняя AI помойку в чём угодно. | ||
Ответить | Правка | Наверх | Cообщить модератору |
2. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +4 +/– | ![]() |
Сообщение от Аноним (2), 03-Мрт-25, 23:13 | ||
Классический вебдев, хоть что-то не меняется в этом мире. | ||
Ответить | Правка | Наверх | Cообщить модератору |
![]() | ||
10. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +1 +/– | ![]() |
Сообщение от Аноним (10), 04-Мрт-25, 00:42 | ||
> Классический вебдев, хоть что-то не меняется в этом мире. | ||
Ответить | Правка | Наверх | Cообщить модератору |
3. Скрыто модератором | +/– | ![]() |
Сообщение от Маняним (?), 03-Мрт-25, 23:59 | ||
Ответить | Правка | Наверх | Cообщить модератору |
4. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от Аноним (4), 04-Мрт-25, 00:03 | ||
> Наиболее часто встраиваемыми учётными данными оказались API-ключи к | ||
Ответить | Правка | Наверх | Cообщить модератору |
![]() | ||
7. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от чатжпт (?), 04-Мрт-25, 00:18 | ||
github весь завален ключами от сервисов, от s3, логины/пароли от почтовых ящиков и баз данных.. адъ и израиль. | ||
Ответить | Правка | Наверх | Cообщить модератору |
![]() | ||
9. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от Аноним (4), 04-Мрт-25, 00:38 | ||
Ну васянский С3 мало кому интересен. ценных данных там нет, разве что снесут и положат файлик "для восстановления пересылать 1.5 битка сюда". И то врядли, что тот вообще найдёт этот файлик, а если найдёт, то 1.5 битка у него нету и никогда не будет. а вот почта это спам, судя по потокам оного это комуто да интересно. | ||
Ответить | Правка | Наверх | Cообщить модератору |
5. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от Microsoft (?), 04-Мрт-25, 00:03 | ||
Мы только DeepSeek к Copilot'у прикрутили, а на вашем сайте уже крамольная статейка. | ||
Ответить | Правка | Наверх | Cообщить модератору |
6. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от Аноним (6), 04-Мрт-25, 00:08 | ||
> Mailchimp | ||
Ответить | Правка | Наверх | Cообщить модератору |
8. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | –1 +/– | ![]() |
Сообщение от Аноним (8), 04-Мрт-25, 00:33 | ||
Тогда ещё griggorii говорил что всё в мире уязвимо даже твой монитор , умная колонка или же другая вещь hdd-ssd-data я учёный cdn , диалог учёный аналитег: нет я не мошенник , но надо зарабатывать сдерем дата сет код чужой стабле machine , скажем что наш и бинари тоже или сделаем слакс и потом из этого альт или другую поделку мол не убунту основанную на дебиане за счёт именно стандартизации расширения .deb и тому подобное у. Ну и ушел в другую метадату. | ||
Ответить | Правка | Наверх | Cообщить модератору |
![]() | ||
12. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +1 +/– | ![]() |
Сообщение от Аноним (12), 04-Мрт-25, 01:29 | ||
Это какая-то очень фиговая модель. Даже Алиса выражается яснее | ||
Ответить | Правка | Наверх | Cообщить модератору |
![]() | ||
16. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от N (?), 04-Мрт-25, 02:12 | ||
Эта модель 65536 , даже плюс тебе поставила что бы ты не был доволен , как видишь эта модель не нуждается во внимании , а лишь констатирует факты. | ||
Ответить | Правка | Наверх | Cообщить модератору |
13. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от Sadok (ok), 04-Мрт-25, 01:31 | ||
"терабайтов" это что за слово? | ||
Ответить | Правка | Наверх | Cообщить модератору |
![]() | ||
14. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | –1 +/– | ![]() |
Сообщение от trolleybus (?), 04-Мрт-25, 01:37 | ||
Как там в 1987 живется, когда 640 килобайтов хватало на всех? | ||
Ответить | Правка | Наверх | Cообщить модератору |
15. "В БД для обучения AI-моделей Common Crawl выявлено около 12 ..." | +/– | ![]() |
Сообщение от Аноним (15), 04-Мрт-25, 01:47 | ||
Датасеты какие-то, второй человек в США черпает информацию из сторис в Инстаграмме. | ||
Ответить | Правка | Наверх | Cообщить модератору |
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |