Вариант для распечатки |
Пред. тема | След. тема | ||
| Форум Разговоры, обсуждение новостей | |||
|---|---|---|---|
| Изначальное сообщение | [ Отслеживать ] | ||
| "Использование zip-бомбы для борьбы с вредоносными web-ботами" | +/– | |
| Сообщение от opennews (??), 30-Апр-25, 08:17 | ||
Последнее время значительно возросла активность web-ботов, индексирующих трафик. Помимо корректно работающих ботов распространение получили "неистовые" боты, игнорирующие правила индексирования robots.txt, лезущие с десятков тысяч разных IP, притворяющиеся легитимными пользователями и не придерживающиеся разумной политики интенсивности отправки запросов. Данные боты создают огромную паразитную нагрузку на серверы, нарушают нормальную работоспособность систем и отнимают время администраторов. Активность подобных ботов воспринимается многими как вредоносные действия... | ||
| Ответить | Правка | Cообщить модератору | ||
| Оглавление |
| Сообщения | [Сортировка по ответам | RSS] |
| 1. Сообщение от Аноним (1), 30-Апр-25, 08:17 | +49 +/– | |
> так как при случайной индексации подобной ловушки ботом Google | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #3, #29 | ||
| 3. Сообщение от Аноним (3), 30-Апр-25, 08:28 | +6 +/– | |
Имелось ввиду, что если накосячишь с настройкой ловушки и она по ошибке сработает для Google Bot, то мало не покажется. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #1 Ответы: #6 | ||
| 4. Сообщение от Tron is Whistling (?), 30-Апр-25, 08:29 | +/– | |
Добавят в ботов лимит на размер содержимого, и всё. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #10, #11 | ||
| 5. Сообщение от нитгитлистер (?), 30-Апр-25, 08:29 | –11 +/– | |
эмм а что это за содержимое такое на 100 тб? типа набор рандомных случайных данных? или все серии ванписа?)) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #8, #23, #101 | ||
| 6. Сообщение от Tron is Whistling (?), 30-Апр-25, 08:29 | +12 +/– | |
У бота гугла до сих пор нет лимитов на размер загружаемого содержимого? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #3 Ответы: #7, #118 | ||
| 7. Сообщение от Вася (??), 30-Апр-25, 08:35 | +5 +/– | |
так это будет в лимита загрузки, но вне лимита распаковки | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #6 Ответы: #27 | ||
| 8. Сообщение от Аноним (8), 30-Апр-25, 08:35 | +12 +/– | |
/dev/zero, написано же | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #5 | ||
| 9. Сообщение от qqq (??), 30-Апр-25, 08:37 | –14 +/– | |
Когда я лет 7 назад такого бота делал, оно качало только текст и видео/аудио с новостных сайтов. Соответственно всякие zip, gz и тп оно не качало. На некоторых добрых сайтах даже особо разбирать html не нужно было, просто можно было понять как у них систематизированы видео-текст и просто перебирать .../1.html .../1.mp4 или как-то так. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #17, #76 | ||
| 10. Сообщение от n00by (ok), 30-Апр-25, 08:39 | +15 +/– | |
Так и лимит на количество запросов могли бы добавить, но чего-то не хватило. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 Ответы: #14 | ||
| 11. Сообщение от Аноним (3), 30-Апр-25, 08:41 | –1 +/– | |
Полный размер становится известен только после распаковки. Отдаётся вполне себе небольшой файл, укладывающийся в лимиты. Степень сжатия в таком файле может быть как 1:10 так и 1:1000000. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #4 Ответы: #20, #21 | ||
| 13. Сообщение от Аноним (13), 30-Апр-25, 08:44 | –2 +/– | |
> На практике предложенный метод применять не рекомендуется, так как сайт может быть занесён Google в чёрный список и начнёт помечаться вредоносным в браузере Chrome с включённым режимом "Safe Browsing". | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #37 | ||
| 14. Сообщение от Аноним (3), 30-Апр-25, 08:45 | +1 +/– | |
Новомодные боты лезут с разных IP, не большой 10-20 запросов с одного. Лезут из Китая, Вьетнама, Бразилии. На днях фильтровал AI-ботов и только список /24 подсетей составил около 5000 строк за день. Всего под сотню тысяч разных IP было, непонятно где они их берут, на ботнет не походит. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #10 Ответы: #46, #145 | ||
| 15. Сообщение от Аноним (15), 30-Апр-25, 08:46 | –13 +/– | |
Народ так еще и не понял, что дешевле отдать контент, чем городить все эти "защиты". | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #18, #28, #51, #134, #154 | ||
| 16. Сообщение от Fbekwbshru (?), 30-Апр-25, 08:48 | –1 +/– | |
99% ботов не умеет в сжатие контента | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #25, #68, #72, #87 | ||
| 17. Сообщение от Аноним (3), 30-Апр-25, 08:49 | +9 +/– | |
Когда ты запрашиваешь .html сервер отдаёт его тебе сжатым, если браузер выставляет заголовок "Accept-Encoding: deflate, gzip, brotli...", а сервер поддерживает сжатие. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #9 Ответы: #126 | ||
| 18. Сообщение от bergentroll (ok), 30-Апр-25, 08:52 | +5 +/– | |
У вас сайт просто приляжет, если безграничное кол-во скриптов будет его выкачивать целиком. Можно будет контент себе с локалхоста на локалхост щедро отдавать. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #15 Ответы: #30 | ||
| 19. Сообщение от Аноним (23), 30-Апр-25, 08:55 | +/– | |
глупость какая, если бот распаковывает архив, то он может в заголовке архива посмотреть оригинальный размер содержимого и не распаковывать его | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #22, #24, #52 | ||
| 20. Сообщение от Tron is Whistling (?), 30-Апр-25, 08:55 | +/– | |
Не "после", а "во время". Плюс распаковка потоковая, весь контент читать не обязательно. Но это слишком сложно, я понимаю. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #11 | ||
| 21. Сообщение от Tron is Whistling (?), 30-Апр-25, 08:57 | +2 +/– | |
Хотя в принципе могу понять, считать целиком, потом загнать в распаковку - старая добрая привычка скриптеров, вообще не понимающих, что делают. Им и положено страдать от таких zip-"бомб", пусть страдают :) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #11 | ||
| 22. Сообщение от Tron is Whistling (?), 30-Апр-25, 08:58 | +4 +/– | |
Там нет "архива" и нет "размера содержимого". | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #19 | ||
| 23. Сообщение от Аноним (23), 30-Апр-25, 08:58 | +7 +/– | |
Рандомные данные плохо сжимаются, хороши сжимаются повторяющиеся данные - в данном случае нули. Архиватор представит 0000....000 виде "0:количество" | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #5 Ответы: #26, #143 | ||
| 24. Сообщение от tty2 (?), 30-Апр-25, 09:01 | +1 +/– | |
Вы только заголовок прочитали? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #19 | ||
| 25. Сообщение от Tron is Whistling (?), 30-Апр-25, 09:03 | +5 +/– | |
Есть подозрение, что написаны оные на нодежсах с пыхтонами, которые просто вызовы библиотек "скачай мне это" - там васянская библиотека сама попробует распаковать, с немного предсказуемым результатом. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #16 | ||
| 26. Сообщение от нитгитлистер (?), 30-Апр-25, 09:03 | +2 +/– | |
> Рандомные данные плохо сжимаются, хороши сжимаются повторяющиеся данные - в данном случае | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #23 | ||
| 27. Сообщение от Tron is Whistling (?), 30-Апр-25, 09:07 | +3 +/– | |
Распаковка по-хорошему производится по мере загрузки. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #7 | ||
| 28. Сообщение от ddd123 (-), 30-Апр-25, 09:09 | +1 +/– | |
>Если стоит задача получить дамп, они думают что "мусорные" данные кого-то остановят? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #15 Ответы: #31, #32, #79 | ||
| 29. Сообщение от Аноним (29), 30-Апр-25, 09:16 | +4 +/– | |
Пункт 1 на Диком Западе: Шериф всегда прав. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #1 Ответы: #157 | ||
| 30. Сообщение от anonymous (??), 30-Апр-25, 09:19 | –4 +/– | |
Ну если сайт кладёт кнопку "скачать" за пейвол, то не удивительно, что посетители скачивают текст скриптами. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #18 Ответы: #33, #102 | ||
| 31. Сообщение от Аноним (31), 30-Апр-25, 09:20 | +13 +/– | |
Только их защита не только от ботов но и от пользователей работает к сожалению. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #28 Ответы: #39, #77 | ||
| 32. Сообщение от anonymous (??), 30-Апр-25, 09:20 | +11 +/– | |
> И я использую cloudflare, их защита от ботов реально работает. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #28 Ответы: #163, #175 | ||
| 33. Сообщение от bergentroll (ok), 30-Апр-25, 09:23 | +3 +/– | |
> Ну если сайт кладёт кнопку "скачать" за пейвол, | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #30 Ответы: #44 | ||
| 34. Сообщение от Соль земли (?), 30-Апр-25, 09:36 | +2 +/– | |
> сайт может быть занесён Google в чёрный список | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
35.
Сообщение от Аноним (35), 30-Апр-25, 09:48
| +2 +/– | |
Новые Дон Кихоты и Санчо Пансы на борьбу с ботами вышли) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #62, #90 | ||
| 36. Сообщение от Аноним (36), 30-Апр-25, 09:49 | +3 +/– | |
Это всё AI-скрейперы, корпорации тренируют модели нового поколения. Ставьте себе Anubis, его создал хитрый жук, и у него есть ещё и хитрый план: https://github.com/TecharoHQ/anubis/discussions/258#discussi... | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #61, #93 | ||
| 37. Сообщение от Аноним (37), 30-Апр-25, 10:03 | –2 +/– | |
> Показать какой администратор умный? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #13 Ответы: #38, #41, #42, #45 | ||
| 38. Сообщение от Аноним (38), 30-Апр-25, 10:11 | +7 +/– | |
> Ибо предполагает, что авторы ботов настолько дураки | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #37 Ответы: #43 | ||
| 39. Сообщение от Аноним (39), 30-Апр-25, 10:25 | –2 +/– | |
Ага. Если случайно попал, пройдя по ссылке - тут же закрыть, не глядя. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 | ||
| 41. Сообщение от qwe (??), 30-Апр-25, 10:32 | +/– | |
Наивные методы таки работают, хоть и не всегда. Простой пример защиты от спам-ботов: спам-боты часто не видят html-комментарии. Защита банальна: сунуть скрытое поле формы внутрь html-комментария и проверить, кто это поле передаст в post запросе. Браузеры такое поле в тело post запроса не передадут, а боты - вполне, ибо не разбирают DOM-дерево, а юзают регулярки. Не со всеми прокатывает, но со многими. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #37 Ответы: #215 | ||
| 42. Сообщение от Аноним (42), 30-Апр-25, 10:33 | +/– | |
Ну забью нулями посередине документа,или другим паттерном легитимного html. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #37 Ответы: #49 | ||
| 43. Сообщение от n00by (ok), 30-Апр-25, 10:34 | +1 +/– | |
Ну он и не догадался, что после <!DOCTYPE html> можно отправлять пробелы... | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #38 Ответы: #47 | ||
| 44. Сообщение от anonymous (??), 30-Апр-25, 10:35 | –1 +/– | |
читать даёт постранично, скачать целиком - нет. Очевидно возникает желание всё равно эту информацию скачать. Раньше для этого использовался scrapbook, но теперь он не совместим с принципами файерфокс, и скрапить приходится питоном | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #33 | ||
| 45. Сообщение от Аноним (-), 30-Апр-25, 10:36 | –1 +/– | |
> Ибо предполагает, что авторы ботов настолько дураки, что не додумаются при потоковой распаковке добавить проверку содержимого | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #37 Ответы: #48 | ||
| 46. Сообщение от n00by (ok), 30-Апр-25, 10:42 | –9 +/– | |
IP разные, а запросы одинаковые, потому и получается фильтровать. 100 тысяч IP, подозреваю, даже особо активный Аноним Опеннет может нагенерировать с двух телефонов. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #14 Ответы: #50, #56 | ||
| 47. Сообщение от Аноним (37), 30-Апр-25, 10:44 | +/– | |
> Ну он и не догадался, что после <!DOCTYPE html> можно отправлять пробелы... | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #43 Ответы: #78 | ||
| 48. Сообщение от Аноним (37), 30-Апр-25, 10:47 | +/– | |
> Как эта проверка может выглядеть? Первый байт контента нулевой? Или надо проверить первые 1000 байт? И чё? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #45 Ответы: #59, #83, #121 | ||
| 49. Сообщение от Аноним (37), 30-Апр-25, 10:49 | +/– | |
> Ну забью нулями посередине документа,или другим паттерном легитимного html. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #42 | ||
| 50. Сообщение от Аноним (50), 30-Апр-25, 10:54 | +16 +/– | |
Я не особенно активный аноним, но мне очень интересно, как сгенерить 100 000 ipv4 с двух телефонов. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #46 Ответы: #96, #202 | ||
| 51. Сообщение от Аноним (50), 30-Апр-25, 10:57 | +1 +/– | |
Я всё отдал бы, у меня зеркало Слаквари, но боты весь месячный трафик за пару дней высасывают. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #15 Ответы: #71 | ||
| 52. Сообщение от pfg21 (ok), 30-Апр-25, 11:00 | +/– | |
в распаковку еще надо внести код учитывающий зип-бомбы :) обычно такого нет. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #19 Ответы: #70 | ||
| 53. Сообщение от Аноним (53), 30-Апр-25, 11:05 | +/– | |
Банишь все ASN с type == Hosting и наслаждаешься тишиной на сайте :) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #63, #176 | ||
| 56. Сообщение от Аноним (3), 30-Апр-25, 11:27 | +/– | |
Запросы все разные, с разных реалистичных User Agent. Боты индексируют разные страницы без повторов и вся свора ботов синхронизирована (видимо задания на загрузку формируются заранее и распределяются). Без штук типа anubis от реальных пользователей их не отличишь. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #46 Ответы: #69 | ||
| 59. Сообщение от Аноним (3), 30-Апр-25, 11:36 | +/– | |
> Или ты думал, они все куском распаковывают, а уже потом пытаются понять, | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #48 | ||
| 60. Сообщение от Аноним (60), 30-Апр-25, 11:38 | –4 +/– | |
> может быть занесён Google в чёрный список | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 61. Сообщение от Аноним (-), 30-Апр-25, 11:43 | +/– | |
> Это всё AI-скрейперы, корпорации тренируют модели нового поколения. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #36 Ответы: #109 | ||
| 62. Сообщение от Аноним (62), 30-Апр-25, 11:47 | +/– | |
Ну, мой ответ прост - внешний сайт перевести тупо на статику, оставив только приветственную картинку как делают многие китайцы работающие с внешним миром, если не хватает канала - ограничить каждый ip парочкой соединений(чем не гнушается даже гитхаб), можно даже с шейпингом для особо ретивых, или каптчу по превышении количества запрошенных ресурсов. У меня подобные боты быстро вспоминают, что такое интернет на скорости 2 кбод. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #35 Ответы: #107 | ||
| 63. Сообщение от Аноним (62), 30-Апр-25, 11:50 | +3 +/– | |
не все боты живут на бесплатных фермах гугл лабс и амазон. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #53 Ответы: #162 | ||
| 64. Сообщение от Аноним (64), 30-Апр-25, 11:51 | +/– | |
Я так понимаю речь идёт о конторе Netcup которая долбит тысячами запросов в секунду с разных ipv6 на сайты которые закрыты через клаудфларе. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 66. Сообщение от Аноним (62), 30-Апр-25, 11:54 | +/– | |
Вопрос, кто тут еще самый умный буратина: | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #155 | ||
| 68. Сообщение от Аноним (37), 30-Апр-25, 12:00 | +1 +/– | |
> 99% ботов не умеет в сжатие контента | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #16 Ответы: #94 | ||
| 69. Сообщение от 678 (?), 30-Апр-25, 12:02 | –2 +/– | |
Почему? боты аля-curl не грузят всякие css, как триггер геморно, но можно. с селениумами сложнее, но в целом тоже можно..половина сайтов современных выдает кучу уведомлений, от куки до рекламы, или около рекламы, так что большая часть страницы перекрывается, бот этот попап закрывать не станет, а юзер да - и если бот посмотрел страницу и ничего не закрыл, то для нового запроса можно бан или последнее китайское, в общем не вижу проблемы. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #56 Ответы: #75, #119 | ||
| 70. Сообщение от Аноним (37), 30-Апр-25, 12:03 | –1 +/– | |
Это вообще не проблема, ибо данные распаковываются потоково. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #52 Ответы: #89 | ||
| 71. Сообщение от Аноним (-), 30-Апр-25, 12:04 | +/– | |
> Я всё отдал бы, у меня зеркало Слаквари, но боты весь месячный трафик | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #51 Ответы: #104, #146 | ||
| 72. Сообщение от Аноним (-), 30-Апр-25, 12:05 | +5 +/– | |
> 99% ботов не умеет в сжатие контента | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #16 | ||
| 75. Сообщение от Аноним (75), 30-Апр-25, 12:32 | +4 +/– | |
>бот этот попап закрывать не станет | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #69 | ||
| 76. Сообщение от Ося Бендер (?), 30-Апр-25, 12:33 | +8 +/– | |
В некоторых странах шариата таким умникам руку могут отрубить, так-что будь осторожен, я тебя предупредил. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #9 Ответы: #122 | ||
| 77. Сообщение от Аноним (37), 30-Апр-25, 12:35 | +/– | |
> Только их защита не только от ботов но и от пользователей работает к сожалению. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #31 Ответы: #115 | ||
| 78. Сообщение от Аноним (78), 30-Апр-25, 12:38 | +5 +/– | |
С вероятностью 99.99% там нет никакой потоковой обработки, зовётся метод на петоне (как вариант на go) в параметрах урл, в ответе распакованный ответ. Вот в распакованном ответе внезапно может случится терабайт пробелов.. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #47 Ответы: #160 | ||
| 79. Сообщение от Аноним (79), 30-Апр-25, 12:40 | –1 +/– | |
Если еще проблемы нет с багами в Cloudflare, как это было недавно, когда они написали, что откатились, решают проблему, а по факту - нет. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #28 | ||
| 82. Сообщение от Tester (??), 30-Апр-25, 12:47 | +/– | |
и что.. ну умрет один fork у бота, ядрое его пристрелит. дальше то все по прежнему будет работать | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 83. Сообщение от Аноним (83), 30-Апр-25, 12:51 | +1 +/– | |
Следующий шаг - делать архив не из нулей, а из повторяющегося триллионы раз легитимного заголовка файла (например, того же самого <!DOCTYPE html>). Файлик не сильно больше получится. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #48 Ответы: #120 | ||
| 84. Сообщение от Аноним (84), 30-Апр-25, 12:59 | +/– | |
а почему бы не переключать их на dev/random ? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #88, #91, #139 | ||
| 86. Сообщение от Аноним (88), 30-Апр-25, 13:22 | +1 +/– | |
Каждое поколение обречено придумывать зип бомбы вновь и вновь. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #136 | ||
| 87. Сообщение от Аноним (87), 30-Апр-25, 13:24 | +/– | |
Тем, кто не прислал вменяемый Accept-Encoding, можно сразу 400 отдавать. Это точно и не человек, и не полезный бот. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #16 | ||
| 88. Сообщение от Аноним (88), 30-Апр-25, 13:24 | +/– | |
Читать дев рандом и отдавать клиенту - проигрышно по ресурсам, по сравнению с затратами клиента. Сервер выполнит в 2 раза больше работы, чем клиент. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #84 | ||
| 89. Сообщение от YetAnotherOnanym (ok), 30-Апр-25, 14:36 | +2 +/– | |
Если после первого же такого документа бот отвалится от сайта - задача выполнена. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #70 | ||
| 90. Сообщение от YetAnotherOnanym (ok), 30-Апр-25, 14:49 | +/– | |
> В наш век, нейронки выкачивают через ботов весь интернет | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #35 Ответы: #98 | ||
| 91. Сообщение от YetAnotherOnanym (ok), 30-Апр-25, 14:54 | +1 +/– | |
> а почему бы не переключать их на dev/random ? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #84 | ||
| 93. Сообщение от MinimumProfit (?), 30-Апр-25, 15:18 | +/– | |
Anubis - это гадость, не пускает на сайт Гнома. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #36 Ответы: #97, #105, #110, #144, #148, #185 | ||
| 94. Сообщение от Fbekwbshru (?), 30-Апр-25, 15:30 | –1 +/– | |
Делал эту бомбу много лет назад, периодически смотрю логи. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #68 Ответы: #113 | ||
| 95. Сообщение от YetAnotherOnanym (ok), 30-Апр-25, 15:32 | +1 +/– | |
Порадовали рассуждения ботовладельцев о детектировании зип-бомб. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #99, #125, #127, #150 | ||
| 96. Сообщение от _ (??), 30-Апр-25, 15:38 | +8 +/– | |
Сейчас будет танец "ви таки меня не так поняли" :) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #50 | ||
| 97. Сообщение от Котэ (?), 30-Апр-25, 15:48 | +1 +/– | |
Включи жабоскрипт | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #93 Ответы: #111 | ||
98.
Сообщение от Олег (??), 30-Апр-25, 16:00
| +/– | |
ААА, все пропало, гипс снимают, клиент уезжает. Все эти... плохие парни со своими ИИ скоро положат весь интернет. Срочно всех заблокировать! | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #90 Ответы: #153 | ||
| 99. Сообщение от Аноним (99), 30-Апр-25, 16:05 | +/– | |
Какая-то чушь, если честно. У воркера вполне ограниченные ресурсы на работу и он не станет долбиться вечно. Если что не так, добавляем сайт в чёрный список и удаляем из выдачи. Чтобы вернуть, платите деньги потом. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #95 Ответы: #100, #114 | ||
| 100. Сообщение от Аноним (99), 30-Апр-25, 16:08 | +/– | |
А ведь корпы могут позволить себе перераспределить немного ресурсов, чтобы долбить умников посильнее. Ещё в большем минусе останутся. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #99 | ||
| 101. Сообщение от Я (??), 30-Апр-25, 16:14 | +/– | |
да хоть карта с местонахождением ванписа. главное чтоб жалось хорошо. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #5 | ||
| 102. Сообщение от Я (??), 30-Апр-25, 16:18 | +/– | |
щас бы нейрокравлеров посетителями называть.. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #30 | ||
| 103. Сообщение от Ivan_83 (ok), 30-Апр-25, 16:20 | +1 +/– | |
Есть и другие способы. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #206 | ||
| 104. Сообщение от Я (??), 30-Апр-25, 16:24 | +/– | |
ну сейчас по сути любое среднее зеркало которое хотя как-то индексируется в интернете и хостится на сервисе с месячным лимитом траффика. потому что в отличие от пользователей аи боты качают всё подряд некоторые ещё и по несколько раз а потом часто даже не смотрят в эти данные или не понимают их и качают снова. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #71 | ||
| 105. Сообщение от аноним43481234 (?), 30-Апр-25, 16:29 | +1 +/– | |
пустило же | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #93 | ||
| 106. Сообщение от Аноним (106), 30-Апр-25, 16:30 | +1 +/– | |
Просто несимметричную задачу на 5 секунд. Типа запрос на человека появляется только после решения этой задачи. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 107. Сообщение от Я (??), 30-Апр-25, 16:33 | +/– | |
да тут какбы можно и клаудфлейровскую защиту купить если у тебя высоконагруженный комерческий сервис, а вот когда ты малый вебсервер держишь который тебе денег много не приносит то ты чем всё это оплатишь? веселее челам у которых невысоконагруженные аписервисы на облаках с оплатой за запрос хостятся так что пользователи никогда за месячную бесплатную квоту не выбиваются, а аишные боты запросами за минуту могут всю квоту выбить.. и радуйся если у тебя было настроено отключение по достижению лимита иначе потом можно получить счёт на несколько тысяч долларов. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #62 Ответы: #117, #135 | ||
| 108. Сообщение от Аноним (106), 30-Апр-25, 16:34 | +/– | |
Бот Просто организует исключение на размер ответа. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #132 | ||
| 109. Сообщение от Аноним (36), 30-Апр-25, 16:40 | +/– | |
Альтернатива? Критиковать-то мы все горазды. Я лично знаю только три: 1. опять чёрные/белые списки, и в итоге туда попадают вообще невиновные; 2. опять капча; 3. платить денюжку. Я уж лучше подожду пока меня Анубис пустит. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #61 Ответы: #184, #198 | ||
| 110. Сообщение от Аноним (36), 30-Апр-25, 16:42 | +/– | |
Какой браузер? У меня даже на древнем планшете с Android 5 открывается в Fennec, пусть и с тормозами, а на домашнем компе вообще за 2 сек. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #93 Ответы: #140 | ||
| 111. Сообщение от Аноним (36), 30-Апр-25, 16:45 | +/– | |
Да, наверняка нет жабоскрипта и куки напрочь отключены. Хардкор, короче. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #97 Ответы: #141 | ||
| 113. Сообщение от Аноним (113), 30-Апр-25, 16:55 | +3 +/– | |
> Делал эту бомбу много лет назад, периодически смотрю логи. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #94 | ||
| 114. Сообщение от YetAnotherOnanym (ok), 30-Апр-25, 16:59 | +/– | |
> удаляем из выдачи | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #99 Ответы: #116 | ||
| 115. Сообщение от anonymous (??), 30-Апр-25, 17:05 | +/– | |
Ну вот вы сами восстанавливаете пользователей против себя. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #77 Ответы: #123, #137 | ||
| 116. Сообщение от Аноним (99), 30-Апр-25, 17:20 | +/– | |
То-то и оно, детишкам подгадить сможешь чуть (которые и не могли быть проблемой), зато следом прилетит сполна. Вполне по заслугам. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #114 | ||
| 117. Сообщение от Аноним (118), 30-Апр-25, 17:20 | +/– | |
> а вот когда ты малый вебсервер держишь который тебе денег много не приносит то ты чем всё это оплатишь? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #107 Ответы: #124 | ||
| 118. Сообщение от Аноним (118), 30-Апр-25, 17:33 | +1 +/– | |
В том-то и дело, что есть, и не только на размер. И если любая защита срабатывает — значит сайт и у обычного пользователя тоже нормально работать не будет, значит и рекомендовать пользователям посещать этот сайт не нужно. Все такие подозрительные урлы в поисковом индексе в итоге помечаются как вредоносные, а по достижению определённого лимита вредоносным помечается весь домен. На этом в принципе можно и попрощаться, убрать домен из списка вредоносных может занять несколько месяцев. Если это мелкий магазин, как было у моего клиента, то может оказаться дешевле провести ребрендинг и сменить название, чем держать склад без движения. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #6 Ответы: #151, #152 | ||
| 119. Сообщение от Аноним (118), 30-Апр-25, 17:36 | +1 +/– | |
> бот этот попап закрывать не станет | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #69 Ответы: #172, #200 | ||
| 120. Сообщение от Аноним (118), 30-Апр-25, 17:42 | +/– | |
Проверять отношение сжатого к несжатому перед распаковкой ещё во времена фидо придумали, когда зип-бомбы получили такую популярность. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #83 Ответы: #129 | ||
| 121. Сообщение от Grand (?), 30-Апр-25, 17:43 | +/– | |
Распаковывается nate.html , а в нем 100 млн раз повторен большой морской загиб Петра Великого. Чем это тебе поможет ?? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #48 | ||
| 122. Сообщение от _ (??), 30-Апр-25, 17:50 | +/– | |
И что ты ему сделаешь? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #76 | ||
| 123. Сообщение от Аноним (118), 30-Апр-25, 17:50 | +/– | |
> Пользователь плачется, что он каждый день убивает десяток минут жизни совокупно на преодоление клаудвафл | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #115 | ||
124.
Сообщение от Олег (??), 30-Апр-25, 17:52
| +/– | |
Держишь сайт для себя - так заблоч их всех нафиг. Здесь друзья-девопсы кучу рецептов выложили. Другой вопрос - компания, фирма. Хотят они чтоб о них нейронки знали или нет. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #117 Ответы: #169 | ||
| 125. Сообщение от Аноним (144), 30-Апр-25, 17:53 | +/– | |
> рассуждения ботовладельцев о детектировании зип-бомб | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #95 | ||
| 126. Сообщение от Аноним (126), 30-Апр-25, 17:56 | +3 +/– | |
Зачем подсказываете? Пусть бы дальше собирал "данные для обучения моделей" :) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #17 | ||
| 127. Сообщение от Grand (-), 30-Апр-25, 17:58 | +1 +/– | |
Можно стстистические справочники отдавать,в селичинами подкорректированными процентов на 20 в произвольную сторону. Чтоб у них нейронки галлюцинировали. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #95 Ответы: #128 | ||
| 128. Сообщение от Аноним (144), 30-Апр-25, 18:18 | –1 +/– | |
> Можно стстистические справочники отдавать,в селичинами подкорректированными процентов | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #127 | ||
| 129. Сообщение от Аноним (-), 30-Апр-25, 18:47 | +/– | |
Я не знаю сообщают ли http заголовке о размере распакованного body, но даже если они сообщают, то сервер может наврать об этом, и потом клиент радостно будет распаковывать. И я заверяю тебя, он будет распаковывать до конца, потому что Postel's law: "be conservative in what you send, be liberal in what you accept". | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #120 Ответы: #168 | ||
| 130. Сообщение от Grey Croco (?), 30-Апр-25, 18:53 | +1 +/– | |
Кстати , тут промелькнула здравая идея - вместо зип-бомб отдавать про то, что: Американцев не было на луне ,ВИЧ - был разработан ЦРУ , про прикладную эфиродинамику и всемирный заговор релятивистов, про то, что масоны заставили Рузвельта плыть по канализации в рамках обряда инициации, от чего он и захворал поиломелилитом . В общем, всю чушь, Весь СПИД-инфо - чтоб нейросети натренировались на всякой гадости.. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #133, #138, #147, #207 | ||
| 132. Сообщение от Аноним (144), 30-Апр-25, 19:12 | +/– | |
Ну можно зашифровать, zip бомбу, под нечто стандартное. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #108 | ||
| 133. Сообщение от Аноним (62), 30-Апр-25, 19:52 | +/– | |
было уже. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #130 | ||
| 134. Сообщение от Аноним (-), 30-Апр-25, 19:57 | +/– | |
> Народ так еще и не понял, что дешевле отдать контент, чем городить все эти "защиты". | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #15 Ответы: #205 | ||
| 135. Сообщение от Аноним (62), 30-Апр-25, 20:04 | +/– | |
>а вот когда ты малый вебсервер держишь который тебе денег много не приносит то ты чем всё это оплатишь? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #107 | ||
| 136. Сообщение от Аноним (-), 30-Апр-25, 20:06 | +/– | |
> Будет нагрузка 100-1000 rps (вместо привычных 0-1) в зависимости от времени дня. Что тогда? Тоже зип бомбы? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #86 | ||
| 137. Сообщение от Аноним (137), 30-Апр-25, 20:08 | +/– | |
> Ну вот вы сами восстанавливаете пользователей против себя. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #115 Ответы: #210 | ||
| 138. Сообщение от Аноним (144), 30-Апр-25, 20:29 | –1 +/– | |
> чтоб нейросети натренировались на всякой гадости. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #130 | ||
| 139. Сообщение от Аноним (144), 30-Апр-25, 20:33 | +/– | |
Чтобы создать /dev/random, нужно куда больше процессорных мощностей чтобы создать /dev/zero. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #84 | ||
| 140. Сообщение от Ан Оним (?), 30-Апр-25, 20:53 | –1 +/– | |
Яндекс Бр. Из Андроида открывает, а из Linux - нет | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #110 Ответы: #170 | ||
| 141. Сообщение от Ан Оним (?), 30-Апр-25, 20:55 | +/– | |
Всё включено. Просто виснет | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #111 | ||
| 143. Сообщение от Аноним (143), 30-Апр-25, 21:08 | +/– | |
Вот только в реальности архиватор потатил 80+ метров диска на хранение 100ТБ *нулей*. Похоже, что sparse-файлы не такая уж плохая идея (как минимум, для больших и однородных данных). И упаковка/распаковка почти бесплатная. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #23 Ответы: #158 | ||
| 144. Сообщение от Аноним (144), 30-Апр-25, 21:19 | +/– | |
Открывается из IOs, Safari. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #93 | ||
| 145. Сообщение от Аноньимъ (ok), 30-Апр-25, 21:27 | –1 +/– | |
Новые крипто"тапалки" появились. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #14 Ответы: #203 | ||
| 146. Сообщение от Аноним (-), 30-Апр-25, 21:29 | +/– | |
> Что за зеркало такое лажовое что ему боты траф высаживают? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #71 Ответы: #159 | ||
| 147. Сообщение от Аноним (31), 30-Апр-25, 22:06 | +/– | |
Легче просто отдавать им идеалы коммунизма. Может чему и научаться :) | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #130 Ответы: #161 | ||
| 148. Сообщение от Аноним (148), 30-Апр-25, 22:23 | +/– | |
>Anubis - это гадость, не пускает на сайт Гнома. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #93 | ||
| 150. Сообщение от Аноним (148), 30-Апр-25, 22:34 | +/– | |
О нет, вы догадались о страшнейшей защите от ботов, перед которым дрогнет любой CDN. О нет, я не могу раскрыть корпоративный секрет, что таким простым способом вы сможете справится самостоятельно. Вот чёрт, я проболтался | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #95 | ||
| 151. Сообщение от Tron is Whistling (?), 01-Май-25, 00:54 | +/– | |
Если такая защита срабатывает на х***ю, которую обычный пользователь не закачает никогда - эта защита - полная х***я и чисто рекламный ход. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #118 Ответы: #177 | ||
| 152. Сообщение от Tron is Whistling (?), 01-Май-25, 00:55 | –2 +/– | |
> весь домен. На этом в принципе можно и попрощаться, убрать домен | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #118 Ответы: #167 | ||
| 153. Сообщение от Аноним (153), 01-Май-25, 01:07 | +1 +/– | |
>Хотим мы или нет - ИИ это действительность | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #98 | ||
| 154. Сообщение от fuggy (ok), 01-Май-25, 01:14 | +/– | |
Так дешевле соблюдать robots.txt и рейт-лимит. Но что-то "умные" боты до этого не додумались. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #15 | ||
| 155. Сообщение от fuggy (ok), 01-Май-25, 01:26 | +/– | |
Ты из каких будешь? Или продавец платных защит от хостера? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #66 | ||
| 156. Сообщение от Аноним (156), 01-Май-25, 05:13 | +/– | |
Следующим этапом, в новостях: | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 157. Сообщение от Аноним (-), 01-Май-25, 07:19 | +2 +/– | |
> Пункт 1 на Диком Западе: Шериф всегда прав. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #29 | ||
| 158. Сообщение от Аноним (-), 01-Май-25, 07:24 | –3 +/– | |
> Вот только в реальности архиватор потатил 80+ метров диска на хранение 100ТБ | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #143 Ответы: #197 | ||
| 159. Сообщение от Аноним (-), 01-Май-25, 07:36 | +/– | |
> Бот легко может твой сайтик выкачивать каждые шесть часов. И таких ботов | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #146 | ||
| 160. Сообщение от GG (ok), 01-Май-25, 10:25 | +/– | |
С такой же вероятностью этот скрипт запускается гипервизором с лимитом памяти на процесс. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #78 Ответы: #165 | ||
| 161. Сообщение от Аноним (144), 01-Май-25, 10:54 | +1 +/– | |
> отдавать им идеалы коммунизма. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #147 | ||
| 162. Сообщение от Аноним (42), 01-Май-25, 12:07 | +/– | |
Вы таких от обычных пользователей только по поведению самого юзер-агента можете отличить. Идея (под)резать ASN откуда не будет стучаться злой на медленную закачку клиент намного адекватнее звучит, чем превращать свой сайт в неиндексируемую помойку из белых страниц с ссылками на js. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #63 Ответы: #171 | ||
| 163. Сообщение от Аноним9000 (?), 01-Май-25, 12:27 | +/– | |
Меня кстати клаудфларь меньше всех достает. Зачастую нужно просто галочку поставить и никаких ребусов не решать. Хуже всех в РФ этом отношении Яндекс: даже аутентифицированному мне может выдать три капчи подряд | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #32 Ответы: #209 | ||
| 165. Сообщение от Аноним (165), 01-Май-25, 14:53 | +/– | |
И будет выкачивать этот файл падать | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #160 Ответы: #166 | ||
| 166. Сообщение от GG (ok), 01-Май-25, 15:28 | +/– | |
> И будет выкачивать этот файл падать | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #165 Ответы: #204 | ||
| 167. Сообщение от Аноним (118), 01-Май-25, 15:31 | +/– | |
Если вашего бизнеса нет в выдаче самого популярного поисковика в мире, значит вашего бизнеса нет и в интернете. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #152 Ответы: #174 | ||
| 168. Сообщение от Аноним (118), 01-Май-25, 15:35 | +/– | |
Это не сервер передаёт, это в заголовке компрессии указывается. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #129 Ответы: #196 | ||
| 169. Сообщение от Аноним (118), 01-Май-25, 15:39 | +/– | |
Держу сайт для всех, но не «компания, фирма». Мелкий частный бизнес в одно лицо. С клаудфларью нет проблем вообще. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #124 | ||
| 170. Сообщение от Аноним (118), 01-Май-25, 15:42 | +/– | |
С васянофорками всегда только проблемы. Не надо ими пользоваться. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #140 | ||
| 171. Сообщение от Аноним (118), 01-Май-25, 15:45 | +/– | |
Поинтересуйся сколько стоит residential proxy. Их на вес продают. Поэтому что-то там по ASN фильтровать — только память под фильтр впустую тратить. Скрейпинг не вчера в openai придумали, с этой ветряной мельницей интернет борется уже десятилетия. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #162 | ||
| 172. Сообщение от OpenEcho (?), 01-Май-25, 17:32 | +1 +/– | |
> Мои и закрывают, | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #119 Ответы: #180 | ||
| 173. Сообщение от OpenEcho (?), 01-Май-25, 17:37 | +/– | |
Что только не придумают, лиж бы не учится... | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Ответы: #178, #181 | ||
| 174. Сообщение от Tron is Whistling (?), 01-Май-25, 19:22 | –1 +/– | |
Хреновый у вас бизнес. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #167 Ответы: #179 | ||
| 175. Сообщение от Аноним (175), 01-Май-25, 19:40 | +/– | |
У меня они один-два раза галочку показывают и пропускают. А вот, если гугловская встретится... Ну что же, пара минут выборов велосипедов обеспечены, ибо, в первые попытки обязательно попросят "попробовать снова", пусть всё и правильно выбрано | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #32 | ||
| 176. Сообщение от Аноним (175), 01-Май-25, 21:04 | +/– | |
Иди с такими предложениями, ты так пользователей с впн отрежешь, а им почти все пользуются сейчас, по понятным причинам | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #53 | ||
| 177. Сообщение от Аноним (118), 01-Май-25, 21:17 | –1 +/– | |
Ты наверное не очень хорошо представляешь с каким скамом приходится иметь дело поисковым системам. Есть множество частных случаев, но общий подход такой: если на странице есть хоть что-то нестандартное, странное (для произвольных определений странности — это мегабайты кода, буквально), и даже отдалённо напоминающее попытки манипуляций поисковой выдачей, то сайт начинает «тонуть» по рейтингу, при чём чем больше срабатываний, тем быстрее. Поэтому совет от гуру пикапа: брать кунг с лючком, и не совать на свои страницы ничего эдакого, особенно «х***ю, которую обычный пользователь не закачает никогда», если сайт нужен для ведения бизнеса. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #151 | ||
| 178. Сообщение от Аноним (178), 01-Май-25, 21:19 | +/– | |
>--dport 80 | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #173 Ответы: #193 | ||
| 179. Сообщение от Аноним (118), 01-Май-25, 21:21 | +/– | |
Я не жалуюсь, на сытую жизнь в недешёвой стране хватает и ещё остаётся. Но раз ты говоришь хреновый, завтра же займусь ликвидацией и вернусь обратно работать на какого-нибудь провайдера за зарплатку. У меня правда в резюме перерыв в почти десять лет которые я нигде и никем не числился, думаешь хотя бы джуном возьмут? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #174 Ответы: #182 | ||
| 180. Сообщение от Аноним (118), 01-Май-25, 21:37 | +/– | |
Я и не прятался. Занимаюсь скрапингом давно и не думаю бросать. Сабж и прочие жалкие попытки защитить от невидимых угроз никому не нужные сайты считаю смехотворными. Как и большую часть местных комментариев в духе «так их, иродов!». С анубисом или без, 99% сайтов не представляют для скрапинга никакого коммерческого интереса, и попасть туда можно только по ошибке. Эти безумные ИИ боты тоже скоро научатся игнорировать весь шлак. И обходить «защиты» тоже. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #172 Ответы: #194 | ||
| 181. Сообщение от Аноним (118), 01-Май-25, 21:57 | +/– | |
Мой бот прямо сейчас качает сайт какой-то местечковой продуктовой сети, вместе со всеми ассетами, с 400 _разных_ айпи-адресов, принадлежащих каким-то людям проживающим в том регионе. Качается сайт с понедельника по несколько часов в день, к воскресенью должен уже закончить. Сайт за CloudFlare, кстати (это к впросу об эффективности противодействия). Ни один айпишник не был забанен и не упёрся в капчу. С такими лимитами как у тебя я бы и быстрее управился наверное. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #173 Ответы: #186, #195 | ||
| 182. Сообщение от Tron is Whistling (?), 01-Май-25, 22:20 | +/– | |
Да, займись, всё какое-то занятие. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #179 Ответы: #183 | ||
| 183. Сообщение от Аноним (118), 01-Май-25, 23:19 | +/– | |
Посмотрел сколько на деле платят сеньорам в FAANG (куда меня даже джуном вряд ли возьмут), и передумал ликвидироваться. Лучше с хреновым бизнесом, зато сыт и в тепле, чем вкалывать по 40-50 часов в неделю за эту «достойную оплату труда». | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #182 | ||
| 184. Сообщение от Аноним (-), 02-Май-25, 05:52 | +/– | |
> Альтернатива? Критиковать-то мы все горазды. Я лично знаю только три: 1. опять | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #109 | ||
| 185. Сообщение от Аноним (-), 02-Май-25, 05:53 | +/– | |
> Anubis - это гадость, не пускает на сайт Гнома. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #93 | ||
| 186. Сообщение от Аноним (186), 02-Май-25, 12:51 | +/– | |
А зачем это качать? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #181 Ответы: #201, #211 | ||
| 193. Сообщение от OpenEcho (?), 02-Май-25, 16:34 | +/– | |
> Так только себя можно заблочить. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #178 | ||
| 194. Сообщение от OpenEcho (?), 02-Май-25, 16:39 | +/– | |
> Я и не прятался. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #180 | ||
| 195. Сообщение от OpenEcho (?), 02-Май-25, 16:43 | +/– | |
> Качается сайт с понедельника по несколько часов в день | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #181 | ||
| 196. Сообщение от Аноним (-), 02-Май-25, 18:15 | +/– | |
Речь о Accept-Encoding: deflate. Это rfc1951, ты можешь открыть его и поискать там что-нибудь про заголовки. У меня есть подозрение, что gz encoding имеет какие-то заголовки и сложнее, чем deflate, но deflate совершенно точно не имеет никаких заголовков, это тупо поток байт для декомпрессии. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #168 | ||
| 197. Сообщение от Аноним (197), 02-Май-25, 19:24 | +/– | |
Речь о том, что для представления 100ТБ однородных байт в виде "[01]:количество" нужно 48 бит. 1 бит хранит двоичное "0 или 1" и 47 бит хранит число байт (минимально адресуемое) - 10^14 (~2^47). То есть 6 байт должно быть достаточно. А получилось в миллион раз больше. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #158 | ||
| 198. Сообщение от Аноним (197), 02-Май-25, 19:31 | +/– | |
Аутентификация парой ключей, секретный выдаётся по паспорту. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #109 | ||
| 200. Сообщение от Аноним (200), 02-Май-25, 19:41 | +/– | |
>> бот этот попап закрывать не станет | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #119 | ||
| 201. Сообщение от Аноним (-), 02-Май-25, 19:46 | +/– | |
> А зачем это качать? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #186 Ответы: #212 | ||
| 202. Сообщение от Admino (ok), 02-Май-25, 21:11 | +/– | |
Он просто путает соединения и IP. Он просто неграмотный. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #50 | ||
| 203. Сообщение от 0xdeadbee (-), 03-Май-25, 08:41 | +/– | |
> Чел ставит себе на комп | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #145 | ||
| 204. Сообщение от Аноним (-), 03-Май-25, 09:27 | +/– | |
>> И будет выкачивать этот файл падать | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #166 | ||
| 205. Сообщение от Аноним (-), 03-Май-25, 09:29 | +/– | |
> О, ты из тех, кто надеется изменить общественное мнение? Так они тоже | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #134 | ||
| 206. Сообщение от Аноним (-), 03-Май-25, 09:34 | +/– | |
> Есть и другие способы. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #103 | ||
| 207. Сообщение от Аноним (-), 03-Май-25, 09:41 | +/– | |
> , про прикладную эфиродинамику и всемирный заговор релятивистов, про то, что | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #130 | ||
| 209. Сообщение от anonymous (??), 05-Май-25, 13:23 | +/– | |
А вы попробуйте заблокировать доступ к канвасу, чтобы фингрепринтинг не ходил. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #163 | ||
| 210. Сообщение от anonymous (??), 05-Май-25, 13:28 | +/– | |
> или какойй-то васянофорк Хрома | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #137 | ||
| 211. Сообщение от Аноним (118), 05-Май-25, 19:11 | +/– | |
Конкурирующая сеть заплатила за слив каталога и апдейт инфы в течение полугода. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #186 | ||
| 212. Сообщение от Аноним (118), 05-Май-25, 19:12 | +/– | |
Клаудфларь задолбать так же просто, как её не задалбывать. Это совершенно не интересно. Я это делаю за деньги. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #201 | ||
| 214. Сообщение от Аноним (214), 07-Май-25, 13:15 | +/– | |
А если бот не распаковывает? А если бот достаточно умный, чтоб проверить степень сжатия, напр? А если бот просто игнорирует сжатые файлы? Тогда что? | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 215. Сообщение от Аноним (215), 09-Май-25, 03:13 | +/– | |
Шел 2025 год, а люди так и не поняли почему нельзя парсить html регулярками. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| Родитель: #41 | ||
|
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
|
Закладки на сайте Проследить за страницей |
Created 1996-2025 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |