The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  ВХОД  слежка  RSS
"Скачать сайт"
Вариант для распечатки Архивированная нить - только для чтения! 
Пред. тема | След. тема 
Форумы OpenNET: Виртуальная конференция (Public)
Изначальное сообщение [Проследить за развитием треда]

"Скачать сайт"
Сообщение от Bopros emailИскать по авторуВ закладки(??) on 28-Янв-05, 23:05  (MSK)
привет, народ необходимо пройти по всем ссылкам внутри одного сайта (href & img), естественно не повторяясь по ранее пройденным, плиз посоветуйте что-нибудь, идеальное php скрипт для этого, но буду рад любым предложениям
(wget -r не подходит т.к. выходит за пределы сайта)
  Рекомендовать в FAQ | Cообщить модератору | Наверх

 Оглавление

Индекс форумов | Темы | Пред. тема | След. тема
Сообщения по теме

1. "Скачать сайт"
Сообщение от yur Искать по авторуВ закладки(??) on 29-Янв-05, 01:03  (MSK)
>(wget -r не подходит т.к. выходит за пределы сайта)

читать man wget до просветления... и юзать ключики -m -L -np - далее по вкусу :)

  Рекомендовать в FAQ | Cообщить модератору | Наверх

2. "Скачать сайт"
Сообщение от Bopros emailИскать по авторуВ закладки(??) on 29-Янв-05, 11:57  (MSK)
>>(wget -r не подходит т.к. выходит за пределы сайта)
>
>читать man wget до просветления... и юзать ключики -m -L -np -
>далее по вкусу :)

да сенкс почти со всем разобрался, только вот есть одно НО
как сделать чтобы скачивалось только внутри начального сайта, не выходил за его пределы, -L есно не выходит, так как ходит он только по относительным ссылкам, а у меня внутри сайта есть абсолютные, а с --no-parent всё равно выходит за пределы

  Рекомендовать в FAQ | Cообщить модератору | Наверх

3. "Скачать сайт"
Сообщение от Bopros emailИскать по авторуВ закладки(??) on 29-Янв-05, 12:38  (MSK)
>>>(wget -r не подходит т.к. выходит за пределы сайта)
>>
>>читать man wget до просветления... и юзать ключики -m -L -np -
>>далее по вкусу :)
>
>да сенкс почти со всем разобрался, только вот есть одно НО
>как сделать чтобы скачивалось только внутри начального сайта, не выходил за его
>пределы, -L есно не выходит, так как ходит он только по
>относительным ссылкам, а у меня внутри сайта есть абсолютные, а с
>--no-parent всё равно выходит за пределы


упсс, понял в чем проблема, он с др сайтов не скачивает, а просто получается что когда заходит на страничку то там в header location стоит с другого сайта и он качает его, как сделать чтобы такого не происходило? т.е. чтобы по Location он не ходил

  Рекомендовать в FAQ | Cообщить модератору | Наверх


Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Пожалуйста, прежде чем написать сообщение, ознакомьтесь с данными рекомендациями.




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру