[ Поиск ] - [ Пользователи ] - [ Календарь ]
Полная Версия: Регулярка wget
g500
Добрый день

Подскажите как лучше сделать, по-разному пробовал и не могу найти правильное решение

Использую по крону такой запрос, чтобы обновить кеш на страницах

wget --quiet https://site.net/href.xml --output-document - | egrep -o "https://site\.net[^<]+" | wget --spider -i - --wait 0


Всё работает. Но есть и поддомены в файле href.xml. Как в одном запросе учесть чтобы обходил ссылки с поддоменами. Так не работает:

wget --quiet https://site.net/href.xml --output-document - | egrep -o "https://domen\.site\.net[^<]+" | wget --spider -i - --wait 0


Можно ли так сделать? Подскажите пожалуйста
killer8080
так попробуй
... egrep -o "https://([a-z]+\.)?site\.net[^<]+" ...



Цитата (g500 @ 27.06.2021 - 15:06)
--wait 0

а ссылок много в href.xml? А то так недолго самого себя за ddos-ить user posted image
g500
wget --quiet https://site.net/href.xml --output-document - | egrep -o "https?://[^<]+" | wget --spider -i - --wait 0

Вот так получилось. Ссылок примерно 80 000. Но там свой сервер и пока это всё для теста
Быстрый ответ:

 Графические смайлики |  Показывать подпись
Здесь расположена полная версия этой страницы.
Invision Power Board © 2001-2024 Invision Power Services, Inc.