Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Czy ktoś z Was ma pod ręką regexp/polecenie dla grepa, żeby z pliku .html wygrepować urle (wartość atrybutu src dla <img>) z pliku HTML? Googlowałem ale najlepsze rozwiązanie jakie znalazłem, wykłada się w przypadku, gdy w jednej linii pliku znajduje się kilka URLi
Offline
Znalazłem odpowiedź:
grep -ohP 'src="(.*?)"' index.html | grep -ohP 'https?://([0-9a-z\-\_\/]*\.?)*'
Offline
Próbowałeś np tak:
curl -s https://www.wp.pl |urifind | egrep '*.jpg$|*.png$|*.gif$'
Polecenie /usr/bin/urifind mam z paczki (Gentoo)
qfile `which urifind` dev-perl/URI-Find: /usr/bin/urifind
która instaluje ten moduł perla:
https://metacpan.org/pod/URI::Find
Tu masz instrukcję samego polecenia:
https://metacpan.org/dist/URI-Find/view/bin/urifind
Pliki też przeszukuje.
W Debku jest w paczce:
# root ~> apt-file search /usr/bin/urifind liburi-find-perl: /usr/bin/urifind
Pozdro
Ostatnio edytowany przez Jacekalex (2022-10-23 02:26:45)
Offline
Ten perlowy pakiet świetny, dzięki!
Offline