Forum Debian Users Gang

bakao · 2022-10-20 13:17:31

Czy ktoś z Was ma pod ręką regexp/polecenie dla grepa, żeby z pliku .html wygrepować urle (wartość atrybutu src dla <img>) z pliku HTML? Googlowałem ale najlepsze rozwiązanie jakie znalazłem, wykłada się w przypadku, gdy w jednej linii pliku znajduje się kilka URLi

bakao · 2022-10-20 17:39:05

Znalazłem odpowiedź:

Kod:

grep -ohP 'src="(.*?)"' index.html | grep -ohP 'https?://([0-9a-z\-\_\/]*\.?)*'

Jacekalex · 2022-10-21 23:40:20

Próbowałeś np tak:

Kod:

curl -s https://www.wp.pl |urifind | egrep  '*.jpg$|*.png$|*.gif$'

Polecenie /usr/bin/urifind mam z paczki (Gentoo)

Kod:

qfile `which urifind`
dev-perl/URI-Find: /usr/bin/urifind

która instaluje ten moduł perla:
https://metacpan.org/pod/URI::Find

Tu masz instrukcję samego polecenia:
https://metacpan.org/dist/URI-Find/view/bin/urifind
Pliki też przeszukuje.

W Debku jest w paczce:

Kod:

# root ~> apt-file search /usr/bin/urifind
liburi-find-perl: /usr/bin/urifind

Pozdro

Ostatnio edytowany przez Jacekalex (2022-10-23 02:26:45)

bakao · 2022-11-17 14:32:30

Ten perlowy pakiet świetny, dzięki!

Forum Debian Users Gang

Ogłoszenie

#1 2022-10-20 13:17:31

bakao - Zbanowany

Wygrepowanie URLi do obrazów z pliku HTML

#2 2022-10-20 17:39:05

bakao - Zbanowany

Re: Wygrepowanie URLi do obrazów z pliku HTML

Kod:

#3 2022-10-21 23:40:20

Jacekalex - Podobno człowiek...;)

Re: Wygrepowanie URLi do obrazów z pliku HTML

Kod:

Kod:

Kod:

#4 2022-11-17 14:32:30

bakao - Zbanowany

Re: Wygrepowanie URLi do obrazów z pliku HTML

Stopka forum