Forum Debian Users Gang

torpeda80 · 2021-09-21 13:56:15

Dzień dobry
Mam pytanie co powinien zrobić aby pobierać automatycznie ze strony www np. bipu informację o ogłoszeniach i otrzymywać je np. na maila lub do katalogu je zapisywać. Czy istnieje taki zautomatyzowany sposób poboru danych ze stron internetowych aby nie trzeba było za każdym razem wchodzić w stronę i przeszukiwać zmian dotyczących ofert. Interesują mnie zarówno rozwiązanie płatne jak i darmowe. Co moglibyście polecić?

Ostatnio edytowany przez torpeda80 (2021-09-22 10:01:19)

fnmirk · 2021-09-21 15:34:50

Moim zdaniem to można by wget, wget2 itp. programy zaprzęgnąć do tego podpinając do crona itp.

rulezdc · 2021-09-21 18:21:27

Jak juz chcesz to chyba python i odpowiednie biblioteki np. BeatifulSoup

https://helion.pl/ksiazki/ekstrakcja-danych-z-jezyk … .htm#format/e

torpeda80 · 2021-09-22 10:01:06

Dziękuje za odpowiedzi.

seler · 2021-09-22 17:36:07

Najprostsze i najtoporniejsze to zaprząc do pracy tekstową przeglądarkę internetową np. elinks z parametrem --dump, co będzie zwracać tekstową wersję strony, a potem parsować wynik, żeby sobie wyfiltrować fragment, który nas interesuje. Bardziej eleganckie, ale i skomplikowane będzie wycinanie ze strony właściwych znaczników html poprzez selektor xml/css np. Xidel, co powinno dawać właściwy fragment strony z dużo większą pewnością. A potem to już zabawa w porównanie ze starą wersją.

ethanak · 2021-09-23 12:36:09

A może narzędzie które zostało do tego stworzone - selenium?

Forum Debian Users Gang

Ogłoszenie

#1 2021-09-21 13:56:15

torpeda80 - Użytkownik

[+] skrypt pobierający aktualizacje strony www

#2 2021-09-21 15:34:50

fnmirk - Redaktor

Re: [+] skrypt pobierający aktualizacje strony www

#3 2021-09-21 18:21:27

rulezdc - Członek DUG

Re: [+] skrypt pobierający aktualizacje strony www

#4 2021-09-22 10:01:06

torpeda80 - Użytkownik

Re: [+] skrypt pobierający aktualizacje strony www

#5 2021-09-22 17:36:07

seler - Użytkownik

Re: [+] skrypt pobierający aktualizacje strony www

#6 2021-09-23 12:36:09

ethanak - Użytkownik

Re: [+] skrypt pobierający aktualizacje strony www

Stopka forum