Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Hej. Mam sobie dośc długi string - ok 50Kb. Jest to kod HTML. Chciałbym teraz, żeby po znalezieniu w nim np. tagu <h5> pewna zmienna była inkrementowana, po znalezieniu <h6> dekrementowana a wszystko co znajduje się między <h1> a </h1> wyłapywane i wrzucane w odpowiednią tablicę. Ogólnie rzecz biorąc, szukam kodu, który będzie przesuwał się po stringu bajt po bajcie i na każdy element jaki chcę reagował jak na event. Jak do tego podejść? Jaki język programowania wybrać. Nie ukrywam, ze szukam gotowców.
Ostatnio edytowany przez bakao (2023-02-17 08:53:26)
Offline
do odpowiedniego procesowania kodu HTML regexy odpadają - chyba że jest to prosty kod bez żadnych niespodzianek.
Użyłbym do tego np. xidela. Ale wątpię, żeby był na coś takiego gotowiec. Trzeba po prostu napisać odpowiedni skrypt/program.
Ostatnio edytowany przez seler (2023-02-17 14:13:51)
Offline
W Perlu czy Pythonie masz chyba ze 100 różnych modułów do parsowania htmla, na pewno się coś przystępnego znajdzie.
np to:
https://metacpan.org/dist/HTML-Parser
Ostatnio edytowany przez Jacekalex (2023-02-17 16:10:17)
Offline