Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#1  2023-02-17 08:49:03

  bakao - Zbanowany

bakao
Zbanowany
Zarejestrowany: 2020-11-15

Jak procesować stringa?

Hej. Mam sobie dośc długi string - ok 50Kb. Jest to kod HTML. Chciałbym teraz, żeby po znalezieniu w nim np. tagu <h5> pewna zmienna była inkrementowana, po znalezieniu <h6> dekrementowana a wszystko co znajduje się między <h1> a </h1> wyłapywane i wrzucane w odpowiednią tablicę. Ogólnie rzecz biorąc, szukam kodu, który będzie przesuwał się po stringu bajt po bajcie i na każdy element jaki chcę reagował jak na event. Jak do tego podejść? Jaki język programowania wybrać. Nie ukrywam, ze szukam gotowców.

Ostatnio edytowany przez bakao (2023-02-17 08:53:26)

Offline

 

#2  2023-02-17 14:12:35

  seler - Użytkownik

seler
Użytkownik
Zarejestrowany: 2012-05-15

Re: Jak procesować stringa?

do odpowiedniego procesowania kodu HTML regexy odpadają - chyba że jest to prosty kod bez żadnych niespodzianek.
Użyłbym do tego np. xidela. Ale wątpię, żeby był na coś takiego gotowiec. Trzeba po prostu napisać odpowiedni skrypt/program.

Ostatnio edytowany przez seler (2023-02-17 14:13:51)


a to feler westchnął seler

Offline

 

#3  2023-02-17 16:03:53

  Jacekalex - Podobno człowiek...;)

Jacekalex
Podobno człowiek...;)
Skąd: /dev/random
Zarejestrowany: 2008-01-07

Re: Jak procesować stringa?

W Perlu czy Pythonie masz chyba ze 100 różnych modułów do parsowania htmla, na pewno się coś przystępnego znajdzie.

np to:
https://metacpan.org/dist/HTML-Parser

Ostatnio edytowany przez Jacekalex (2023-02-17 16:10:17)


W demokracji każdy naród ma taką władzę, na jaką zasługuje ;)
Si vis pacem  para bellum  ;)       |       Pozdrawiam :)

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
Możesz wyłączyć AdBlock — tu nie ma reklam ;-)