Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#1  2008-11-23 23:28:58

  kecef - Nowy użytkownik

kecef
Nowy użytkownik
Zarejestrowany: 2008-11-23

iconv i konwersja z utf-8 na iso8859-2 [solved]

Ciekawy sposób, mógłbyś zamieścić gdzieś ten skrypt i podać jego adres ? Bardzo mnie interesuje Twoje rozwiązanie, bo mam identyczny problem.

Offline

 

#2  2008-11-24 09:47:49

  radziojedi - Gambini

radziojedi
Gambini
Skąd: Śrem
Zarejestrowany: 2008-08-08

Re: iconv i konwersja z utf-8 na iso8859-2 [solved]

Tak, ten skrypt moze i dziala, ale nijak ma sie niestety do mythtv. Oczywiscie mam wynikowy plik xml kodowany iso8859-2, niestety epgdownloader, z ktorego korzystam numeruje stacje do ktorych sciaga program, co jest dosc logiczne, natomiast sprowadza sie to do tego, iz mam po dwie stacje z numerem 1, dwie z numerem 2, itd... Niestety tego nie udalo mi sie rozwiazac, a MythTV z takim plikiem troche sie gubi, co tez jest naturalnie logiczne:)


"Given enough eyeballs, all bugs are shallow"
Eric Raymond, The Cathedral and the Bazaar: Musings on Linux and Open Source by an Accidental Revolutionary

Offline

 

#3  2008-11-24 10:45:06

  kecef - Nowy użytkownik

kecef
Nowy użytkownik
Zarejestrowany: 2008-11-23

Re: iconv i konwersja z utf-8 na iso8859-2 [solved]

Tak, epgdownloader numeruje stacje według pliku channels.xml, dlatego byłem ciekaw w jaki sposób rozwiązałeś to w Swoim skrypcie i nie tylko to. Numerowanie kanałów można rozwiązać na przynajmniej 2 sposoby:

- 2 foldery epgdownloadera (program jest mały) - pierwszy dla interii i wp (iso-8859-2), drugi dla teleman (utf-8). W każdym inny plik channels.xml i teraz jeśli kanał jest ściągany z interii lub wp (pierwszy folder), to w drugim już nie występuje.

- jeden folder z epgdownloaderem i 2 pliki channels.xml, tak jak w pierwszym przypadku, jeden dla iso, drugi dla utf.

Wszystko odpalane za pomocą skryptu, który uruchamia epgdownloadera w pierwszym przypadku z 2 różnych folderów, w drugim 2x, w międzyczasie podmieniając plik channels.xml (trzeba też pamiętać aby zapisać plik wynikowy do innego pliku) i łączy 2 pliki wynikowe (oczywiście po konwersji), wycinając z pierwszego końcówkę, z drugiego początek (head z kodowaniem).

To są tylko moje rozważania teoretyczne. Niestety nie wiem w jaki sposób wyciąć przy pomocy skryptów początek i koniec plików. Najlepiej by było, gdybyś pokazał nam Swój skrypt, w jaki sposób to robisz.

Ostatnio edytowany przez kecef (2008-11-24 10:47:39)

Offline

 

#4  2008-11-24 10:56:51

  radziojedi - Gambini

radziojedi
Gambini
Skąd: Śrem
Zarejestrowany: 2008-08-08

Re: iconv i konwersja z utf-8 na iso8859-2 [solved]

Jasne. Robilem to w bardzo podobny sposob, jak Ty to opisales. Mialem dwa katalogi z epgdownloaderem. Pierwszy dla interii i wp (iso8859-2), drugi dla teleman (utf-8). Moj bardzo prosty i prymitywny skrypt uruchamial najpierw pierwszego epgdownloadera, ktory tworzyl plik wynikowy xmltv.xml, potem drugiego, ktory rowniez tworzyl jakis plik wynikowy xmltv.xml i nastepnie byl konwertowany do iso8859-2 (iconv --from-code=UTF-8 --to-code=iso8859-2 xmltv.xml). Nastepnie za pomoca polecenia 'cat' laczylem dwa pliki xmltv.xml z dwoch folderow w jeden (cat  /documents/skrypty/epgdownloader2/xmltv.xml /documents/skrypty/epgdownloader1/xmltv.xml > xmltv.xml.


"Given enough eyeballs, all bugs are shallow"
Eric Raymond, The Cathedral and the Bazaar: Musings on Linux and Open Source by an Accidental Revolutionary

Offline

 

#5  2008-11-24 12:20:13

  kecef - Nowy użytkownik

kecef
Nowy użytkownik
Zarejestrowany: 2008-11-23

Re: iconv i konwersja z utf-8 na iso8859-2 [solved]

A co z wycięciem końcówki pierwszego i początku drugiego pliku przed ich złączeniem ?
Można to zrobić sedem, ale pewnie są inne lepsze polecenia do tego.

Offline

 

#6  2008-11-24 12:51:59

  radziojedi - Gambini

radziojedi
Gambini
Skąd: Śrem
Zarejestrowany: 2008-08-08

Re: iconv i konwersja z utf-8 na iso8859-2 [solved]

Powiem szczerze, ze nic z tym dalej nie robilem, bo teleman mi wystarczyl (90% pokrycie), ale moznaby sie pobawic.


"Given enough eyeballs, all bugs are shallow"
Eric Raymond, The Cathedral and the Bazaar: Musings on Linux and Open Source by an Accidental Revolutionary

Offline

 

#7  2008-11-24 19:01:41

  kecef - Nowy użytkownik

kecef
Nowy użytkownik
Zarejestrowany: 2008-11-23

Re: iconv i konwersja z utf-8 na iso8859-2 [solved]

Można by zmienić temat na coś w rodzaju "epgdownloader i problemy z kodowaniem utf-8 -> iso-8859-2".

U mnie natomiast są problemy z parsowaniem programów z telemana, np.

Kod:

Parsing of undecoded UTF-8 will give garbage when decoding entities at /usr/lib/perl5/HTML/PullParser.pm line 83.
Parsing of undecoded UTF-8 will give garbage when decoding entities at /usr/lib/perl5/HTML/PullParser.pm line 83.
Parsing of undecoded UTF-8 will give garbage when decoding entities at /usr/lib/perl5/HTML/PullParser.pm line 83.
Use of uninitialized value in addition (+) at plugins/TelemanPl/TelemanPl.pm line 137.
# Parsing of undecoded UTF-8 will give garbage when decoding entities at /usr/lib/perl5/HTML/PullParser.pm line 83.
# Parsing of undecoded UTF-8 will give garbage when decoding entities at /usr/lib/perl5/HTML/PullParser.pm line 83.
.
.
itd.

Ostatnio edytowany przez kecef (2008-11-25 00:28:57)

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
Nas ludzie lubią po prostu, a nie klikając w przyciski ;-)