Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Dzisiaj wpadł mi w ręce malutki programik enca. Z tego co się zorientowałem po forum, nie jest on totalnie nieznany (czadman o nim kilkukrotnie wspominał), ale wart szerszej popularyzacji. Pakiet nazywa się enca i zawiera programy enca i enconv
enconv umożliwia przekodowanie zawartości pliku z jednego kodowania do innego. Oczywiście od tego jest iconv, jednak przede wszystkim brakuje mu opcji nadpisywania pliku na którym pracuje (przekierowanie do pliku tymczasowego i mv się kłania). Niedociągnięcia tego pozbawiony jest polski konwert (dopiero teraz zauważyłem, że jego autorem jest Qrczak), jednak z kolei jego filtry transliteracyjne nie są tak fajne jak iconva (nie udało mi się go zmusić, żeby „] zastąpił ,,, upiera się na "). Skoro więc jest taki wybór (+recode i pewnie kilka innych o których nie wiem), po co komu jeszcze enca?
Po to, że jest to program absolutnie automagiczny. Sam wykryje w jakim kodowaniu zapisany jest dany plik i przekoduje go do kodowania zgodnego z ustawionymi localami. Wystarczy podać plik jako argument, nie trzeba wiedzieć nic więcej.
Oczywiście program oferuje wiele innych opcji, z czego warte wymienienia są dwie:
1. wymuszenie kodowania docelowego
2. jedynie sprawdzenie w jakim kodowaniu jest dany plik (alternatywnie można użyć programu enca z pakietu). Działanie jest trochę podobne do działania file, ale ten ostatni wykłada się np. na plikach html, nie podając żadnej wartościowej informacji o użytym kodowaniu.
enca przydaje się do określenia kodowania pliku z nieokreślonego źródła, i jego przydatności tłumaczyć chyba nie muszę. Jednak w większości przypadków używany będzie raczej enconv, ostatecznie rozwiązujący problem krzaków w otwieranych plikach. Jestem po prostu zachwycony jego prostotą, jest to coś czego szukałem od kiedy pierwszy raz dostałem plik w innym niż UTF-8 kodowaniu.
Offline
Nie mogłeś go pochwalić zanim napisałem sobie funkcję do przekodowania plików z ISO na UTF? ;)
Oho, w jednym pliku mi nie rozpoznał kodowania.
Ostatnio edytowany przez azhag (2009-04-27 19:06:40)
Offline