Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#26  2014-11-02 17:11:15

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

Wszystko jasne, ale jak zwykle diabeł tkwi w szczegółach. Chodzi o to, że fragment 1 Twojego kodu przepuszczony przez awk traci formatowanie i wygląda tak

Kod:

753 0 obj (if \(this.hostContainer\) { try { this.hostContainer.postMessage\(['newPage', 'pp_376', 15259]\); } catch\(e\) { console.println\(e\); }};)

Jak widzisz zapisany jest on w jednej linii. Teraz pytanie. Czy ten kod może być zapisany w jednej linii i czy po zmianie fragmentu 1 na fragment 2 może wyglądać tak?

Kod:

753 0 obj (this.zoomType = zoomtype.pref; this.pageNum = 360;)

Offline

 

#27  2014-11-02 17:32:06

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Wygląda, że nie musi być nowy wiersz, a wystarczy spacja. Ale mogę się mylić. Zobacz dla pewności plik pod tym adresem: http://pl.rghost.net/58848774
Zmieniony kod teraz każe skoczyć do strony nr 1 (w kodzie strona 0, bo strony w JavaScripcie liczą się od 0 w pdfach). Wystarczy kliknąć na 31, przy Sir John A. w pdfie. W pliku pdf zmieniony kod jest w lini 6242.

Offline

 

#28  2014-11-02 18:26:50

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

U mnie ten zmieniony kod wygląd tak

Kod:

/JS (this.zoomType = zoomtype.pref; this.pageNum = 0;)

czyli przed nawiasem jest jeszcze "/JS"
Czy wszystkie pliki .pdf masz już rozpakowane? W jaki sposób liczyłeś w ilu liniach masz zmienić kod?

Ostatnio edytowany przez prosze (2014-11-02 18:27:25)

Offline

 

#29  2014-11-02 18:45:00

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Może tak być, tzn. może pojawiać się /JS. Te pliki pdf są dziwnie skonstruowane. Czasami po rozpakowaniu jest dostęp do JavaScripu  - widać go w edytorze, czasami nie. Gdy nie ma, wystarczyć lekko zmienić kod JavaScrpt z poziomu Adobe Acrobat albo  z pluginu http://www.evermap.com/abm_lnk_summary.asp#Editing% … ark%20Actions, zapisać plik, ponownie go odkompresować i pojawia się JavaScript w czystym tekście. Te modyfikacje wpływają na strukturę PDF, stąd czasami jest /JS, czasami nie. Ale to nie ma znaczenia. Wystarczy znaleźć:

Kodzik

Kod:

if (this.hostContainer) { 
    try {
        this.hostContainer.postMessage(['newPage', 'pp_322', 15259]);
    } 
    catch(e) { 
        console.println(e); 
    }
};

i zamienić na

Kod:

(this.zoomType = zoomtype.pref; this.pageNum = 322-16)

Inaczej mówiąc, najlepiej szukać całego  Kodzik (to co pp_ się zmienia, tak jak pisałem, cyfry rzymskie, arabskie itd.) i zmienić na to co wyżej (chodzi o kod wyżej z wynik odejmowania 322-16 po pp_)


prosze napisał(-a):

Czy wszystkie pliki .pdf masz już rozpakowane? W jaki sposób liczyłeś w ilu liniach masz zmienić kod?

Napisałem sobie skrypt do rozpakowywania plików, więc to chwila i mam wszystko rozpakowane. A występowanie pp_CYFRA_ARABSKA liczyłem za pomocą plugina wyżej przy użyciu regexa

Kod:

(?<=pp_)\d+(?:\'\d+)?

Ponieważ struktura PDFów (czasami JavaScript widoczny, czasami nie) jest nieco zmienna (chyba spis treści i indeksy mają jakiś zakamuflowany ten JavaScript), cięzko zatem podać dokładną liczbę wystąpień tego, co chcę zamienić.

Ostatnio edytowany przez menteith (2014-11-02 18:50:43)

Offline

 

#30  2014-11-02 21:38:48

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

To teraz sprawdzimy ile jest wszystkich linii, które należy zmienić. Zrób tak. Wejdź do katalogu w którym masz rozpakowane pliki .pdf (jeżeli jeszcze ich nie rozpakowałeś to je rozpakuj) i wydaj takie polecenie

Kod:

awk '/pp_/{a++; print $0, a}' $(for x in *.pdf; do echo "$x"; done) > wynik.txt

Plik "wynik.txt" wrzuć na hosting plików.

Offline

 

#31  2014-11-03 18:34:32

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Polaczylem wszystkie pliki do jednego - w pluginie do Acrobata wyszło mi, że skasowało 3112 linków - ale nie ma pewności, czy wszystkie to pp_ .

Plik jest tutaj: http://pl.rghost.net/private/58868045/40d056afb72613dc121c421fe7481876

Offline

 

#32  2014-11-05 22:52:11

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

Do tematu wrócimy za kilka dni ponieważ w tej chwili jestem poza domem.

Offline

 

#33  2014-11-06 13:02:35

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Jasne, to to wracamy za parę dni.

Offline

 

#34  2014-12-05 15:16:11

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

Rozwiązałeś już swój problem?

Offline

 

#35  2014-12-07 11:48:53

  menteith - Użytkownik

menteith
Użytkownik
Zarejestrowany: 2008-03-31

Re: [regex, bash, sed] Masowa modyfikacja plików

Niestety nie.

Offline

 

#36  2014-12-07 12:37:36

  prosze - Użytkownik

prosze
Użytkownik
Zarejestrowany: 2012-09-25

Re: [regex, bash, sed] Masowa modyfikacja plików

To wykonaj jeszcze raz czynności z postu o numerze 30.

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
Nas ludzie lubią po prostu, a nie klikając w przyciski ;-)