Forum Debian Users Gang

DeWu · 2015-09-16 12:49:12

Mam skrypt .php który wyszukuje w pliku ciągu zaczynającego się od "Zaczynam tutaj" a kończącego się na "Tutaj koniec":

Kod:

<?php
$file = fopen("/home/dewu/wejscie.txt", "rb");
$contents = stream_get_contents($file);
fclose($file);

$start= strpos($contents, "Zaczynam tutaj");
$stop = strpos($contents,"Tutaj koniec")-$start;
$cut = substr($contents, $start,$stop);
echo $cut;
?>

Wynikiem jest jedna linia, ok 10k znaków w której pojawia się kilkakrotnie ciąg "dokument-$ID.html". Czy pomoglibyście mi przerobić ten krótki kod PHP na basha a w dodatku napisać jakiegoś while'a który wyłapie mi wszystkie wystąpienia dokument-$ID.html? ID jest zawsze czterocyfrowym ciągiem cyfr.

Z góry dzięki!

winnetou · 2015-09-16 13:21:17

Musi być w bashu? W bashu będzie ciężko ale np perl to już chwila moment.

DeWu · 2015-09-16 13:26:24

Perla kompletnie nie znam a chciałbym jeszcze w nim coś dorobić. Anyway, jak mozesz zapodac gotowca to postaram sie cos z nim zrobic.

winnetou · 2015-09-16 13:39:22

Kod:

winnetou@hordeum-vulgare ~/tmp $ cat jakis_plik 
1 cos do ignorowania
2 cos do ignorowania
3 cos do ignorowania
tu_zaczynamy
1 sekcja 1
2 sekcja 1
3 sekcja 1
4 sekcja 1
5 sekcja 1
6 sekcja 1
tu_konczymy
4 cos do ignorowania
5 cos do ignorowania
6 cos do ignorowania
7 cos do ignorowania
8 cos do ignorowania
9 cos do ignorowania
tu_zaczynamy
11 sekcja 2
12 sekcja 2
13 sekcja 2
14 sekcja 2
15 sekcja 2
tu_konczymy
cos do ignorowania
cos do ignorowania
cos do ignorowania

Kod:

winnetou@hordeum-vulgare ~/tmp $ cat spliter.pl 
#!/usr/bin/perl

use warnings;
use strict;
use Data::Dumper;

my $plik_do_podzielenia = $ARGV[0];
#my @tablica_fragmentow;

open(FH, '<', $plik_do_podzielenia);
my $plik_jako_1_string = do {local $/; <FH> };
close (FH);



my $poczatek = q{tu_zaczynamy};
my $koniec = q{tu_konczymy};
my @tablica_fragmentow = $plik_jako_1_string =~ m!$poczatek(.*?)$koniec!sg;

print Dumper(\@tablica_fragmentow);

winnetou@hordeum-vulgare ~/tmp $ ./spliter.pl jakis_plik
$VAR1 = [
'
1 sekcja 1
2 sekcja 1
3 sekcja 1
4 sekcja 1
5 sekcja 1
6 sekcja 1
',
'
11 sekcja 2
12 sekcja 2
13 sekcja 2
14 sekcja 2
15 sekcja 2
'
];

W wyniku dostajesz tablice z poszczególnymi wyciankami od "tu_zaczynamy" do "tu_kończymy". Jeśli chcesz sobie wyświetlić np 2 element tablicy (czyli w przykładzie "* sekcja 2" to zamiast

Kod:

print Dumper(\@tablica_fragmentow);

dajesz

Kod:

print $tablica_fragmentow[1]

Proste jak budowa cepa ;) Potem możesz poszczególne fragmenty poddać dowolnej obróbce.

DeWu · 2015-09-16 13:44:15

A co jeśli plik wygląda tak:

Kod:

Sekcja 1
Jakiesblabla Tu Zaczynamy cos nieistotnego dok-ID.html znowu cos nieistotnego dok-ID.html dascxcxz.... dok-ID.html costam Tu konczymy cos tam jeszcze

winnetou · 2015-09-16 13:50:35

Ehh to spróbuj... ;]

Kod:

winnetou@hordeum-vulgare ~/tmp $ cat jakis_plik 
1 cos do ignorowania 2 cos do ignorowania 3 cos do ignorowania tu_zaczynamy 1 sekcja 1 2 sekcja 1 3 sekcja 1 4 sekcja 1 5 sekcja 1 6 sekcja 1 tu_konczymy 4 cos do ignorowania 5 cos do ignorowania
6 cos do ignorowania 7 cos do ignorowania 8 cos do ignorowania
9 cos do ignorowania tu_zaczynamy 11 sekcja 2 12 sekcja 2 13 sekcja 2 14 sekcja 2 15 sekcja 2 tu_konczymy  cos do ignorowania cos do ignorowania cos do ignorowania
winnetou@hordeum-vulgare ~/tmp $ ./spliter.pl jakis_plik 
$VAR1 = [
          ' 1 sekcja 1 2 sekcja 1 3 sekcja 1 4 sekcja 1 5 sekcja 1 6 sekcja 1 ',
          ' 11 sekcja 2 12 sekcja 2 13 sekcja 2 14 sekcja 2 15 sekcja 2 '
        ];

Ciężko zapisać gotowy kod i odpalić na testowym pliku wejściowym? ;>

ethanak · 2015-09-16 14:19:40

a to nie lepszy będzie python? jeden regexp (re.search) do wyciągnięcia fragmentu, drugi (re.findall) do wyciągnięcia ID... i po robocie...

winnetou · 2015-09-16 14:23:54

tego perla dałoby się zapisać prościej, ale że kolega nie ogarnia to pisałem tak, aby było widać co jest co.
A python osobiście mi nie leży ;)

ethanak · 2015-09-16 14:29:41

a mi perl :-P

Jacekalex · 2015-09-16 17:20:07

Jeżeli chodzi o wojenki Perl <=> Python, to w obu będzie to wyglądało mnie więcej identyczne, więc nie ma się co indyczyć.

Jeżeli natomiast ma to chodzić ultraszybko, to polecam C i Assemlera. :D

ethanak · 2015-09-16 17:40:23

C wystarczy - jak dla mnie jest to świetny sposób pisania w asemblerze nie znając asemblera ;)

btw. perla nie lubię prawie tak jak javy :)

qluk · 2015-09-16 21:36:14

Hmm ;)

Forum Debian Users Gang

Ogłoszenie

#1 2015-09-16 12:49:12

DeWu - Użytkownik

BASH zabawa ze stringiem

Kod:

#2 2015-09-16 13:21:17

winnetou - złodziej wirków ]:->

Re: BASH zabawa ze stringiem

#3 2015-09-16 13:26:24

DeWu - Użytkownik

Re: BASH zabawa ze stringiem

#4 2015-09-16 13:39:22

winnetou - złodziej wirków ]:->

Re: BASH zabawa ze stringiem

Kod:

Kod:

Kod:

Kod:

#5 2015-09-16 13:44:15

DeWu - Użytkownik

Re: BASH zabawa ze stringiem

Kod:

#6 2015-09-16 13:50:35

winnetou - złodziej wirków ]:->

Re: BASH zabawa ze stringiem

Kod:

#7 2015-09-16 14:19:40

ethanak - Użytkownik

Re: BASH zabawa ze stringiem

#8 2015-09-16 14:23:54

winnetou - złodziej wirków ]:->

Re: BASH zabawa ze stringiem

#9 2015-09-16 14:29:41

ethanak - Użytkownik

Re: BASH zabawa ze stringiem

#10 2015-09-16 17:20:07

Jacekalex - Podobno człowiek...;)

Re: BASH zabawa ze stringiem

#11 2015-09-16 17:40:23

ethanak - Użytkownik

Re: BASH zabawa ze stringiem

#12 2015-09-16 21:36:14

qluk - Pan inż. Cyc

Re: BASH zabawa ze stringiem

Stopka forum