Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!

Ogłoszenie

Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.

#1  2020-10-08 19:39:23

  yyv - Użytkownik

yyv
Użytkownik
Zarejestrowany: 2020-10-08

Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

Hej,
proszę o pomoc: jak pobrać dużą stronę internetową (sip.legalis.pl) (zawiera generalnie tekst), niewiele obrazków, ma wbudowaną wyszukiwarkę i translator (mi zależy tylko w zasadzie na tym tekście z serwisu jeżeli to robi różnicę). WebHTTrack i Teleport jak wybieram, żeby pobrać wszystko - pierwszy zwrócił chyba błąd, drugi jakby nic nie robił. Obojętne czy rozwiążemy to linuksem, może być to dowolny sposób na dowolny system, pytam tu, ponieważ nie wiem gdzie o to spytać, a użytkownicy Linuksa są inteligentni. :) Mam oczywiście login i hasło. Proszę o szybką pomoc, ponieważ lada chwila czeka mnie dłuższa wycieczka przez różne kraje i wolałbym mieć ten serwis na dysku, żeby nie musieć kupować nowego dostępu do internetu za każdym przekroczeniem kolejnej granicy. Dziękuję.

Ostatnio edytowany przez yyv (2020-10-08 19:40:42)

Offline

 

#2  2020-10-08 21:58:15

  yyv - Użytkownik

yyv
Użytkownik
Zarejestrowany: 2020-10-08

Re: Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

kompletnie się nie znam na pobieraniu stron internetowych, więc proszę nie traktujcie zbyt poważnie tego, że te programy mi tego serwisu nie pobrały.

Offline

 

#3  2020-10-08 22:17:17

  urbinek - Dzban Naczelny

urbinek
Dzban Naczelny
Skąd: Sosnowiec
Zarejestrowany: 2009-10-01
Serwis

Re: Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

Ostatni raz pobierałem stronę www gdzieś koło 1999 roku, is this still a thing?


A w wolnym czasie, robię noże :)
http://nginx.urbinek.eu/_photos/signature.png

Offline

 

#4  2020-10-08 22:33:42

  Jacekalex - Podobno człowiek...;)

Jacekalex
Podobno człowiek...;)
Skąd: /dev/random
Zarejestrowany: 2008-01-07

Re: Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

Kod:

aptitude install -y httrack

Kod:

man httrack

A tu strona programu:
https://www.httrack.com/html/index.html


W demokracji każdy naród ma taką władzę, na jaką zasługuje ;)
Si vis pacem  para bellum  ;)       |       Pozdrawiam :)

Offline

 

#5  2020-10-08 22:49:51

  yyv - Użytkownik

yyv
Użytkownik
Zarejestrowany: 2020-10-08

Re: Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

urbinek napisał(-a):

is this still a thing?

Masz na myśli, czy jeszcze ma miejsce takie zjawisko jak pobieranie stron internetowych?

Offline

 

#6  2020-10-08 22:53:08

  yyv - Użytkownik

yyv
Użytkownik
Zarejestrowany: 2020-10-08

Re: Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

Jacekalex napisał(-a):

Kod:

aptitude install -y httrack

Kod:

man httrack

A tu strona programu:
https://www.httrack.com/html/index.html

Zanim napisałem posta na tej stronie byłem, zainstalowałem apt-getem ze skutkami tak jak napisałem. :) Ja się chętnie tego manuala httracka nauczę nawet na pamięć jeśli to coś da, tylko czy ja mam szansę ten serwis pobrać, a jak tak to czy nie czeka mnie długa przeprawa by tego dokonać? Nigdy czegoś takiego nie robiłem. :(

Ostatnio edytowany przez yyv (2020-10-08 22:53:59)

Offline

 

#7  2020-10-08 23:40:55

  Jacekalex - Podobno człowiek...;)

Jacekalex
Podobno człowiek...;)
Skąd: /dev/random
Zarejestrowany: 2008-01-07

Re: Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

yyv napisał(-a):

Jacekalex napisał(-a):

Kod:

aptitude install -y httrack

Kod:

man httrack

A tu strona programu:
https://www.httrack.com/html/index.html

Zanim napisałem posta na tej stronie byłem, zainstalowałem apt-getem ze skutkami tak jak napisałem. :) Ja się chętnie tego manuala httracka nauczę nawet na pamięć jeśli to coś da, tylko czy ja mam szansę ten serwis pobrać, a jak tak to czy nie czeka mnie długa przeprawa by tego dokonać? Nigdy czegoś takiego nie robiłem. :(

Masz skrócony opis z gotowymi przykładami w wyniku:

Kod:

 httrack -h

Chodzi konkretnie o to:

Kod:

example: httrack www.someweb.com/bob/
means:   mirror site www.someweb.com/bob/ and only this site

example: httrack www.someweb.com/bob/ www.anothertest.com/mike/ +*.com/*.jpg -mime:application/*
means:   mirror the two sites together (with shared links) and accept any .jpg files on .com sites

example: httrack www.someweb.com/bob/bobby.html +* -r6
means get all files starting from bobby.html, with 6 link-depth, and possibility of going everywhere on the web

example: httrack www.someweb.com/bob/bobby.html --spider -P proxy.myhost.com:8080
runs the spider on www.someweb.com/bob/bobby.html using a proxy

example: httrack --update
updates a mirror in the current folder

example: httrack
will bring you to the interactive mode

example: httrack --continue
continues a mirror in the current folder

To by było na tyle

Ostatnio edytowany przez Jacekalex (2020-10-08 23:42:52)


W demokracji każdy naród ma taką władzę, na jaką zasługuje ;)
Si vis pacem  para bellum  ;)       |       Pozdrawiam :)

Offline

 

#8  2020-10-09 13:20:19

  yyv - Użytkownik

yyv
Użytkownik
Zarejestrowany: 2020-10-08

Re: Jak pobrać dużą stronę internetową (zawiera generalnie tekst)

Jacekalex napisał(-a):

yyv napisał(-a):

Jacekalex napisał(-a):

Kod:

aptitude install -y httrack

Kod:

man httrack

A tu strona programu:
https://www.httrack.com/html/index.html

Zanim napisałem posta na tej stronie byłem, zainstalowałem apt-getem ze skutkami tak jak napisałem. :) Ja się chętnie tego manuala httracka nauczę nawet na pamięć jeśli to coś da, tylko czy ja mam szansę ten serwis pobrać, a jak tak to czy nie czeka mnie długa przeprawa by tego dokonać? Nigdy czegoś takiego nie robiłem. :(

Masz skrócony opis z gotowymi przykładami w wyniku:

Kod:

 httrack -h

Chodzi konkretnie o to:

Kod:

example: httrack www.someweb.com/bob/
means:   mirror site www.someweb.com/bob/ and only this site

example: httrack www.someweb.com/bob/ www.anothertest.com/mike/ +*.com/*.jpg -mime:application/*
means:   mirror the two sites together (with shared links) and accept any .jpg files on .com sites

example: httrack www.someweb.com/bob/bobby.html +* -r6
means get all files starting from bobby.html, with 6 link-depth, and possibility of going everywhere on the web

example: httrack www.someweb.com/bob/bobby.html --spider -P proxy.myhost.com:8080
runs the spider on www.someweb.com/bob/bobby.html using a proxy

example: httrack --update
updates a mirror in the current folder

example: httrack
will bring you to the interactive mode

example: httrack --continue
continues a mirror in the current folder

To by było na tyle

1) Jeśli dobrze rozumiem to to są różne opcje tego jak pobierać stronę, np. że tylko to co jest pod wskazanym adresem (pierwszy przykład), albo do 6 linków wgłąb strony (trzeci przykład). Rozumiem, że Tobie chodzi o to, że zastosowanie którejś z tych opcji pozwoli ten serwis pobrać?
2) Dla ścisłości ja to próbowałem pobierać tę stronę chyba jakąś nakładką graficzną na ten program:

Kod:

apt-get install webhttrack

przez przeglądarkę. I jak pisałem nie wyszło.
3) Z tego co czytam w internecie niektórych stron internetowych się nie da pobrać. Tą się da?
4) Jeśli tę stronę oceniasz/oceniacie, że da się pobrać to próbować

Kod:

aptitude install -y httrack

skoro po zainstalowaniu się webhttrack komendą:

Kod:

apt-get install webhttrack

, strony, którą chcę pobrać nie pobrało?

Ostatnio edytowany przez yyv (2020-10-09 16:03:53)

Offline

 

Stopka forum

Powered by PunBB
© Copyright 2002–2005 Rickard Andersson
Nas ludzie lubią po prostu, a nie klikając w przyciski ;-)