Nie jesteś zalogowany.
Jeśli nie posiadasz konta, zarejestruj je już teraz! Pozwoli Ci ono w pełni korzystać z naszego serwisu. Spamerom dziękujemy!
Prosimy o pomoc dla małej Julki — przekaż 1% podatku na Fundacji Dzieciom zdazyć z Pomocą.
Więcej informacji na dug.net.pl/pomagamy/.
Strony: 1
Hej,
proszę o pomoc: jak pobrać dużą stronę internetową (sip.legalis.pl) (zawiera generalnie tekst), niewiele obrazków, ma wbudowaną wyszukiwarkę i translator (mi zależy tylko w zasadzie na tym tekście z serwisu jeżeli to robi różnicę). WebHTTrack i Teleport jak wybieram, żeby pobrać wszystko - pierwszy zwrócił chyba błąd, drugi jakby nic nie robił. Obojętne czy rozwiążemy to linuksem, może być to dowolny sposób na dowolny system, pytam tu, ponieważ nie wiem gdzie o to spytać, a użytkownicy Linuksa są inteligentni. :) Mam oczywiście login i hasło. Proszę o szybką pomoc, ponieważ lada chwila czeka mnie dłuższa wycieczka przez różne kraje i wolałbym mieć ten serwis na dysku, żeby nie musieć kupować nowego dostępu do internetu za każdym przekroczeniem kolejnej granicy. Dziękuję.
Ostatnio edytowany przez yyv (2020-10-08 19:40:42)
Offline
kompletnie się nie znam na pobieraniu stron internetowych, więc proszę nie traktujcie zbyt poważnie tego, że te programy mi tego serwisu nie pobrały.
Offline
aptitude install -y httrack
man httrack
A tu strona programu:
https://www.httrack.com/html/index.html
Offline
urbinek napisał(-a):
is this still a thing?
Masz na myśli, czy jeszcze ma miejsce takie zjawisko jak pobieranie stron internetowych?
Offline
Jacekalex napisał(-a):
Kod:
aptitude install -y httrackKod:
man httrackA tu strona programu:
https://www.httrack.com/html/index.html
Zanim napisałem posta na tej stronie byłem, zainstalowałem apt-getem ze skutkami tak jak napisałem. :) Ja się chętnie tego manuala httracka nauczę nawet na pamięć jeśli to coś da, tylko czy ja mam szansę ten serwis pobrać, a jak tak to czy nie czeka mnie długa przeprawa by tego dokonać? Nigdy czegoś takiego nie robiłem. :(
Ostatnio edytowany przez yyv (2020-10-08 22:53:59)
Offline
yyv napisał(-a):
Jacekalex napisał(-a):
Kod:
aptitude install -y httrackKod:
man httrackA tu strona programu:
https://www.httrack.com/html/index.htmlZanim napisałem posta na tej stronie byłem, zainstalowałem apt-getem ze skutkami tak jak napisałem. :) Ja się chętnie tego manuala httracka nauczę nawet na pamięć jeśli to coś da, tylko czy ja mam szansę ten serwis pobrać, a jak tak to czy nie czeka mnie długa przeprawa by tego dokonać? Nigdy czegoś takiego nie robiłem. :(
Masz skrócony opis z gotowymi przykładami w wyniku:
httrack -h
Chodzi konkretnie o to:
example: httrack www.someweb.com/bob/ means: mirror site www.someweb.com/bob/ and only this site example: httrack www.someweb.com/bob/ www.anothertest.com/mike/ +*.com/*.jpg -mime:application/* means: mirror the two sites together (with shared links) and accept any .jpg files on .com sites example: httrack www.someweb.com/bob/bobby.html +* -r6 means get all files starting from bobby.html, with 6 link-depth, and possibility of going everywhere on the web example: httrack www.someweb.com/bob/bobby.html --spider -P proxy.myhost.com:8080 runs the spider on www.someweb.com/bob/bobby.html using a proxy example: httrack --update updates a mirror in the current folder example: httrack will bring you to the interactive mode example: httrack --continue continues a mirror in the current folder
To by było na tyle
Ostatnio edytowany przez Jacekalex (2020-10-08 23:42:52)
Offline
Jacekalex napisał(-a):
yyv napisał(-a):
Jacekalex napisał(-a):
Kod:
aptitude install -y httrackKod:
man httrackA tu strona programu:
https://www.httrack.com/html/index.htmlZanim napisałem posta na tej stronie byłem, zainstalowałem apt-getem ze skutkami tak jak napisałem. :) Ja się chętnie tego manuala httracka nauczę nawet na pamięć jeśli to coś da, tylko czy ja mam szansę ten serwis pobrać, a jak tak to czy nie czeka mnie długa przeprawa by tego dokonać? Nigdy czegoś takiego nie robiłem. :(
Masz skrócony opis z gotowymi przykładami w wyniku:
Kod:
httrack -hChodzi konkretnie o to:
Kod:
example: httrack www.someweb.com/bob/ means: mirror site www.someweb.com/bob/ and only this site example: httrack www.someweb.com/bob/ www.anothertest.com/mike/ +*.com/*.jpg -mime:application/* means: mirror the two sites together (with shared links) and accept any .jpg files on .com sites example: httrack www.someweb.com/bob/bobby.html +* -r6 means get all files starting from bobby.html, with 6 link-depth, and possibility of going everywhere on the web example: httrack www.someweb.com/bob/bobby.html --spider -P proxy.myhost.com:8080 runs the spider on www.someweb.com/bob/bobby.html using a proxy example: httrack --update updates a mirror in the current folder example: httrack will bring you to the interactive mode example: httrack --continue continues a mirror in the current folderTo by było na tyle
1) Jeśli dobrze rozumiem to to są różne opcje tego jak pobierać stronę, np. że tylko to co jest pod wskazanym adresem (pierwszy przykład), albo do 6 linków wgłąb strony (trzeci przykład). Rozumiem, że Tobie chodzi o to, że zastosowanie którejś z tych opcji pozwoli ten serwis pobrać?
2) Dla ścisłości ja to próbowałem pobierać tę stronę chyba jakąś nakładką graficzną na ten program:
apt-get install webhttrack
przez przeglądarkę. I jak pisałem nie wyszło.
3) Z tego co czytam w internecie niektórych stron internetowych się nie da pobrać. Tą się da?
4) Jeśli tę stronę oceniasz/oceniacie, że da się pobrać to próbować
aptitude install -y httrack
skoro po zainstalowaniu się webhttrack komendą:
apt-get install webhttrack
, strony, którą chcę pobrać nie pobrało?
Ostatnio edytowany przez yyv (2020-10-09 16:03:53)
Offline
Strony: 1