terça-feira, 6 de outubro de 2020

Baixar sites inteiros - wget

$ wget -r http://www.site.com


$ wget -r -erobots=off -A ".gif" http://www.endereço_do_site (imagens gif)
$ wget -r -erobots=off -A ".jpg" http://www.endereço_do_site (imagens jpg)
$ wget -r -erobots=off -A ".pdf" http://www.endereço_do_site (documentos PDF)
$ wget -r -erobots=off -A ".swf" http://www.endereço_do_site (animações ou jogos em flash) 

$ wget -r -A ".gif" http://www.endereço_do_site
$ wget -r -A ".html" http://www.endereço_do_site
$ wget - r-A ".pdf" http://www.endereço_do_site 

-

Baixa todos os formatos de imagem em 'jpg', 'gif' e 'png':

wget -r -p http://www.endereço_do_site --accept=JPG,jpg,GIF,gif,png,PNG 

 -

 Limita a velocidade do download (Ex.: 100k):

$ wget --limit-rate=100k http://www.endereço_do_site

 

$ wget \
     --recursive \
     --no-clobber \
     --page-requisites \
     --html-extension \
     --convert-links \
     --restrict-file-names=windows \
     --domains site.com \
     --no-parent \
         www.site.com/link/

 

baixar apenas o link da pagina

$ wget -kp www.site.com

ou

$ curl -O http://www.site.com

baixar sequencia de imagens jpgs

$ curl -O http://www.site.com/nomedosarquivos[01-20].jpg

ou

http://www.site.com/nomedosarquivos{001..200}.jpg

Nenhum comentário:

Postar um comentário