Baixe qualquer blog com golos.io em Python
Baixe qualquer blog com golos.io em Python
Eu escrevi um script em Python, que você pode baixar qualquer blog da voz, junto com as fotos. O programa desenha todas as postagens do autor especificado a partir do banco de dados de arcange, analisa os textos para a presença de imagens e baixa essas imagens para a pasta img . Na entrada, você especifica o apelido do autor, cujo blog deseja baixar, na saída você recebe uma pasta com arquivos html autônomos . O processo de download do blog inteiro é bastante longo, especialmente se o autor tiver muitas entradas. No meu blog demora cerca de um minuto, e no blog sxiii do autor , por exemplo, demorou 15 minutos.
Para que o script funcione, você precisa instalar o Python 3.6.2 e alguns módulos. Primeiro, instale pedidos, roda e wget
Pip instalar
instalar
pip
instalar
pip
Também precisamos instalar pymssql e sqlalchemy . Através do pip sob o Windows, você pode fazer isso baixando os arquivos de dados do módulo de um repositório não oficial. Mais detalhes sobre a instalação desses módulos que escrevi neste artigo:
Depois que todos os módulos estiverem instalados, baixe as origens do meu script a partir daqui:
Descompacte o arquivo e execute o script. Você será solicitado a inserir o apelido do usuário cujo blog deseja baixar. Você deve inserir um apelido com uma letra pequena e sem um sinal @ na frente dele. Depois que o nick for selecionado, pressione Enter e o programa começa a baixar as postagens do usuário especificado.
Aguarde o fim do processo e, na pasta com o script, você verá um subdiretório, consoante com o nome do autor especificado. No subdiretório, haverá arquivos html com artigos e uma pasta img com imagens.
Por que você precisará desse script? Você pode fazer um backup do seu blog ou baixar todas as postagens de algum autor para lê-los offline. Em particular, baixei alguns blogs interessantes para mim e os enviei ao meu leitor em tinta eletrônica.
Coloque a apologia, assine o meu blog e escreva comentários.
20/9/2017 03:28
27,86 GBG
0
Comentários
Postar um comentário