Baixe qualquer blog com golos.io em Python
Eu escrevi um script em Python, que você pode baixar qualquer blog da voz, junto com as fotos. O programa desenha todas as postagens do autor especificado a partir do banco de dados de arcange, analisa os textos para a presença de imagens e baixa essas imagens para a pasta img . Na entrada, você especifica o apelido do autor, cujo blog deseja baixar, na saída você recebe uma pasta com arquivos html autônomos . O processo de download do blog inteiro é bastante longo, especialmente se o autor tiver muitas entradas. No meu blog demora cerca de um minuto, e no blog sxiii do autor , por exemplo, demorou 15 minutos.
Para que o script funcione, você precisa instalar o Python 3.6.2 e alguns módulos. Primeiro, instale pedidos, roda e wget
Pip instalar
instalar
pip
Também precisamos instalar pymssql e sqlalchemy . Através do pip sob o Windows, você pode fazer isso baixando os arquivos de dados do módulo de um repositório não oficial. Mais detalhes sobre a instalação desses módulos que escrevi neste artigo:
Depois que todos os módulos estiverem instalados, baixe as origens do meu script a partir daqui:
Descompacte o arquivo e execute o script. Você será solicitado a inserir o apelido do usuário cujo blog deseja baixar. Você deve inserir um apelido com uma letra pequena e sem um sinal @ na frente dele. Depois que o nick for selecionado, pressione Enter e o programa começa a baixar as postagens do usuário especificado.
Aguarde o fim do processo e, na pasta com o script, você verá um subdiretório, consoante com o nome do autor especificado. No subdiretório, haverá arquivos html com artigos e uma pasta img com imagens.
Por que você precisará desse script? Você pode fazer um backup do seu blog ou baixar todas as postagens de algum autor para lê-los offline. Em particular, baixei alguns blogs interessantes para mim e os enviei ao meu leitor em tinta eletrônica.
Coloque a apologia, assine o meu blog e escreva comentários.
Comentários
Postar um comentário