Download automatizado de Diários Oficiais

Eventualmente gosto de fazer alguma coisa diferente no trabalho. E o último desafio aqui, fora as tarefas diárias com o sistema no qual sou o analista responsável, foi automatizar algumas rotinas de leitura de Diários Oficiais. Funcionários do escritório fazem a leitura diversos jornais em busca de publicações em nome de nossos advogados.

Acontece que eventualmente a versão impressa dos jornais demoram a chegar, e a leitura on-line é ruim, pois geralmente acontece página a página, impedindo que o leitor faça uma simples operação de pesquisa, o famoso “CTRL+F”.

A partir dessas duas dificuldades, a proposta foi criar um robô eletrônico para baixar página a página os jornais, e ao final do download fazer um arquivo único. Os seguintes diários hoje já são baixados automaticamente:

  • Diário Oficial da União – Íntegra;
  • Diário Oficial de MG – cadernos do Legislativo e Publicações de terceiros;
  • Diário Oficial de São Paulo – completo;
  • Diário Oficial da cidade de São Paulo – completo;
  • Diário Oficial da cidade do Rio de Janeiro – caderno da Fazenda;
  • Diário Oficial do Espírito Santo – completo;
  • Diário Oficial de Goiás – completo;
  • Diário do Tribunal de Justiça de MG.

O robô é um Windows Service escrito em C#.Net, é executado diariamente às 7 horas e disponibiliza os arquivos aos leitores. Geralmente, ao chegarem às 8 horas os arquivos já estão disponíveis. Atrasos ocorrem geralmente por lentidão nos servidores de onde os arquivos são baixados, o servidor da imprensa oficial de Minas Gerais é o que mais apresenta problemas dessa natureza.

Ainda preciso automatizar alguns outros diários, então o próximo passo será automatizar inclusive a pesquisa por palavras chaves no conteúdo baixado diariamente.

29 comentários em “Download automatizado de Diários Oficiais

  1. Terei que desenvolver algo exatamente assim para uma rede de escritórios de advocacia no PR. Alguma idéia de por onde começar ? Agradeço (Daniel – Cascavel, PR)

      1. Estou na mesma situação. Na verdade não sou programador, mas o advogado. Vc tem como desenvolver isso? Os Diarios são: TJ, TRT, Justiça Federal. Busca por nome do avogado e/ou palavra específica.

        Desde já, grato pela atenção.

        E-mail: kanasttra@yahoo.com.br

      2. A principio o TJ e TRT do Ceará. Mas gostaria de estender para outros estados da federação, na oportunidade.

        Vc pode me ajudar?

      3. Opa, desculpa a demora.

        Os diarios do TJ/CE, TRT/ 7 Região e Justiça Federal da 5 Região.

        Você pode me ajudar?

        Desde já, grato.

        Att,

      4. preciso baixar o diario oficial da uniao, sessao de processos minerarios, voce pode me ajudar numa rotina e quanto custa fazer isso? obrigado. OBS: preciso que venha em txt.

  2. Cara preciso uma busca no diário oficial por algumas palavras. Essa parte eu consigo fazer beleza, e tenho as seções e os números das páginas que devem ser baixadas. O problema é que não estou conseguindo pegar o pdf no site da imprensa nacional. Sempre dá uma mensagem que estou fazendo acesso direto ao componente. Como você conseguiu fazer o bypass nisso ?

  3. Como posso obter esse robo? Eu pretendo criar algo parecido, onde posso encontrar ferramentas para fazer algo do genero?

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s