Releases: monambike/pdfconverter-pdftables-to-csv
1.3
v1.2
v1.1
NOTAS DE ATUALIZAÇÃO
(versão: v1.1)
MELHORIAS
Argumentos
Foi criada uma nova função em conjunto com a biblioteca argparse
para fazer o recebimento e a manipulação de argumentos. Agora o usuário pode passar o caminho de importação e exportação para o terminal.
Foi definido o caminho de exportação padrão como a mesma pasta na qual localiza-se o Script ou executável do Script.
Terminal
Houveram melhorias nas mensagens de erro exibidas pelo terminal, e foram criadas novas para atender a adição das funções relacionadas à argumentos do terminal.
Código
Houveram diversas mudanças e melhorias na documentação do código para facilitar a compreensão.
Agora o arquivo de terminal é ignorado com o .gitignore
.
ERROS CONSERTADOS
Foi criado o tratamento para chegar dentro do Script se no momento da operação a pasta existe.
v1.0 - First Best Release
NOTAS DE ATUALIZAÇÃO
(versão: v1.0)
Houveram muitas mudanças, desde documentação do código à algumas modificações de exportação e formatação. Essa é a melhor versão até o momento.
v0.9
NOTAS DE ATUALIZAÇÃO
(versão: v0.9)
Houve poucas atualizações na prática mais houveram muitas muitas mudanças na documentação, melhorias no código e similares para melhor funcionamento da aplicação e entendimento pro parte do desenvolvedor.
MELHORIAS
Código
Foram feitas algumas mudanças de disposição de código e de documentação para melhor entendimento.
Terminal
Agora o terminal exibe os índices corretamente e possui algumas melhorias visuais.
README
Agora o arquivo está finalmente estruturado e detalha alguns processos do código.
v0.8 - Huge Update
NOTAS DE ATUALIZAÇÃO
(versão: v0.8)
MELHORIAS
Exportação
Agora o resultado da exportação está mais fiel à tabela porque os dados são convertidos como string antes de serem passados ao DataFrame.
Terminal
Melhoria no leiaute da tabela do terminal.
Código
Agora o código possui um padrão de documentação melhor estruturado que antes, com títulos e descrições e com métodos separados por regiões.
Agora a conversão Lattice e Stream possui um método que deixa mais claro o entendimento.
O método 'cleanTextFile' foi mudado para 'formatTextFile' para melhor compreensão.
Estrutura de Arquivos
Os caminhos estão sendo dispostos de uma forma mais intuitiva, resultando em menos pastas.
ERROS CONSERTADOS
A saída do terminal agora está mais legível e os números de página foram trocados pelo índex da tabela, pois era o que estava sendo exibido anteriormente, apenas estava com o rótulo errado.
Agora o código está melhor formatado por conta das expressões regulares. Agora as seguintes situações foram tratadas.
- Campos vazios
- Zeros à esquerda (leading zeros)
- E números em inteiro que acabavam sendo convertidos para double resultando em zeros à direita desnecessários
v0.7 - Code Structure Update
NOTAS DE ATUALIZAÇÃO
(versão: v0.7)
O código está mais enxuto e com algumas mudanças na documentação e disposição do código.
MUDANÇAS
Apenas mudanças necessárias para facilitar a codificação do projeto.
v0.6
NOTAS DE ATUALIZAÇÃO
(versão: v0.6)
O código está mais enxuto com a criação de novos métodos.
MUDANÇAS
Remoção
Foi removida a exportação de arquivos com guess=False
ERROS CONSERTADOS
Agora as linhas que não possuem separador são apagadas (títulos, descrições, coisas que não são consideradas tabelas, ou seja, possuem divisões).
Foi resolvido um erro de codificação que impedia de algumas páginas serem convertidas.
Linhas de dados que estão completamente vazias são apagadas.
Foi arrumado um erro que impedia de Exceptions serem exibidas corretamente na saída do terminal.
v0.5
NOTAS DE ATUALIZAÇÃO
(versão: v0.5)
O código foi limpado evitando
NOVOS RECURSOS
Preparando Terreno
Adicionei algumas linhas de código para que fosse possível dar início à alguns testes futuros que vão ajudar a trazer melhorias ao código, no momento estou testando alguns modos de leitura e escrita de dados.
Observe que agora tem dois métodos de leitura (lattice e stream) cada um tendo o guess=False e guess=True.
MUDANÇAS
Melhorias
Agora a saída do terminal está mais limpa e tem uma linha ITENS10.pdf lattice=True guess=False
onde será possível realizar uma pesquisa com o CTRL + F
para achar a opção de sua escolha.
Remoção
Foi removida a conversão para Excel para facilitar e agilizar o andamento do projeto, ia ser muito difícil dar manutenção à conversão de texto e Excel ao mesmo tempo.
Além disso, como são muitos arquivos de PDF que são convertidos de uma vez, converter duas vezes toma bastante tempo, ainda mais quando é uma extensão de arquivo que aparenta ser mais complexa como Excel.
v0.4 - Appearance Update
NOTAS DE ATUALIZAÇÃO
(versão: v0.4)
NOVOS RECURSOS
Aparência
Todos os ícones do projeto foram atualizados.
Agora o projeto segue uma paleta de cores definida.
Praticidade
O executável foi gerado.
Agora tem uma progressBar para checar o andamento da conversão.
ERROS CONSERTADOS
Agora os números que antes eram gerados pelo index já não são gerados mais.