Ficheiros Suportados pelo OCR (apenas PDF e TIFF)

Ficheiros Suportados pelo OCR (apenas PDF e TIFF)

No filedoc apenas é possivel fazer leitura via OCR em dois tipos de formatos (PDF e TIFF).

A razão para isto é porque são os únicos tipos de ficheiro que suportam Multi Páginas, conforme explicação detalhada abaixo.

Suporte a Documentos de Múltiplas Páginas

1. PDF (Portable Document Format)

  • Capacidade de Múltiplas Páginas: O PDF é inerentemente projetado para suportar documentos de múltiplas páginas. Este formato é ideal para compilar várias páginas num único arquivo enquanto preserva o layout, as fontes e a formatação de cada página. Os PDFs são versáteis, permitindo a inclusão de texto, imagens e gráficos vetoriais. Eles são um padrão nos negócios para relatórios, contratos, manuais e mais.
  • Vantagens: Além do suporte a múltiplas páginas, os arquivos PDF podem ser protegidos com senhas e permissões, incluir metadados, suportar anotações e campos de formulários, e são universalmente acessíveis em vários softwares e hardware.

2. TIFF (Tagged Image File Format)

  • Capacidade de Múltiplas Páginas: O TIFF também suporta documentos de múltiplas páginas. É um formato preferido para documentos digitalizados que precisam ser arquivados, pois pode armazenar imagens de alta qualidade em um formato sem perdas. TIFFs de múltiplas páginas são comumente usados em setores como o legal, médico e áreas que requerem documentação de imagem detalhada.
  • Vantagens: Os arquivos TIFF são excelentes para armazenar dados de imagem brutos e não comprimidos, tornando-os adequados para trabalhos de impressão de alta qualidade e arquivamento digital de longo prazo.

Comparação com Outros Formatos

1. JPEG, PNG, BMP, GIF

  • Capacidade de Múltiplas Páginas: Estes formatos não suportam documentos de múltiplas páginas. Cada arquivo representa uma única imagem. Portanto, não são adequados para documentos que abrangem várias páginas, a menos que essas páginas sejam armazenadas como arquivos separados, o que complica a gestão e recuperação de arquivos.
  • Uso Comum: Geralmente usados para gráficos web (JPEG, PNG, GIF) e gráficos raster simples (BMP).

2. Microsoft Word (DOCX) e Outros Formatos de Texto

  • Capacidade de Múltiplas Páginas: Embora os arquivos DOCX possam conter várias páginas de texto, eles são principalmente formatos de texto e não servem para os mesmos propósitos que documentos de imagem de múltiplas páginas como PDF ou TIFF. DOCX e formatos similares são usados para documentos de texto editáveis.

Por que Focar em PDF e TIFF para um DMS?

  • Qualidade Arquivística: Tanto o PDF/A (uma variante do PDF especializada para arquivamento) quanto os formatos TIFF de múltiplas páginas são excelentes para preservar documentos em um formato de alta qualidade, estável e que atende a muitos padrões industriais para arquivamento digital.
  • Compatibilidade: Estes formatos são amplamente suportados e podem ser integrados facilmente na maioria dos sistemas de gestão de documentos e fluxos de trabalho existentes.
  • Eficiência: Gerir documentos de múltiplas páginas em formatos que suportam nativamente (como PDF e TIFF) reduz as complexidades relacionadas ao processamento e recuperação de documentos.

Considerações para um DMS

Usar PDF e TIFF para um DMS adaptado para lidar com tarefas de OCR de forma eficiente faz sentido devido às suas capacidades de múltiplas páginas, essenciais para a gestão de documentos simplificada, particularmente em ambientes que lidam com extensos arquivos de documentos. Esta estratégia pode melhorar a funcionalidade geral e a experiência do usuário do DMS ao simplificar o acesso e a gestão de documentos.

    • Related Articles

    • Entrada de um Documento via e-mail através de Plugin de Outlook

      Entrada de um Documento via e-mail através de Plugin de Outlook Para darmos entrada de um documento através do e-mail e depois de toda a instalação do plugin, e configurações de e-mails e utilizadores, temos que efectuar os seguintes passos: Entrar ...
    • O que é o Portal Filedoc e para o que serve?

      O que é o Portal Filedoc e para o que serve? O Portal Filedoc é uma ferramenta destinada a permitir que entidades externas à organização (como por exemplo fornecedores e parceiros) acedam ou submetam documentos, interajam com processos da organização ...
    • Configuração do Plugin de E-mail para Microsoft Outlook

      Uma das funcionalidades importantes do Filedoc é a possibilidade de utilizar o plugin de Microsoft outlook para efetuar entradas de Documentos no Filedoc, ou seja, registar os documentos. Para que isto funcione são necessárias algumas configurações ...
    • O que são Processos e para o que servem?

      O que são Processos e para o que servem? Processos são uma espécie de Dossiers onde toda a informação é armazenada. Para que a informação faça parte de um processo, o documento tem que ser associado a esse processo. A associação desse documento é ...
    • Tarefas- o que são e para o que servem?

      Tarefas- o que são e para o que servem As Tarefas são determinadas ações que podem ser atribuídas a um determinado destinatário, de acordo com o assunto escolhido. A tarefa irá adicionar um alerta para o utilizador que quisermos colocar o alerta, ...