Extraia o texto das limas do pdf, do DOC, do HTML, do CHM, e do rtf

Afixado janeiro em 19, 2008 em 7:31 am

Tenha um original dentro Formato do pdf que você gostaria de converter a um original do texto? Ou talvez HTML ou CHM (lima da ajuda de Windows) esse você necessita converter-se no texto simplesmente liso? Por que pôde isto ser útil você pede? A maioria de originais do pdf não são editable e selecionar o texto manualmente pode ser um processo tedious.

Você pode usar a Texto-Min-Ferramenta extrair automaticamente o texto de uma lima do pdf de modo que você possa a usar em todo o programa livremente. Ou se você não puder abrir uma lima do pdf porque você não tem um visor do pdf instalado, você pode usar esta ferramenta extrair o texto e ler o original.

A ferramenta minando do texto está completamente livre e não requer mesmo uma instalação, para unzip simplesmente a e funcionar o programa para usá-lo.

ferramenta minando do texto

Estale Aberto abotoe e escolha sua lima que você quer converter ao texto. A aprovação do clique e a janela grande abaixo das teclas encher-se-ão eventualmente com todo o texto extraído do original.

texto do extrato

Clique Excepto para conservar o texto extraído a seu computador. Você pode também estalar Prancheta para copí o texto minado à prancheta de Windows.

Para a conveniência, os seguintes hotkeys podem ser usados executar as operações:

  • Aberto - F3 ou O.
  • Excepto - F2 ou S.
  • Prancheta - F5 ou C.
  • Saída - F10 ou Escape.

Você pode também usar a ferramenta do console do minetext criar um certificado do grupo para extrair o texto das limas múltiplas. Isto pode ser útil se você tiver um diretório com um grande número limas que necessitam ter o texto extraído.

A ferramenta incluída do console minetext tem a seguinte sintaxe:

lima <de entrada do minetext>

lima <de entrada do minetext> <lima de saída>

onde:

     <lima de entrada>  - alguma lima com uma das seguintes extensões:
                  pdf, doc, rtf, chm, htm, lima
   <de saída do HTML> - lima que você quer escrever o texto minado da lima de entrada

Se você for um desenhador da correia fotorreceptora, este programa pode ser muito útil agarrar o texto de um original da palavra sem começar todo o Microsoft Office extra que denomina o código incluído com o texto.

Este é um programa muito simples que seja muito simples se usar! Tem uma finalidade básica e faz um trabalho bom! Aprecíe!

Tag de Technorati: , , , , ,

Se você apreciar este borne, certifica-se você subscreva a minha alimentação de RSS!

” Arquivado abaixo Downloads livres do software

Bornes relacionados

One Response to “Extract text from PDF, DOC, HTML, CHM, and RTF files”

  1. Gregg Decker said on :

    I am very impressed with you software suggestions. I find most of them useful. I look forward daily to my emails from you.
    I have one suggestion and that is to make it easier for users to download the software via one easy to find link. There have been a few times when I gave up looking for the link and then forgot all about the software that I could of found useful.

    Keep up the good work.

    Gregg Decker


Please post your comments/suggestions!