Extract text from PDF, DOC, HTML, CHM, and RTF files PDFファイルからテキストを抽出する、ドキュメントは、 HTMLの、のCHMは、ファイルやRTFに

Posted on January 19, 2008 at 7:31 am投稿された2008年1月19日、午前7時31時

Have a document in PDF format that you would like to convert to a text document ? PDF形式の文書があることをご希望のテキスト文書に変換するか? Or maybe an HTML or CHM (Windows Help File) that you need to convert into simply plain text ?あるいはHTMLやのCHM ( Windowsヘルプファイル)に変換する必要があります単にプレーンテキストか? Why might this be useful you ask?なぜこれに役立つかもしれないことを聞くの? Most PDF documents are not editable and selecting the text manually can be a tedious process.ほとんどのPDF文書ではないと選択して、テキストを手動で編集することができます退屈な作業です。

You can use Text-Mining-Tool to automatically extract text from a PDF file so that you can use it in any program freely.テキストマイニングに使用することができますツールを自動的にPDFファイルからテキストを抽出することができますので、任意のプログラムを自由に使用することはできません。 Or if you cannot open a PDF file because you do not have a PDF viewer installed, you can use this tool to extract the text and read the document.または場合は、 pdfファイルを開くことができませんのでお持ちでないPDFビューアをインストールすると、このツールを使用すると、テキストを抽出するドキュメントを読んでください。

Text Mining Tool is completely free and does not even require an installation, simply unzip it and run the program to use it.テキストマイニングツールは、完全に自由ではないのインストールを必要とするも、そのプログラムを実行するだけで解凍してから、それを使うようにします。

テキストマイニングツール

Click the Open button and choose your file that you want to convert to text. [開く ]ボタンをクリックしてファイルを選択してもよろしいですかテキストに変換している。 Click ok and the large window below the buttons will eventually fill with all of the text extracted from the document. [ OK ]をクリックし、最終的には大きな窓の下のボタンをクリックし、すべてのテキストを記入して、文書から抽出されます。

テキスト抽出物

Click Save to save the extracted text to your computer. [ 保存 ]をクリックしてテキストを抽出してお使いのコンピュータに保存しています。 You can also click Clipboard to copy the mined text to the Windows clipboard.をクリックすることもできます。採掘されたテキストをクリップボードにコピーし、 Windowsのクリップボードです。

For convenience, the following hotkeys can be used to perform the operations:便宜上、ホットキーを使用すると、次の操作を実行します:

  • Open - F3 or O .オープン-なF 3や O
  • Save - F2 or S .保存-F 2キーまたは秒す。
  • Clipboard - F5 or C .クリップボード-F 5を押すまたはC す。
  • Exit - F10 or Escape .出口-f 10または脱出。

You can also use the minetext console tool to create a batch script for extracting text from multiple files.コンソールを使用することも可能minetextバッチスクリプトを作成するためのツールをテキストから複数のファイルを解凍します。 This can be useful if you have a directory with a large number of files that need to have text extracted.これが有用なディレクトリがある場合は、大量のファイルのテキストを抽出しておく必要がある。

The included console tool minetext has the following syntax: minetext 、同梱のコンソールツールは、以下の構文:

 minetext <input file>  minetext <input file> <output file>  where:    <input file>  - any file with one of the following extensions:                   pdf, doc, rtf, chm, htm, html   <output file> - file you want to write text mined from input file <input minetextファイル> minetext <inputファイル> <出力ファイル>場所: <inputファイル> -任意のファイルを次のいずれかの拡張子: P DFファイル、ドキュメント、 R TFには、のC HMは、ファイルが正常には、 H TMLの<出力ファイル-したいファイルを選択入力ファイルからテキスト採掘を書く 

If you’re a web designer, this program can be very useful to grab the text from a Word document without getting all of the extra Microsoft Office styling code included with the text.ウェブデザイナーの場合は、このプログラムは、非常に有用につかまり、 Word文書からのテキストを出さずに余分なマイクロソフトオフィススタイリングのすべてのコードに含まれているテキストです。

This is a very simple program that is very simple to use!これは非常に簡単なプログラムを使用することは、非常に単純なもの! It has one basic purpose and it does a good job!それは1つの基本的な目的とすることはいい仕事! Enjoy!楽しんでください!

Technorati Tags: Technoratiタグ: , , , , ,

If you enjoyed this post, make sure you この投稿を享受する場合は、必ず subscribe to my RSS feed 私のRSSフィードを購読して !

» Filed Under »提出下 Free Software Downloadsフリーソフトウェアのダウンロード

Related Posts関連記事

One Response to “Extract text from PDF, DOC, HTML, CHM, and RTF files” 1つの反応を" PDFファイルからテキストを抽出する、ドキュメントは、 HTMLの、のCHMは、ファイルやRTFに"

  1. Gregg Decker said on : デッカーによると、グレッグ:

    I am very impressed with you software suggestions.私は非常に感銘を受けるソフトウェアをご提案します。 I find most of them useful.それらのほとんどは私を見つける便利です。 I look forward daily to my emails from you.私と私の日常からのメールを心待ちにした。
    I have one suggestion and that is to make it easier for users to download the software via one easy to find link.私は、それは1つの提案をしやすくするために、ソフトウェアのダウンロードを介してユーザーが1つのリンクを簡単に見つける。 There have been a few times when I gave up looking for the link and then forgot all about the software that I could of found useful.がなされてきたときに数回あきらめたのリンクを探して、それから忘れたのソフトウェアについては、すべての可能性を発見して私に便利です。

    Keep up the good work.調子で頑張ってください。

    Gregg Deckerグレッグデッカー


    Please post your comments/suggestions!コメントを投稿してください/アドバイス!