提取文本從PDF、DOC、HTML、CHM和RTF文件

張貼在2008年1月19日在7:31上午

有一個文件 您希望轉換成文本文件的PDF格式? 或可能 HTML或CHM (窗口幫助文件)那您需要轉換成簡單地純文本? 為什麼這也許是有用的您要求? 多數PDF文件不是編輯可能的,并且選擇文本可以手工是一個繁瑣的過程。

您能使用文本採礦工具自動地提取文本從PDF文件,以便您在所有節目能自由地使用它。 或,如果您不可能打開PDF文件,因為不安排一個PDF觀察者安裝您,您能使用這個工具提取文本和讀本文。

文本採礦工具是完全地自由的,并且甚而不要求設施,簡單地拉開它拉鏈和運行節目使用它。

文本採礦工具

點擊 開放 按并且選擇您想要轉換成文本的您的文件。 點擊ok和大窗口在按鈕之下用從本文提取的所有文本最終將填裝。

萃取物文本

點擊 保存 保存提取的文本到您的計算機。 您能也點擊 剪貼板 複製被開採的文本到窗口剪貼板。

對於便利,以下hotkeys可以用於進行操作:

  • 開放- F3O.
  • 保存- F2S.
  • 剪貼板- F5C.
  • 出口- F10逃命.

您能也使用minetext控制臺工具創造批劇本為提取文本從多文件。 這可以是有用的,如果您有一個目錄與需要有提取的文本的很大數量的文件。

包括的控制臺工具 minetext 有以下句法:

minetext <輸入文件>

minetext <輸入文件> <輸出文件>

那裡:

     <輸入文件>  -任何文件以以下引伸之一:
                  pdf, doc, rtf, chm, htm, html
   <輸出文件> -您想要寫從輸入文件開採的文本的文件

如果您是網設計師,這個節目可以是非常有用劫掠文本從詞文件,无需得到稱呼代碼的所有額外微軟辦公系統包括有文本。

這是非常簡單使用的一個非常簡單的節目! 它有一個基本的目的,并且它做一個好工作! 享用!

Technorati標記: , , , , ,

如果您享受這個崗位,確定您 訂閱對我的RSS飼料!

」歸檔下 免費軟件下載

相關崗位

One Response to “Extract text from PDF, DOC, HTML, CHM, and RTF files”

  1. Gregg Decker said on :

    I am very impressed with you software suggestions. I find most of them useful. I look forward daily to my emails from you.
    I have one suggestion and that is to make it easier for users to download the software via one easy to find link. There have been a few times when I gave up looking for the link and then forgot all about the software that I could of found useful.

    Keep up the good work.

    Gregg Decker


Please post your comments/suggestions!