Extract text from PDF, DOC, HTML, CHM, and RTF files Выдержка текста из PDF, DOC, HTML, CHM, RTF и файлы

Posted on January 19, 2008 at 7:31 am Опубликовано 19 января 2008 года в 7:31 утра

Have a document in PDF format that you would like to convert to a text document ? Есть документ в формате PDF, которые Вы хотели бы конвертировать в текстовый документ? Or maybe an HTML or CHM (Windows Help File) that you need to convert into simply plain text ? Или, может быть, один или HTML МП (Windows Помощь File), что вам нужно просто конвертировать в обычный текст? Why might this be useful you ask? Почему это могло бы быть полезным вы спрашиваете? Most PDF documents are not editable and selecting the text manually can be a tedious process. Большинство PDF документы не редактируемые и выбрав текст вручную, может оказаться утомительным процессом.

You can use Text-Mining-Tool to automatically extract text from a PDF file so that you can use it in any program freely. Вы можете использовать текст-горно-инструмент для автоматического извлечения текста из PDF файлов, что позволяет использовать его в любой программе свободно. Or if you cannot open a PDF file because you do not have a PDF viewer installed, you can use this tool to extract the text and read the document. Или, если вы не можете открыть PDF файл, потому что вы не имеете просмотра PDF установлен, вы можете использовать этот инструмент, чтобы извлечь текст, и читать этот документ.

Text Mining Tool is completely free and does not even require an installation, simply unzip it and run the program to use it. Текст Горный Инструмент абсолютно бесплатна, и даже не требует установки, просто извлеките его и запустить программу его использовать.

Текст горного инструмента

Click the Open button and choose your file that you want to convert to text. Нажмите кнопку Открыть и выбрать файл, который вы хотите превратить в текст. Click ok and the large window below the buttons will eventually fill with all of the text extracted from the document. Нажмите ок и большое окно ниже кнопок в конечном итоге заполнить все из текста извлекаются из документа.

отрывок текста

Click Save to save the extracted text to your computer. Нажмите кнопку Сохранить, чтобы сохранить полученные текст на компьютере. You can also click Clipboard to copy the mined text to the Windows clipboard. Вы также можете нажать буфер обмена для копирования заминированных текст в буфер обмена, Окна.

For convenience, the following hotkeys can be used to perform the operations: Для удобства, следующие горячие клавиши могут быть использованы для выполнения операций:

  • Open - F3 or O . Open - F3 или O.
  • Save - F2 or S . Сохранить - F2 или S.
  • Clipboard - F5 or C . Блокнот - F5 или C.
  • Exit - F10 or Escape . Выход - F10 или Побег.

You can also use the minetext console tool to create a batch script for extracting text from multiple files. Вы также можете использовать консоль minetext инструмент для создания партии скрипт для извлечения текста из нескольких файлов. This can be useful if you have a directory with a large number of files that need to have text extracted. Это может быть полезно, если у вас есть каталог с большим количеством файлов, которые необходимо иметь текст извлечено.

The included console tool minetext has the following syntax: Входящее в консоли инструмент minetext имеет следующий синтаксис:

 minetext <input file>  minetext <input file> <output file>  where:    <input file>  - any file with one of the following extensions:                   pdf, doc, rtf, chm, htm, html   <output file> - file you want to write text mined from input file minetext <input файла minetext <input файла <output файла, где: <input файла - любой файл с одним из следующих расширений: pdf, документ, rtf, chm, htm, html файла <output - файл, который вы хотите писать текст, добытых из входного файла 

If you’re a web designer, this program can be very useful to grab the text from a Word document without getting all of the extra Microsoft Office styling code included with the text. Если вы веб-дизайнер, эта программа может быть очень полезно извлекать из текста слово документ без получения всех дополнительных Microsoft Office укладка код включен в текст.

This is a very simple program that is very simple to use! Это очень простая программа, очень проста в использовании! It has one basic purpose and it does a good job! Она имеет одну основную цель, и она делает хорошее дело! Enjoy! Наслаждайтесь!

Technorati Tags: Technorati Tags: , , , , ,

If you enjoyed this post, make sure you Если вам понравилась эта должность, убедитесь, что вы subscribe to my RSS feed подписаться на мой канал ! !

» Filed Under »В соответствии с поданной Free Software Downloads Свободное программное обеспечение загрузки

Related Posts Похожие Сообщений

Please post your comments/suggestions! Пожалуйста, ваши комментарии и предложения!