Extract text from PDF, DOC, HTML, CHM, and RTF files 텍스트를 추출합니다 하드 박사, html, chm, 그리고 rtf 파일을

Posted on January 19, 2008 at 7:31 am 게재된 2008년 1월 19일은 오전 7시 31분

Have a document in PDF format that you would like to convert to a text document ? 이 문서의 형식을 텍스트 문서로 변환하실 것인지? Or maybe an HTML or CHM (Windows Help File) that you need to convert into simply plain text ? 아니면이 해당 또는 chm (windows 도움말 파일)을 필요로 간단하게 일반 텍스트로 변환하려면? Why might this be useful you ask? 왜 이것이 유용할 수도있습니다 물어보세요? Most PDF documents are not editable and selecting the text manually can be a tedious process. 대부분의 문서는 텍스트를 수동으로 편집을 선택하십시오 지루한 과정이 될 수합니다.

You can use Text-Mining-Tool to automatically extract text from a PDF file so that you can use it in any program freely. 텍스트를 사용할 수있습니다 - 채광 - 도구를 사용하여 파일에서 텍스트를 자동으로 추출합니다 그래서 어떤 프로그램을 무료로 사용하실 수있습니다. Or if you cannot open a PDF file because you do not have a PDF viewer installed, you can use this tool to extract the text and read the document. 아니면 파일을 열 수없는 경우가 pdf 뷰어를 설치하지 않기 때문에, 당신의 압축을 풀 수있습니다이 도구를 사용하여 문서에 텍스트를 읽고합니다.

Text Mining Tool is completely free and does not even require an installation, simply unzip it and run the program to use it. 텍스트 마이닝 도구는 완전 무료이며 설치를 필요로하지도 않는데, 간단하게 압축하고 프로그램을 실행합니다를 사용합니다.

텍스트 마이닝 도구를

Click the Open button and choose your file that you want to convert to text. 열기 단추를 클릭하고 원하는 파일을 선택하십시오를 텍스트로 변환합니다. Click ok and the large window below the buttons will eventually fill with all of the text extracted from the document. 대형 창을 확인 '을 클릭하고 아래에있는 단추를 채우는 결국이 문서의 모든 텍스트를 추출합니다.

텍스트를 추출합니다

Click Save to save the extracted text to your computer. 저장을 클릭하여 압축을 푼 텍스트를 사용자 컴퓨터에 저장합니다. You can also click Clipboard to copy the mined text to the Windows clipboard. 또한 클립 보드를 클릭하십시오 창문 클립 보드에 복사하려면 텍스트를 발굴합니다.

For convenience, the following hotkeys can be used to perform the operations: 편의를 위해 다음과 같은 핫키의 작업을 수행하는 데 사용될 수있습니다 :

  • Open - F3 or O . 오픈 - f3 또는 오.
  • Save - F2 or S . 저장 - f2 또는 초.
  • Clipboard - F5 or C . 클립 보드 - f5 또는 c합니다.
  • Exit - F10 or Escape . 출구 - F10을하거나 탈출합니다.

You can also use the minetext console tool to create a batch script for extracting text from multiple files. minetext 콘솔을 사용할 수도있습니다 도구를 사용하여 텍스트를 추출하기위한 스크립트를 만들려면 여러 개의 파일을 일괄 처리합니다. This can be useful if you have a directory with a large number of files that need to have text extracted. 이것이 유용할 수있습니다 디렉토리에있는 경우에는 다수의 파일이 텍스트를 압축 해제해야합니다.

The included console tool minetext has the following syntax: 콘솔 도구가 포함되어 minetext는 다음과 같은 구문 :

 minetext <input file>  minetext <input file> <output file>  where:    <input file>  - any file with one of the following extensions:                   pdf, doc, rtf, chm, htm, html   <output file> - file you want to write text mined from input file <input 파일> <input 파일 minetext <output minetext 파일 위치 : <input 파일 - 어떤 파일을 다음 중 하나를 확장 : 하드 의사,,, chm, htm, html <output 파일> - 파일 싶은 쓰기 텍스트 입력 파일로부터 수집한 

If you’re a web designer, this program can be very useful to grab the text from a Word document without getting all of the extra Microsoft Office styling code included with the text. 웹 디자이너가하는 경우,이 프로그램의 텍스트를 잡기 위해 매우 유용할 수있습니다 점점하지 않고 문서를 한 마디도 마이크로 소프트의 모든 사무실 스타일링 코드에 포함되어있는 여분의 텍스트합니다.

This is a very simple program that is very simple to use! 이것은 아주 간단한 프로그램이 작업은 매우 간단를 사용할 수있습니다! It has one basic purpose and it does a good job! 그것이 하나의 기본적인 목적과 상관 좋은 직업! Enjoy! 즐거운 시간 되십시오!

Technorati Tags: technorati 태그 : , , , , ,

If you enjoyed this post, make sure you 이 게시물에 즐거워하는 경우, 있는지 확인하십시오 subscribe to my RSS feed 내 피드 구독하려면 ! !

» Filed Under »소송 아래에 Free Software Downloads 무료 소프트웨어 다운로드

Related Posts 관련 게시물

Please post your comments/suggestions! 게시물하시기 바랍니다 귀하의 의견 / 제안!