Главная > Java > Чтение Microsoft Word документ в JAVA

Чтение документа Microsoft Word в JAVA

Когда речь заходит о чтении Microsoft Office Word документ Java не имеет в создании классов справиться с этим, но Apache POI Пакет разработан Apache Foundation предоставляет Вам возможность чтения Microsoft Word документ в Java. Более подробную информацию о пакете Apache POI можно найти на сайте Apache POI

  ; импорт org.apache.poi.poifs.filesystem .*;
 ; импорт org.apache.poi.hwpf .*;
 ; импорт org.apache.poi.hwpf.extractor .*;
 ; импорт java.io. *;

 readDoc общественного класса
 (
	 main ( String [ ] args ) государственной статической силы основных (String [] агдз)
	 (
		 "Hello.doc" ; String filesname = "Hello.doc";
		 ; POIFSFileSystem фс = NULL;
		 пробовать
		 (
                   POIFSFileSystem ( new FileInputStream ( filesname ; FS = новый POIFSFileSystem (новый FileInputStream (filesname; 
                   / / Не удалось закрыть скобки в конце, как мой сайт не позволяет его закрыть

                   HWPFDocument ( fs ) ; HWPFDocument документ = новый HWPFDocument (ПС);

		   WordExtractor ( doc ) ; WordExtractor мы = новый WordExtractor (документ);

		   paragraphs = we. getParagraphText ( ) ; String [] = пунктах мы. GetParagraphText ();

		   . println ( "Word Document has " + paragraphs. length + " paragraphs" ) ; Система. У. Println ("Word Документ имеет" + пунктах. Длина + "пункты");
		   int i = 0 ; i < paragraphs . length ; i ++ ) { для (INT = 0; я <пунктов. длину; я + +) (
			 = paragraphs [ i ] . replaceAll ( " \\ cM? \r ? \n " , "" ) ; пункты [г] = пунктах [я]. replaceAll ("\ \ см? \ г? \ п", "");
                	 . println ( "Length:" + paragraphs [ i ] . length ( ) ) ; Система. У. Println ("Длина" + пунктах [я]. Длина ());
		   )
                 )
                 Exception e ) { поймать (Exception е) ( 
                     ; Е. printStackTrace ();
                 )
          )
 ) 

Адрес электронной почты:


Кодекс Пояснение:

  • Создание новых POIFSFileSystem объектов и передачи документа Microsoft Word на него
  • Создание нового объекта класса HWPFDocument, этот класс, непосредственно ответственного за обработку документа Microsoft Word
  • WordExtractor будет извлекать все слова из слова документа
  • getParagraphText () извлекает весь текст пункта мудрый
  • Наконец, мы стараемся читать пункте содержания


Система пользовательского поиска

Популярные статьи:

Делите и наслаждайтесь:
  • Print
  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • DZone
  • email
  • IndianPad
  • LinkedIn
  • Live
  • MySpace
  • Netvibes
  • RSS
  • Technorati
  • Yahoo! Bookmarks
  • Yahoo! Buzz
  • Reddit
  • Add to favorites
  • PDF
  • Twitter
Tags: Категории: Java Метки:
  1. Subramanyam
    24 ноября 2008 в 8:15 | # 1

    Привет,

    Я получаю ниже исключения во время выполнения этого примера.

    Не могли бы Вы пожалуйста, дайте мне знать, если мне не хватает какой-либо банки / должны делать ничего, чтобы выполнить это Java-класса.

    Заранее благодарим вас за вашу помощь.

    С уважением,
    Subramanyam.

  2. Subramanyam
    24 ноября 2008 08:16 | # 2

    Привет,

    Приносим извинения за спам. крепления исключение.

    Я получаю ниже исключения во время выполнения этого примера.

    java.io.IOException: Неверный заголовок подписи; читать 7021802808062469458, ожидаемые -2226271756974174256
    на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 112)
    на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
    на com.general.test.ReadDoc.main (ReadDoc.java: 16)

    Не могли бы Вы пожалуйста, дайте мне знать, если мне не хватает какой-либо банки / должны делать ничего, чтобы выполнить это Java-класса.

    Заранее благодарим вас за вашу помощь.

    С уважением,
    Subramanyam.

  3. Nishikanta Sahoo
    18 декабря 2008 в 5:16 | # 3

    После запуска этого кода я получил под исключение. Пожалуйста, дайте мне какое-либо решение по этому execption. Я уже вставить банку также, но я получил это execption. Одна вещь, я не получить эту EncryptedDocumentException.class в банке.

    Исключение в нити "основные" java.lang.NoClassDefFoundError: ORG / Apache / POI / EncryptedDocumentException
    на ws.WordRead.main (WordRead.java: 38)
    ОШИБКА: JDWP Невозможно получить JNI 1,2 окружающей среды, JVM-> GetEnv () возвращает код = -2
    JDWP выхода ошибка AGENT_ERROR_NO_JNI_ENV (183): [../../../ SRC / доли / назад / util.c: 820]

  4. 18 декабря 2008 в 23:33 | # 4

    Привет Nishikanta,
    Я использует POI-3.0.2-Final.jar и пои-блокнот-3.0.2-Final-20080204.jar пакетов для этого кода.

  5. тонкий
    18 марта 2009 в 02:00 | # 5

    После запуска этого кода excption "java.io.FileNotFoundException: hello.doc (система не может найти указанный файл)", был genereted
    Так где же я должен дать hello.doc (я создал его на моем рабочем столе) thankss

  6. 18 марта 2009 в 09:50 | # 6

    Привет Slim,
    Просто место, где hello.doc. Классе файл. Если вы ставите Док файл в другом месте, чем указать путь доступа в исходном коде. Она будет работать нормально.

    Спасибо,
    Hitesh Agrawal

  7. тонкий
    24 марта 2009 в 3:51 | # 7

    привет,
    спасибо за ответ.
    скрипт работает очень хорошо.
    что эффект от использования "пункты [г] = пунктах [я]. replaceAll (" \ \ см? \ г? \ п ","");"

    спасибо

  8. Лейкер
    24 марта 2009 в 4:12 | # 8

    Привет,
    Спасибо за этот пост, это очень полезно.
    Я пытаюсь найти слова на мои слова, файл после прочтения файла.
    Как я могу это сделать??

    Большое спасибо

  9. Amit
    9 апреля 2009 в 6:23 | # 9

    java.io.IOException: Невозможно прочитать весь заголовок; 6 байт читать, ожидается 512 байт
    на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
    на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
    на org.apache.poi.hwpf.HWPFDocument.verifyAndBuildPOIFS (HWPFDocument.java: 133)
    на org.apache.poi.hwpf.HWPFDocument. (HWPFDocument.java: 146)
    на transactionDB.changeFormat.main (changeFormat.java: 45)

    Ошибка показать то, что я должен делать скажите мне, пожалуйста

  10. Ankur Raiyani
    20 мая 2009 в 21:53 | # 10

    Привет Hitesh,

    Спасибо за обмен этот пример. У меня есть различные требования со словом файла. Я хочу добавить изображение в документ, используя слово POI, но не знаю как это сделать.

    Спасибо,
    Ankur Raiyani

  11. 2 июля 2009 в 8:57 | # 11

    Как я прочитал слова комментарии и закладки, используя Java? У тебя есть пример кода? Любая помощь будет признателен.

  12. Sathish Раджа
    10 июля 2009 в 4:31 | # 12

    привет друзьям,
    Может кто поможет мне в этом ... ... ... я был, используйте этот код, и им это geting исключения ... ... я использую пои-2.5.1-окончательном 20040804.jar.and пои-блокнот-3.5-beta5-20090219.jar файлы ... ... .. как указать путь доступа в исходном коде ... .. я держал этот файл в рабочий стол

    java.io.IOException: Неверный заголовок подписи; читать 85966670672, ожидаемые -2226271756974174256
    на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 88)
    на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
    на rb.action.FileRead.main (FileRead.java: 15)

  13. Прабху
    11 июля 2009 в 00:40 | # 13

    Sathish Раджа,

    Вы зафиксировали вопрос, если фиксированный пожалуйста, напишите шаги

  14. Darren Слевина
    15 июля 2009 в 14:02 | # 14

    Привет Hitesh,

    где я могу хранить POI-3.0.2-Final.jar и пои-блокнот-3.0.2-Final-20080204.jar файлов. Я просто хочу, чтобы получить приведенном выше примере работы. Cheers за помощь.

    Darren

  15. devday
    17 июля 2009 в 23:20 | # 15

    Привет друзья,

    При выполнении этого кода я получаю следующие error.can кто-нибудь сказать мне, как решить эту проблему.

    java.io.IOException: Невозможно прочитать весь заголовок; -1 байт читать, ожидается 512 байт
    на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
    на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)

  16. Каравай
    18 июля 2009 в 18:33 | # 16

    привет! им действительно потеряли ... Я очень новой для этого пои, но я должен использовать это для моего проекта, который должен прочитать слово документ с помощью Java ... Как я могу "импорт" пакет для org.apache.poi? Я скачал пои-3.5-beta6 и попросил меня установить муравьев и лес .. он попросил меня, чтобы переменная окружения ANT_HOME и FORREST_HOME .. Пожалуйста, помогите мне .. им путать!

  17. Сулаб
    4 августа 2009 в 4:14 | # 17

    Привет друзья,

    Я пытаюсь изменить размер шрифта текста.
    Для этого я пишу 1 HWPF потока в другой и, следовательно, можно изменить шрифт, но что я точно достаточно иметь другой шрифт (и / или размера) за каждое слово или абзац. В основном на более чем 1 размер шрифта в одной части слова файла.
    Может кто-нибудь пожалуйста, скажите мне, как идти об этом??

  18. Сулаб
    4 августа 2009 в 4:15 | # 18

    то, что я точно нужно ...
    ДОД gedgfe
    RBR brbr gbntghth
    rghh rtfhtyh bnfgh
    то есть каждое слово, имеющих различные свойства шрифта

  19. Shriddha
    27 августа 2009 в 2:29 | # 19

    получаю ошибку:
    java.lang.NoClassDefFoundError: ORG / Apache / POI / hpsf / WritingNotSupportedException

  20. Гокул
    10 сентября 2009 в 2:43 | # 20

    привет,

    Я произведу ур программы Java читать слова документа. он работает хорошо, а если Хава слова документа таблицы. код получения вредоносного скрипта, и код выполняется infinte цикла.

    Скажите, пожалуйста, есть ли методы для чтения данных из таблицы в документ Word.

  21. Мистифицировать
    13 ноября 2009 в 09:05 | # 21

    @ Ankur Raiyani
    Были ли у Вас удача получить Apache POI для вставки изображений в документ Word. Я пытаюсь делать то же самое.

  22. 27 декабря 2009 в 01:11 | # 22

    Большое спасибо.

  23. тенистый
    6 января 2010 в 23:04 | # 23

    plzzzz быстро Мне нужна помощь: я использую 2 файлов. файл с заголовком и без заголовка файла, когда я вхожу в файл без заголовка дать мне эту ошибку java.io.IOException: Неверный заголовок подписи; читать 0x665C316674725C7B, ожидаемые 0xE11AB1A1E011CFD0
    на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 107)
    на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
    на wordtotext.Main.main (Main.java: 30)
    и второй файл запуска хорошие helpme Plz

  24. WKKasun Chamika
    21 марта 2010 в 21:51 | # 24

    Спасибо у 4 г код

    System.out.println (пункты [я]. ToString ()) / / для печати пунктах

  25. Sushree Das
    23 марта 2010 в 04:30 | # 25

    пожалуйста, кто может дать мне код Java с помощью которых я могу вставить изображение в файл MS Word в любом месте, а также считают, что у него есть caontent на it.plz ответить мне ..

  26. Sushree Das
    23 марта 2010 в 4:31 | # 26

    пожалуйста, дайте мне знать, как вставить изображение в Word DOC файл

  27. параметров
    1 апреля 2010 в 1:52 | # 27

    пожалуйста, дайте мне знать, как мы можем читать образы. Doc файл вместе с текстом с использованием Java

  28. 21 апреля 2010 в 15:29 | # 28

    Excellent.

    Спасибо большое.

  29. UJJAL
    6 мая 2010 в 2:14 | # 29

    Я begineer о java.When я скомпилировать этот пример, который я получил 9 ошибок.
    Помогите мне, пожалуйста ...

    org.apache.poi.poifs.filesystem пакета не существует
    импорт org.apache.poi.poifs.filesystem .*;

    org.apache.poi.hwpf пакета не существует
    импорт org.apache.poi.hwpf .*;

    org.apache.poi.hwpf.extractor пакета не существует
    импорт org.apache.poi.hwpf.extractor .*;

    не могу найти символ
    Символ: класс POIFSFileSystem
    Место: класс readDoc
    POIFSFileSystem фс = NULL;

    не могу найти символ
    Символ: класс POIFSFileSystem
    Место: класс readDoc
    FS = новый POIFSFileSystem (новый FileInputStream (filesname));

    не могу найти символ
    Символ: класс HWPFDocument
    Место: класс readDoc
    HWPFDocument документ = новый HWPFDocument (ПС);

    не могу найти символ
    Символ: класс HWPFDocument
    Место: класс readDoc
    HWPFDocument документ = новый HWPFDocument (ПС);

    не могу найти символ
    Символ: класс WordExtractor
    Место: класс readDoc
    WordExtractor мы = новый WordExtractor (документ);

    не могу найти символ
    Символ: класс WordExtractor
    Место: класс readDoc
    WordExtractor мы = новый WordExtractor (документ);

    9 ошибки

  30. UJJAL
    6 мая 2010 в 7:04 | # 30

    Пожалуйста, кто-нибудь мне помочь ...
    Позвольте мне знать об основных работу шахта для чтения документа ..

  31. 8 мая 2010 в 02:12 | # 31

    Привет UJJAL,
    Вам придется добавить Apache POI библиотеки в своем классе путь, чтобы он работал. Вы можете скачать Apache POI пакеты из http://poi.apache.org/ , а также вы пытаетесь читать документы Microsoft слово Java, чем вы также требуют этого библиотеки. http://poi.apache.org/ hwpf / index.html

    Спасибо,
    Hitesh Agarwal

  32. 12 мая 2010 в 18:22 | # 32

    Очень приятно информации.

  33. Петр Rychlik
    14 мая 2010 в 9:35 | # 33

    Можно ли изменить. Документ и / или. Docx документов с POI? Я бы хотел, чтобы иметь возможность заменить отдельные фрагменты текста в нескольких документах Word, а затем сохранить обновленные документы на диске.

  34. UJJAL
    16 мая 2010 в 5:27 | # 34

    Этот код читать. Документ пункта файл пункта.
    Как я могу посмотреть этот файл, предложение за предложением?

    Спасибо заранее.

  35. melaal
    22 мая 2010 в 1:51 | # 35

    Как я могу прочитать документ с текстом и изображениями?

  36. melaal
    22 мая 2010 в 1:56 | # 36

    и как я могу читать текст со стилем?

  37. Петр Rychlik
    24 мая 2010 в 4:39 | # 37

    Привет,

    Как заменить одну строку на другую в. Документ документы?

  38. Петр Rychlik
    26 мая 2010 в 13:35 | # 38

    Я думаю, Есть много серьезных ошибок в осуществлении HWPF формате, например, следующие:

    HWPFDocument документ = новый HWPFDocument (входящего);
    doc.write (выходящий);

    очереди. Doc файлов в somethig, которые не могут быть открыты Word больше.

  39. bshirota
    11 июня 2010 в 15:32 | # 39

    Hitesh,

    Спасибо за это. Отличный пост .. спас меня тонну поиска.

  40. Гаяна
    22 июня 2010 в 3:31 | # 40

    Как определить направление движения. Doc файл ....

    пожалуйста ...

    Пришлите мне код ...

  41. Гаяна
    22 июня 2010 в 3:33 | # 41

    Как определить направление движения. Doc файл .... Использование Apache POI

    пожалуйста ...

    Пришлите мне код ...

  42. Brijesh
    7 июля 2010 в 23:17 | # 42

    Привет

    Можете ли вы сказать мне, как читать документ файл изображения, которые с ним.

    Опубликовать код, если это возможно ..

  1. Нет уведомлений.