Чтение документа Microsoft Word в JAVA
Когда речь заходит о чтении Microsoft Office Word документ Java не имеет в создании классов справиться с этим, но Apache POI Пакет разработан Apache Foundation предоставляет Вам возможность чтения Microsoft Word документ в Java. Более подробную информацию о пакете Apache POI можно найти на сайте Apache POI
; импорт org.apache.poi.poifs.filesystem .*; ; импорт org.apache.poi.hwpf .*; ; импорт org.apache.poi.hwpf.extractor .*; ; импорт java.io. *; readDoc общественного класса ( main ( String [ ] args ) государственной статической силы основных (String [] агдз) ( "Hello.doc" ; String filesname = "Hello.doc"; ; POIFSFileSystem фс = NULL; пробовать ( POIFSFileSystem ( new FileInputStream ( filesname ; FS = новый POIFSFileSystem (новый FileInputStream (filesname; / / Не удалось закрыть скобки в конце, как мой сайт не позволяет его закрыть HWPFDocument ( fs ) ; HWPFDocument документ = новый HWPFDocument (ПС); WordExtractor ( doc ) ; WordExtractor мы = новый WordExtractor (документ); paragraphs = we. getParagraphText ( ) ; String [] = пунктах мы. GetParagraphText (); . println ( "Word Document has " + paragraphs. length + " paragraphs" ) ; Система. У. Println ("Word Документ имеет" + пунктах. Длина + "пункты"); int i = 0 ; i < paragraphs . length ; i ++ ) { для (INT = 0; я <пунктов. длину; я + +) ( = paragraphs [ i ] . replaceAll ( " \\ cM? \r ? \n " , "" ) ; пункты [г] = пунктах [я]. replaceAll ("\ \ см? \ г? \ п", ""); . println ( "Length:" + paragraphs [ i ] . length ( ) ) ; Система. У. Println ("Длина" + пунктах [я]. Длина ()); ) ) Exception e ) { поймать (Exception е) ( ; Е. printStackTrace (); ) ) )
Кодекс Пояснение:
- Создание новых POIFSFileSystem объектов и передачи документа Microsoft Word на него
- Создание нового объекта класса HWPFDocument, этот класс, непосредственно ответственного за обработку документа Microsoft Word
- WordExtractor будет извлекать все слова из слова документа
- getParagraphText () извлекает весь текст пункта мудрый
- Наконец, мы стараемся читать пункте содержания

Система пользовательского поиска



































Привет,
Я получаю ниже исключения во время выполнения этого примера.
Не могли бы Вы пожалуйста, дайте мне знать, если мне не хватает какой-либо банки / должны делать ничего, чтобы выполнить это Java-класса.
Заранее благодарим вас за вашу помощь.
С уважением,
Subramanyam.
Привет,
Приносим извинения за спам. крепления исключение.
Я получаю ниже исключения во время выполнения этого примера.
java.io.IOException: Неверный заголовок подписи; читать 7021802808062469458, ожидаемые -2226271756974174256
на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 112)
на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
на com.general.test.ReadDoc.main (ReadDoc.java: 16)
Не могли бы Вы пожалуйста, дайте мне знать, если мне не хватает какой-либо банки / должны делать ничего, чтобы выполнить это Java-класса.
Заранее благодарим вас за вашу помощь.
С уважением,
Subramanyam.
После запуска этого кода я получил под исключение. Пожалуйста, дайте мне какое-либо решение по этому execption. Я уже вставить банку также, но я получил это execption. Одна вещь, я не получить эту EncryptedDocumentException.class в банке.
Исключение в нити "основные" java.lang.NoClassDefFoundError: ORG / Apache / POI / EncryptedDocumentException
на ws.WordRead.main (WordRead.java: 38)
ОШИБКА: JDWP Невозможно получить JNI 1,2 окружающей среды, JVM-> GetEnv () возвращает код = -2
JDWP выхода ошибка AGENT_ERROR_NO_JNI_ENV (183): [../../../ SRC / доли / назад / util.c: 820]
Привет Nishikanta,
Я использует POI-3.0.2-Final.jar и пои-блокнот-3.0.2-Final-20080204.jar пакетов для этого кода.
После запуска этого кода excption "java.io.FileNotFoundException: hello.doc (система не может найти указанный файл)", был genereted
Так где же я должен дать hello.doc (я создал его на моем рабочем столе) thankss
Привет Slim,
Просто место, где hello.doc. Классе файл. Если вы ставите Док файл в другом месте, чем указать путь доступа в исходном коде. Она будет работать нормально.
Спасибо,
Hitesh Agrawal
привет,
спасибо за ответ.
скрипт работает очень хорошо.
что эффект от использования "пункты [г] = пунктах [я]. replaceAll (" \ \ см? \ г? \ п ","");"
спасибо
Привет,
Спасибо за этот пост, это очень полезно.
Я пытаюсь найти слова на мои слова, файл после прочтения файла.
Как я могу это сделать??
Большое спасибо
java.io.IOException: Невозможно прочитать весь заголовок; 6 байт читать, ожидается 512 байт
на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
на org.apache.poi.hwpf.HWPFDocument.verifyAndBuildPOIFS (HWPFDocument.java: 133)
на org.apache.poi.hwpf.HWPFDocument. (HWPFDocument.java: 146)
на transactionDB.changeFormat.main (changeFormat.java: 45)
Ошибка показать то, что я должен делать скажите мне, пожалуйста
Привет Hitesh,
Спасибо за обмен этот пример. У меня есть различные требования со словом файла. Я хочу добавить изображение в документ, используя слово POI, но не знаю как это сделать.
Спасибо,
Ankur Raiyani
Как я прочитал слова комментарии и закладки, используя Java? У тебя есть пример кода? Любая помощь будет признателен.
привет друзьям,
Может кто поможет мне в этом ... ... ... я был, используйте этот код, и им это geting исключения ... ... я использую пои-2.5.1-окончательном 20040804.jar.and пои-блокнот-3.5-beta5-20090219.jar файлы ... ... .. как указать путь доступа в исходном коде ... .. я держал этот файл в рабочий стол
java.io.IOException: Неверный заголовок подписи; читать 85966670672, ожидаемые -2226271756974174256
на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 88)
на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
на rb.action.FileRead.main (FileRead.java: 15)
Sathish Раджа,
Вы зафиксировали вопрос, если фиксированный пожалуйста, напишите шаги
Привет Hitesh,
где я могу хранить POI-3.0.2-Final.jar и пои-блокнот-3.0.2-Final-20080204.jar файлов. Я просто хочу, чтобы получить приведенном выше примере работы. Cheers за помощь.
Darren
Привет друзья,
При выполнении этого кода я получаю следующие error.can кто-нибудь сказать мне, как решить эту проблему.
java.io.IOException: Невозможно прочитать весь заголовок; -1 байт читать, ожидается 512 байт
на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
привет! им действительно потеряли ... Я очень новой для этого пои, но я должен использовать это для моего проекта, который должен прочитать слово документ с помощью Java ... Как я могу "импорт" пакет для org.apache.poi? Я скачал пои-3.5-beta6 и попросил меня установить муравьев и лес .. он попросил меня, чтобы переменная окружения ANT_HOME и FORREST_HOME .. Пожалуйста, помогите мне .. им путать!
Привет друзья,
Я пытаюсь изменить размер шрифта текста.
Для этого я пишу 1 HWPF потока в другой и, следовательно, можно изменить шрифт, но что я точно достаточно иметь другой шрифт (и / или размера) за каждое слово или абзац. В основном на более чем 1 размер шрифта в одной части слова файла.
Может кто-нибудь пожалуйста, скажите мне, как идти об этом??
то, что я точно нужно ...
ДОД gedgfe
RBR brbr gbntghth
rghh rtfhtyh bnfgh
то есть каждое слово, имеющих различные свойства шрифта
получаю ошибку:
java.lang.NoClassDefFoundError: ORG / Apache / POI / hpsf / WritingNotSupportedException
привет,
Я произведу ур программы Java читать слова документа. он работает хорошо, а если Хава слова документа таблицы. код получения вредоносного скрипта, и код выполняется infinte цикла.
Скажите, пожалуйста, есть ли методы для чтения данных из таблицы в документ Word.
@ Ankur Raiyani
Были ли у Вас удача получить Apache POI для вставки изображений в документ Word. Я пытаюсь делать то же самое.
Большое спасибо.
plzzzz быстро Мне нужна помощь: я использую 2 файлов. файл с заголовком и без заголовка файла, когда я вхожу в файл без заголовка дать мне эту ошибку java.io.IOException: Неверный заголовок подписи; читать 0x665C316674725C7B, ожидаемые 0xE11AB1A1E011CFD0
на org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 107)
на org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
на wordtotext.Main.main (Main.java: 30)
и второй файл запуска хорошие helpme Plz
Спасибо у 4 г код
System.out.println (пункты [я]. ToString ()) / / для печати пунктах
пожалуйста, кто может дать мне код Java с помощью которых я могу вставить изображение в файл MS Word в любом месте, а также считают, что у него есть caontent на it.plz ответить мне ..
пожалуйста, дайте мне знать, как вставить изображение в Word DOC файл
пожалуйста, дайте мне знать, как мы можем читать образы. Doc файл вместе с текстом с использованием Java
Excellent.
Спасибо большое.
Я begineer о java.When я скомпилировать этот пример, который я получил 9 ошибок.
Помогите мне, пожалуйста ...
org.apache.poi.poifs.filesystem пакета не существует
импорт org.apache.poi.poifs.filesystem .*;
org.apache.poi.hwpf пакета не существует
импорт org.apache.poi.hwpf .*;
org.apache.poi.hwpf.extractor пакета не существует
импорт org.apache.poi.hwpf.extractor .*;
не могу найти символ
Символ: класс POIFSFileSystem
Место: класс readDoc
POIFSFileSystem фс = NULL;
не могу найти символ
Символ: класс POIFSFileSystem
Место: класс readDoc
FS = новый POIFSFileSystem (новый FileInputStream (filesname));
не могу найти символ
Символ: класс HWPFDocument
Место: класс readDoc
HWPFDocument документ = новый HWPFDocument (ПС);
не могу найти символ
Символ: класс HWPFDocument
Место: класс readDoc
HWPFDocument документ = новый HWPFDocument (ПС);
не могу найти символ
Символ: класс WordExtractor
Место: класс readDoc
WordExtractor мы = новый WordExtractor (документ);
не могу найти символ
Символ: класс WordExtractor
Место: класс readDoc
WordExtractor мы = новый WordExtractor (документ);
9 ошибки
Пожалуйста, кто-нибудь мне помочь ...
Позвольте мне знать об основных работу шахта для чтения документа ..
Привет UJJAL,
Вам придется добавить Apache POI библиотеки в своем классе путь, чтобы он работал. Вы можете скачать Apache POI пакеты из http://poi.apache.org/ , а также вы пытаетесь читать документы Microsoft слово Java, чем вы также требуют этого библиотеки. http://poi.apache.org/ hwpf / index.html
Спасибо,
Hitesh Agarwal
Очень приятно информации.
Можно ли изменить. Документ и / или. Docx документов с POI? Я бы хотел, чтобы иметь возможность заменить отдельные фрагменты текста в нескольких документах Word, а затем сохранить обновленные документы на диске.
Этот код читать. Документ пункта файл пункта.
Как я могу посмотреть этот файл, предложение за предложением?
Спасибо заранее.
Как я могу прочитать документ с текстом и изображениями?
и как я могу читать текст со стилем?
Привет,
Как заменить одну строку на другую в. Документ документы?
Я думаю, Есть много серьезных ошибок в осуществлении HWPF формате, например, следующие:
HWPFDocument документ = новый HWPFDocument (входящего);
doc.write (выходящий);
очереди. Doc файлов в somethig, которые не могут быть открыты Word больше.
Hitesh,
Спасибо за это. Отличный пост .. спас меня тонну поиска.
Как определить направление движения. Doc файл ....
пожалуйста ...
Пришлите мне код ...
Как определить направление движения. Doc файл .... Использование Apache POI
пожалуйста ...
Пришлите мне код ...
Привет
Можете ли вы сказать мне, как читать документ файл изображения, которые с ним.
Опубликовать код, если это возможно ..