За четене Microsoft Word документ, JAVA
Когато става дума за четене Microsoft Office Word документ Java няма никакви в изграждането класове да се справим с това, но Apache POI пакет разработен от фондация Apache ви дава силата на четене Microsoft Word документ в Java. Повече информация за Apache POI пакет може да се намери на Apache POI
; внос org.apache.poi.poifs.filesystem .*; ; внос org.apache.poi.hwpf .*; ; внос org.apache.poi.hwpf.extractor .*; ; внос java.io. *; обществени клас readDoc ( main ( String [ ] args ) публично статично невалидни Майн (стринга [] опцията) ( "Hello.doc" ; Струнен filesname = "Hello.doc"; ; POIFSFileSystem FS = NULL; опитвам ( POIFSFileSystem ( new FileInputStream ( filesname ; FS = нови POIFSFileSystem (ново FileInputStream (filesname; / / Не може да бъде затворен в скоби в края, както сайта ми не е имал възможност да затворите HWPFDocument ( fs ) ; HWPFDocument док = нови HWPFDocument (FS); WordExtractor ( doc ) ; WordExtractor ние = нови WordExtractor (DOC); paragraphs = we. getParagraphText ( ) ; Стринга [] = точки ние. GetParagraphText (); . println ( "Word Document has " + paragraphs. length + " paragraphs" ) ; Система. Изложени. Println ("Word документ е" + точки. Дължината + "точки"); int i = 0 ; i < paragraphs . length ; i ++ ) { за (INT I = 0; I <точки. дължина; I + +) ( = paragraphs [ i ] . replaceAll ( " \\ cM? \r ? \n " , "" ) ; параграфи [I] = точки [I]. replaceAll ("\ \ см? \ R? \ N", ""); . println ( "Length:" + paragraphs [ i ] . length ( ) ) ; Система. Изложени. Println ("Дължина:" + точки [I]. Дължина ()); ) ) Exception e ) { улов (Изключение д) ( ; Д. printStackTrace (); ) ) )
Код Обяснение:
- Създаване на нови POIFSFileSystem обекта и преминаване на Microsoft Word документ да го
- Създаване на нов обект от клас HWPFDocument, този клас е специално отговаря за обработката Microsoft Word документ
- WordExtractor ще извлече всичките думи от думата документ
- getParagraphText () ще извлече всички параграфи текст мъдър
- Накрая ние се опитваме да прочетете съдържанието параграф

Персонализирано търсене
Популярни членове:
- Четене IMAP Server имейли с Java
- Ajax Програмиране с JSP и Servlets
- Разбирателство дизайн Модел Prototype в Ява
- Дизайн Модели завод в Java
- Дистанционно URL връзка през прокси в Ява
- Log4J Влизане Вътре Eclipse конзолата
- Влизане Потребителско сесия подробности използвате Apache log4j
- HTTP POST Form искането чрез използване на AJAX и Servlet
- Изпращане на имейли с Java
- Деинсталиране Java Development Kit на Linux системи



































Здравейте,
Аз съм се по-долу изключение по време на движение в този пример.
Бихте ли ме, ако съм Липсват буркани / трябва да направите нещо друго, да се изпълни този клас на Java.
Благодаря предварително за вашата помощ.
С уважение,
Subramanyam.
Здравейте,
Съжалявам за спам. свързани изключение.
Аз съм се по-долу изключение по време на движение в този пример.
java.io.IOException: Грешна заглавна част подпис; прочетете 7021802808062469458, което се очаква -2226271756974174256
в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 112)
в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
в com.general.test.ReadDoc.main (ReadDoc.java: 16)
Бихте ли ме, ако съм Липсват буркани / трябва да направите нещо друго, да се изпълни този клас на Java.
Благодаря предварително за вашата помощ.
С уважение,
Subramanyam.
След като изпълня този код аз имам по-долу изключение. Моля, дайте ми всяко решение за този execption. Аз вече посочете буркан също, но аз все още имам тази execption. Едно нещо, което не се получи това EncryptedDocumentException.class в буркана.
Изключение на конци "основните" java.lang.NoClassDefFoundError: Org / скоро / пой / EncryptedDocumentException
в ws.WordRead.main (WordRead.java: 38)
ГРЕШКА: Невъзможно е да се JDWP JNI 1.2 околната среда, JVM-> GetEnv () връща код = -2
JDWP излизане грешка AGENT_ERROR_NO_JNI_ENV (183): [../../../ SRC / акции / назад / util.c: 820]
Здравейте Nishikanta,
Имам използва POI-3.0.2-Final.jar и пой-Записник-3.0.2-финал-20080204.jar пакет за този код.
след използването на този код excption "java.io.FileNotFoundException: hello.doc (Системата не може да намери даден файл)" е genereted
това, когато правя аз трябва да поставят hello.doc (аз създадена на компютъра си) Влезте в
Здравейте Тънък,
Просто поставете hello.doc къде. Класа файл се намира. Ако вие поставяте на док файл на друго място, освен определя местонахождението път в изходния код. Той ще работи добре.
Благодаря,
Hitesh Agrawal
Здравейте,
Благодаря за отговора.
сценария работят много добре.
какъв е ефектът от използването на "параграфи [I] = точки [I]. replaceAll (" \ \ см? \ R? \ N ","");"
благодаря
Здравейте,
Благодаря за този пост, това е много полезно.
Аз съм се опитва да намери една дума на думата си файл след като е прочел досието.
Как мога да го направя?
Благодаря много
java.io.IOException: Не може да прочетете цялата заглавна; 6 байта чете; очаква 512 байта
в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
в org.apache.poi.hwpf.HWPFDocument.verifyAndBuildPOIFS (HWPFDocument.java: 133)
в org.apache.poi.hwpf.HWPFDocument. (HWPFDocument.java: 146)
в transactionDB.changeFormat.main (changeFormat.java: 45)
Грешка езика това, което трябва да направя, кажете ми, моля
Здравейте hitesh,
Благодаря за дял този пример. Имам различни изисквания с думата файл. Искам да добавите изображение в думата документ с помощта POI, но не знаете как да направите това.
Благодаря,
Ankur Raiyani
Как мога да чета думата коментари и маркери използват Java? Да U имат примерен код? Всяка помощ ще бъде оценена.
Здравейте приятели,
Може ли някой да ми помогне в това ... ... ... Имах ползвате този код и IM geting този изключения ... ... аз съм с пой-2.5.1-финал-20040804.jar.and пой-Записник-3.5-beta5-20090219.jar файлове ... ... .. как да се определя местонахождението път в изходния код ... .. имах съхранява файла в компютъра
java.io.IOException: Грешна заглавна част подпис; прочетете 85966670672, очаква -2226271756974174256
в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 88)
в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
в rb.action.FileRead.main (FileRead.java: 15)
Sathish Раджа,
Били ли сте фиксирани въпроса, ако фиксираното да публикувате стъпки
Здравейте Hitesh,
къде да се съхранява на POI-3.0.2-Final.jar и пой-Записник-3.0.2-финал-20080204.jar файлове. Аз съм просто се опитва да получи горния пример работи. Наздраве за помощта.
Дарън
Здравейте приятели,
На изпълняващата този код съм се следните error.can ли някой да ми каже как да разрешите този проблем.
java.io.IOException: Не може да прочетете цялата заглавна; -1 байта чете; очаква 512 байта
в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
Здравейте! IM наистина губи ... аз съм много нов в този пой, но аз трябва да използват това за моя проект, който е за четене на док думата, използвайки Java ... Как мога да "внос" на пакета за org.apache.poi? Имам изтеглили пой-3.5-beta6 и ме помоли да инсталирате мравка и Форест .. тя ме помоли да зададете променлива среда, за да ANT_HOME и FORREST_HOME .. моля да ми помогне .. IM объркана!
Здравейте приятели,
Аз се опитвам да променя размера на шрифта на текста.
За да направите това Пиша един HWPF поток към друг и по този начин да променяте шрифта, но това, което точно трябва да имат различен шрифт (и / или размер) за всяка дума / параграф. Основно да има повече от един шрифт в едно парче на думата файл.
Може ли някой да ми каже как да го направим?
какво точно трябва, е ...
dgd gedgfe
RBR brbr gbntghth
rghh rtfhtyh bnfgh
, което е всяка дума има различни свойства на шрифта
Първата грешка:
java.lang.NoClassDefFoundError: Org / скоро / пой / hpsf / WritingNotSupportedException
Здравейте,
Имам изпълнена Ур програма Java да четат документа дума. тя работи добре, но ако Hava дума документа таблици. кода си представи злонамерен скрипт и код работи infinte линия.
моля, кажете ми има ли някакви методи за четене на данни от таблиците в Word документ.
@ Ankur Raiyani
Дали имате някакви късмет Първи Apache POI, за да вмъкнете изображения в една дума документ. Аз се опитвам да направя същото нещо.
Благодаря Ви много.
plzzzz бързо Имам нужда от помощ: аз употреба 2 файлове. файл с горния и файл, без заглавна когато влизам в файл, който без заглавна ми даде тази java.io.IOException грешка: невалиден подпис заглавна; прочетете 0x665C316674725C7B, очаква 0xE11AB1A1E011CFD0
в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 107)
в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
в wordtotext.Main.main (Main.java: 30)
, а вторият файл тече добри Plz helpme
Благодарим и 4 г код
System.out.println (точки [I]. ToString ()); / / да отпечатват точки
моля, някой може да ми предостави с Java код, чрез който мога да вмъкнете изображение в една дума файл MS независимо от местоположението, а също така смятат, че има някои caontent на it.plz отговора ми ..
моля ви кажете ми как да вмъкнете изображение в думата док файл
моля ви кажете ми как да четем снимки на. док файл заедно с текста с помощта на Java
Отличен.
Благодаря ви много.
Аз съм begineer о java.When I състав този пример аз имам 9 грешки.
Помогнете ми, моля ...
org.apache.poi.poifs.filesystem пакет не съществува
внос org.apache.poi.poifs.filesystem .*;
org.apache.poi.hwpf пакет не съществува
внос org.apache.poi.hwpf .*;
org.apache.poi.hwpf.extractor пакет не съществува
внос org.apache.poi.hwpf.extractor .*;
Не мога да намеря символа
символ: клас POIFSFileSystem
Местоположение: клас readDoc
POIFSFileSystem FS = NULL;
Не мога да намеря символа
символ: клас POIFSFileSystem
Местоположение: клас readDoc
FS = нови POIFSFileSystem (ново FileInputStream (filesname));
Не мога да намеря символа
символ: клас HWPFDocument
Местоположение: клас readDoc
HWPFDocument док = нови HWPFDocument (FS);
Не мога да намеря символа
символ: клас HWPFDocument
Местоположение: клас readDoc
HWPFDocument док = нови HWPFDocument (FS);
Не мога да намеря символа
символ: клас WordExtractor
Местоположение: клас readDoc
WordExtractor ние = нови WordExtractor (DOC);
Не мога да намеря символа
символ: клас WordExtractor
Местоположение: клас readDoc
WordExtractor ние = нови WordExtractor (DOC);
9 грешки
Здравейте UJJAL,
Вие ще трябва да добавите Apache POI библиотеки в класа си път, за да работи. Можете да свалите Apache POI пакети от http://poi.apache.org/ и да ви се опитват да четат документи на думата в Java от вас също ще изискват тази библиотека, както добре. http://poi.apache.org/ hwpf / index.html
Благодаря,
Hitesh Agarwal
Моля някой да ми помогне ...
Нека да знаят за основните работа на мината да се чете от един документ ..
Много хубаво информация.
Възможно ли е да редактирате. Док и / или. Docx документи с POI? Бих искал да бъде в състояние да замени някои фрагменти текст в няколко документа, Word и после запишете актуализирани документи на диска.
Този код четат. Док параграф файл от параграф.
Как мога да прочета този файл изречение по изречение?
Благодаря предварително.
Как мога да прочета документ с текст и снимки?
и как мога да се чете текст със стил?
Здравейте,
Как да се замени един низ за друг инча док документи?
Мисля, че има много сериозни грешки в изпълнението на HWPF формат, например следното:
HWPFDocument док = нови HWPFDocument (inputStream);
doc.write (outputStream);
обрати. док файлове в somethig, които не могат да се отварят с Word вече.
Hitesh,
Благодаря за това. Отличен пост .. ме спаси един тон от търсенето.
Как определяте позиция на. Док файл ....
моля ...
изпратете ми код ...
Как да определите заглавието на. Док файл .... използвате Apache POI
моля ...
изпратете ми код ...
Здрасти
Може ли да ми кажете как да се чете док файлове, които са изображения с него.
Публикувай някои код, ако е възможно ..
@ Subramanyam
здрасти
IM искате да прочетете един док файл, използвайки пой интерфейс, но geeting IM грешка пакет и Plz дума аспиратор да ми помогне
Благодаря ви предварително