Начало > Java > Четене Word документ в Microsoft JAVA

За четене Microsoft Word документ, JAVA

Когато става дума за четене Microsoft Office Word документ Java няма никакви в изграждането класове да се справим с това, но Apache POI пакет разработен от фондация Apache ви дава силата на четене Microsoft Word документ в Java. Повече информация за Apache POI пакет може да се намери на Apache POI

  ; внос org.apache.poi.poifs.filesystem .*;
 ; внос org.apache.poi.hwpf .*;
 ; внос org.apache.poi.hwpf.extractor .*;
 ; внос java.io. *;

 обществени клас readDoc
 (
	 main ( String [ ] args ) публично статично невалидни Майн (стринга [] опцията)
	 (
		 "Hello.doc" ; Струнен filesname = "Hello.doc";
		 ; POIFSFileSystem FS = NULL;
		 опитвам
		 (
                   POIFSFileSystem ( new FileInputStream ( filesname ; FS = нови POIFSFileSystem (ново FileInputStream (filesname; 
                   / / Не може да бъде затворен в скоби в края, както сайта ми не е имал възможност да затворите

                   HWPFDocument ( fs ) ; HWPFDocument док = нови HWPFDocument (FS);

		   WordExtractor ( doc ) ; WordExtractor ние = нови WordExtractor (DOC);

		   paragraphs = we. getParagraphText ( ) ; Стринга [] = точки ние. GetParagraphText ();

		   . println ( "Word Document has " + paragraphs. length + " paragraphs" ) ; Система. Изложени. Println ("Word документ е" + точки. Дължината + "точки");
		   int i = 0 ; i < paragraphs . length ; i ++ ) { за (INT I = 0; I <точки. дължина; I + +) (
			 = paragraphs [ i ] . replaceAll ( " \\ cM? \r ? \n " , "" ) ; параграфи [I] = точки [I]. replaceAll ("\ \ см? \ R? \ N", "");
                	 . println ( "Length:" + paragraphs [ i ] . length ( ) ) ; Система. Изложени. Println ("Дължина:" + точки [I]. Дължина ());
		   )
                 )
                 Exception e ) { улов (Изключение д) ( 
                     ; Д. printStackTrace ();
                 )
          )
 ) 

Вашата електронна поща:


Код Обяснение:

  • Създаване на нови POIFSFileSystem обекта и преминаване на Microsoft Word документ да го
  • Създаване на нов обект от клас HWPFDocument, този клас е специално отговаря за обработката Microsoft Word документ
  • WordExtractor ще извлече всичките думи от думата документ
  • getParagraphText () ще извлече всички параграфи текст мъдър
  • Накрая ние се опитваме да прочетете съдържанието параграф


Персонализирано търсене

Популярни членове:

Споделете и се наслаждавайте:
  • Print
  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • DZone
  • email
  • IndianPad
  • LinkedIn
  • Live
  • MySpace
  • Netvibes
  • RSS
  • Technorati
  • Yahoo! Bookmarks
  • Yahoo! Buzz
  • Reddit
  • Add to favorites
  • PDF
  • Twitter
Tags: Категория: Java Tags:
  1. Subramanyam
    24-ти Ноември 2008 в 08:15 | # 1

    Здравейте,

    Аз съм се по-долу изключение по време на движение в този пример.

    Бихте ли ме, ако съм Липсват буркани / трябва да направите нещо друго, да се изпълни този клас на Java.

    Благодаря предварително за вашата помощ.

    С уважение,
    Subramanyam.

  2. Subramanyam
    24-ти Ноември 2008 в 08:16 | # 2

    Здравейте,

    Съжалявам за спам. свързани изключение.

    Аз съм се по-долу изключение по време на движение в този пример.

    java.io.IOException: Грешна заглавна част подпис; прочетете 7021802808062469458, което се очаква -2226271756974174256
    в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 112)
    в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
    в com.general.test.ReadDoc.main (ReadDoc.java: 16)

    Бихте ли ме, ако съм Липсват буркани / трябва да направите нещо друго, да се изпълни този клас на Java.

    Благодаря предварително за вашата помощ.

    С уважение,
    Subramanyam.

  3. Nishikanta Sahoo
    18-ти декември 2008 год в 05:16 | # 3

    След като изпълня този код аз имам по-долу изключение. Моля, дайте ми всяко решение за този execption. Аз вече посочете буркан също, но аз все още имам тази execption. Едно нещо, което не се получи това EncryptedDocumentException.class в буркана.

    Изключение на конци "основните" java.lang.NoClassDefFoundError: Org / скоро / пой / EncryptedDocumentException
    в ws.WordRead.main (WordRead.java: 38)
    ГРЕШКА: Невъзможно е да се JDWP JNI 1.2 околната среда, JVM-> GetEnv () връща код = -2
    JDWP излизане грешка AGENT_ERROR_NO_JNI_ENV (183): [../../../ SRC / акции / назад / util.c: 820]

  4. 18-ти декември 2008 год в 23:33 | # 4

    Здравейте Nishikanta,
    Имам използва POI-3.0.2-Final.jar и пой-Записник-3.0.2-финал-20080204.jar пакет за този код.

  5. тънък
    18-ти март 2009 година в 02:00 | # 5

    след използването на този код excption "java.io.FileNotFoundException: hello.doc (Системата не може да намери даден файл)" е genereted
    това, когато правя аз трябва да поставят hello.doc (аз създадена на компютъра си) Влезте в

    • 18-ти март 2009 година в 09:50 | # 6

      Здравейте Тънък,
      Просто поставете hello.doc къде. Класа файл се намира. Ако вие поставяте на док файл на друго място, освен определя местонахождението път в изходния код. Той ще работи добре.

      Благодаря,
      Hitesh Agrawal

  6. тънък
    24-ти март, 2009 г в 03:51 | # 7

    Здравейте,
    Благодаря за отговора.
    сценария работят много добре.
    какъв е ефектът от използването на "параграфи [I] = точки [I]. replaceAll (" \ \ см? \ R? \ N ","");"

    благодаря

  7. laker
    24-ти март, 2009 г в 04:12 | # 8

    Здравейте,
    Благодаря за този пост, това е много полезно.
    Аз съм се опитва да намери една дума на думата си файл след като е прочел досието.
    Как мога да го направя?

    Благодаря много

  8. Амит
    9-ти април 2009 год. в 06:23 | # 9

    java.io.IOException: Не може да прочетете цялата заглавна; 6 байта чете; очаква 512 байта
    в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
    в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
    в org.apache.poi.hwpf.HWPFDocument.verifyAndBuildPOIFS (HWPFDocument.java: 133)
    в org.apache.poi.hwpf.HWPFDocument. (HWPFDocument.java: 146)
    в transactionDB.changeFormat.main (changeFormat.java: 45)

    Грешка езика това, което трябва да направя, кажете ми, моля

  9. Ankur Raiyani
    20 Май 2009 в 21:53 | # 10

    Здравейте hitesh,

    Благодаря за дял този пример. Имам различни изисквания с думата файл. Искам да добавите изображение в думата документ с помощта POI, но не знаете как да направите това.

    Благодаря,
    Ankur Raiyani

  10. 2-ри юли, 2009 в 08:57 | # 11

    Как мога да чета думата коментари и маркери използват Java? Да U имат примерен код? Всяка помощ ще бъде оценена.

  11. Sathish Раджа
    10-ти Юли, 2009 в 04:31 | # 12

    Здравейте приятели,
    Може ли някой да ми помогне в това ... ... ... Имах ползвате този код и IM geting този изключения ... ... аз съм с пой-2.5.1-финал-20040804.jar.and пой-Записник-3.5-beta5-20090219.jar файлове ... ... .. как да се определя местонахождението път в изходния код ... .. имах съхранява файла в компютъра

    java.io.IOException: Грешна заглавна част подпис; прочетете 85966670672, очаква -2226271756974174256
    в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 88)
    в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
    в rb.action.FileRead.main (FileRead.java: 15)

  12. prabhu
    11-ти юли, 2009 година в 00:40 | # 13

    Sathish Раджа,

    Били ли сте фиксирани въпроса, ако фиксираното да публикувате стъпки

  13. Дарън Слевин
    15-ти Юли, 2009 в 14:02 | # 14

    Здравейте Hitesh,

    къде да се съхранява на POI-3.0.2-Final.jar и пой-Записник-3.0.2-финал-20080204.jar файлове. Аз съм просто се опитва да получи горния пример работи. Наздраве за помощта.

    Дарън

  14. devday
    17-ти Юли 2009 в 23:20 | # 15

    Здравейте приятели,

    На изпълняващата този код съм се следните error.can ли някой да ми каже как да разрешите този проблем.

    java.io.IOException: Не може да прочетете цялата заглавна; -1 байта чете; очаква 512 байта
    в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
    в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)

  15. miche
    18-ти Юли 2009 година в 18:33 | # 16

    Здравейте! IM наистина губи ... аз съм много нов в този пой, но аз трябва да използват това за моя проект, който е за четене на док думата, използвайки Java ... Как мога да "внос" на пакета за org.apache.poi? Имам изтеглили пой-3.5-beta6 и ме помоли да инсталирате мравка и Форест .. тя ме помоли да зададете променлива среда, за да ANT_HOME и FORREST_HOME .. моля да ми помогне .. IM объркана!

  16. Sulabh
    4-ти август, 2009 в 04:14 | # 17

    Здравейте приятели,

    Аз се опитвам да променя размера на шрифта на текста.
    За да направите това Пиша един HWPF поток към друг и по този начин да променяте шрифта, но това, което точно трябва да имат различен шрифт (и / или размер) за всяка дума / параграф. Основно да има повече от един шрифт в едно парче на думата файл.
    Може ли някой да ми каже как да го направим?

  17. Sulabh
    4-ти август, 2009 в 04:15 | # 18

    какво точно трябва, е ...
    dgd gedgfe
    RBR brbr gbntghth
    rghh rtfhtyh bnfgh
    , което е всяка дума има различни свойства на шрифта

  18. Shriddha
    27-ми Август 2009 год. в 02:29 | # 19

    Първата грешка:
    java.lang.NoClassDefFoundError: Org / скоро / пой / hpsf / WritingNotSupportedException

  19. gokul
    10-ти септември 2009 в 02:43 | # 20

    Здравейте,

    Имам изпълнена Ур програма Java да четат документа дума. тя работи добре, но ако Hava дума документа таблици. кода си представи злонамерен скрипт и код работи infinte линия.

    моля, кажете ми има ли някакви методи за четене на данни от таблиците в Word документ.

  20. Шегувам се
    13-ти ноември, 2009 в 09:05 | # 21

    @ Ankur Raiyani
    Дали имате някакви късмет Първи Apache POI, за да вмъкнете изображения в една дума документ. Аз се опитвам да направя същото нещо.

  21. 27-ми дек, 2009 в 01:11 | # 22

    Благодаря Ви много.

  22. сенчесто
    6-ти яну 2010 в 23:04 | # 23

    plzzzz бързо Имам нужда от помощ: аз употреба 2 файлове. файл с горния и файл, без заглавна когато влизам в файл, който без заглавна ми даде тази java.io.IOException грешка: невалиден подпис заглавна; прочетете 0x665C316674725C7B, очаква 0xE11AB1A1E011CFD0
    в org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 107)
    в org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
    в wordtotext.Main.main (Main.java: 30)
    , а вторият файл тече добри Plz helpme

  23. WKKasun Chamika
    21-ви Март 2010 г в 21:51 | # 24

    Благодарим и 4 г код

    System.out.println (точки [I]. ToString ()); / / да отпечатват точки

  24. Sushree Das
    23-ти март, 2010 г в 04:30 | # 25

    моля, някой може да ми предостави с Java код, чрез който мога да вмъкнете изображение в една дума файл MS независимо от местоположението, а също така смятат, че има някои caontent на it.plz отговора ми ..

  25. Sushree Das
    23-ти март, 2010 г в 04:31 | # 26

    моля ви кажете ми как да вмъкнете изображение в думата док файл

  26. Парам
    1-ви Април, 2010 год. в 01:52 | # 27

    моля ви кажете ми как да четем снимки на. док файл заедно с текста с помощта на Java

  27. 21-ви април, 2010 в 15:29 | # 28

    Отличен.

    Благодаря ви много.

  28. UJJAL
    6-ти май 2010 в 02:14 | # 29

    Аз съм begineer о java.When I състав този пример аз имам 9 грешки.
    Помогнете ми, моля ...

    org.apache.poi.poifs.filesystem пакет не съществува
    внос org.apache.poi.poifs.filesystem .*;

    org.apache.poi.hwpf пакет не съществува
    внос org.apache.poi.hwpf .*;

    org.apache.poi.hwpf.extractor пакет не съществува
    внос org.apache.poi.hwpf.extractor .*;

    Не мога да намеря символа
    символ: клас POIFSFileSystem
    Местоположение: клас readDoc
    POIFSFileSystem FS = NULL;

    Не мога да намеря символа
    символ: клас POIFSFileSystem
    Местоположение: клас readDoc
    FS = нови POIFSFileSystem (ново FileInputStream (filesname));

    Не мога да намеря символа
    символ: клас HWPFDocument
    Местоположение: клас readDoc
    HWPFDocument док = нови HWPFDocument (FS);

    Не мога да намеря символа
    символ: клас HWPFDocument
    Местоположение: клас readDoc
    HWPFDocument док = нови HWPFDocument (FS);

    Не мога да намеря символа
    символ: клас WordExtractor
    Местоположение: клас readDoc
    WordExtractor ние = нови WordExtractor (DOC);

    Не мога да намеря символа
    символ: клас WordExtractor
    Местоположение: клас readDoc
    WordExtractor ние = нови WordExtractor (DOC);

    9 грешки

    • 8-ми Май, 2010 год в 02:12 | # 30

      Здравейте UJJAL,
      Вие ще трябва да добавите Apache POI библиотеки в класа си път, за да работи. Можете да свалите Apache POI пакети от http://poi.apache.org/ и да ви се опитват да четат документи на думата в Java от вас също ще изискват тази библиотека, както добре. http://poi.apache.org/ hwpf / index.html

      Благодаря,
      Hitesh Agarwal

  29. UJJAL
    6-ти май 2010 в 07:04 | # 31

    Моля някой да ми помогне ...
    Нека да знаят за основните работа на мината да се чете от един документ ..

  30. 12-ти май 2010 в 18:22 | # 32

    Много хубаво информация.

  31. Piotr Rychlik
    14-ти май 2010 година в 09:35 | # 33

    Възможно ли е да редактирате. Док и / или. Docx документи с POI? Бих искал да бъде в състояние да замени някои фрагменти текст в няколко документа, Word и после запишете актуализирани документи на диска.

  32. UJJAL
    16-ти май, 2010 в 05:27 | # 34

    Този код четат. Док параграф файл от параграф.
    Как мога да прочета този файл изречение по изречение?

    Благодаря предварително.

  33. melaal
    22-ри май 2010 г. В 01:51 | # 35

    Как мога да прочета документ с текст и снимки?

  34. melaal
    22-ри май 2010 г. В 01:56 | # 36

    и как мога да се чете текст със стил?

  35. Piotr Rychlik
    24-ти май, 2010 година в 04:39 | # 37

    Здравейте,

    Как да се замени един низ за друг инча док документи?

  36. Piotr Rychlik
    26-ти Май, 2010 в 13:35 | # 38

    Мисля, че има много сериозни грешки в изпълнението на HWPF формат, например следното:

    HWPFDocument док = нови HWPFDocument (inputStream);
    doc.write (outputStream);

    обрати. док файлове в somethig, които не могат да се отварят с Word вече.

  37. bshirota
    11-ти Юни 2010 год. в 15:32 | # 39

    Hitesh,

    Благодаря за това. Отличен пост .. ме спаси един тон от търсенето.

  38. gayan
    22-ри юни 2010 година в 03:31 | # 40

    Как определяте позиция на. Док файл ....

    моля ...

    изпратете ми код ...

  39. gayan
    22-ри юни 2010 година в 03:33 | # 41

    Как да определите заглавието на. Док файл .... използвате Apache POI

    моля ...

    изпратете ми код ...

  40. Brijesh
    7-ми юли 2010 година в 23:17 | # 42

    Здрасти

    Може ли да ми кажете как да се чете док файлове, които са изображения с него.

    Публикувай някои код, ако е възможно ..

  41. 18-ти август 2010 в 01:57 | # 43

    @ Subramanyam
    здрасти
    IM искате да прочетете един док файл, използвайки пой интерфейс, но geeting IM грешка пакет и Plz дума аспиратор да ми помогне

    Благодаря ви предварително

  1. Няма проследявания все още.