Reading Microsoft Word-Dokument in JAVA
Wenn es um die Lesung von Microsoft Office Word-Dokument Java hat noch keine Klassen in Griff zu bauen, diese aber Apache POI-Paket entwickelt, die Apache Foundation bietet Ihnen die Möglichkeit des Lesens Microsoft Word-Dokument in Java. Mehr Informationen über die Apache POI-Paket finden Sie unter Apache POI gefunden werden
; Import org.apache.poi.poifs.filesystem .*; ; Import org.apache.poi.hwpf .*; ; Import org.apache.poi.hwpf.extractor .*; ; import java.io. *; public class readDoc ( main ( String [ ] args ) public static void main (String [] args) ( "Hello.doc" ; String filesname = "Hello.doc"; ; POIFSFileSystem fs = null; versuchen ( POIFSFileSystem ( new FileInputStream ( filesname ; fs = new POIFSFileSystem (new FileInputStream filesname (; / / Konnte nicht geschlossen werden die Klammern am Ende wie meine Website ließen es nicht zu schließen HWPFDocument ( fs ) ; HWPFDocument doc = new HWPFDocument (fs); WordExtractor ( doc ) ; WordExtractor wir = new WordExtractor (doc); paragraphs = we. getParagraphText ( ) ; String [] = Absätze wir. GetParagraphText (); . println ( "Word Document has " + paragraphs. length + " paragraphs" ) ; System. Heraus. Println ( "Word-Dokument hat" + Absätze. Länge + "Absätze"); int i = 0 ; i < paragraphs . length ; i ++ ) { for (int i = 0; i <Absätze. Länge; i + +) ( = paragraphs [ i ] . replaceAll ( " \\ cM? \r ? \n " , "" ) ; Ziffern [i] = Ziffern [i]. replaceAll ( "\ \ cm? \ r? \ n", ""); . println ( "Length:" + paragraphs [ i ] . length ( ) ) ; System. Heraus. Println ( "Länge:" + Ziffern [i]. Length ()); ) ) Exception e ) { catch (Exception e) ( ; e. printStackTrace (); ) ) )
Code Erläuterung:
- Die Schaffung neuer POIFSFileSystem Objekt und die Ablegung der Microsoft Word-Dokument, um es
- Erstellen HWPFDocument neues Objekt der Klasse, ist diese Klasse die speziell für den Umgang mit Microsoft Word-Dokument
- WordExtractor, alle Worte Auszug aus dem Word-Dokument
- getParagraphText () wird der gesamte Text extrahieren Absatz weise
- Schließlich versuchen wir, die Nummer Inhalt zu lesen

Benutzerdefinierte Suche
















Hallo,
Ich bekomme unter Ausnahme während der Ausführung dieses Beispiel.
Könnten Sie bitte lassen Sie mich wissen, wenn ich mich jedes fehlende Gläser / Notwendigkeit, etwas anderes zu diesem Java-Klasse ausführen zu tun.
Vielen Dank im Voraus für Ihre Hilfe.
Grüße,
Subramanyam.
Hallo,
Sorry für den Spam. Befestigung Ausnahme.
Ich bekomme unter Ausnahme während der Ausführung dieses Beispiel.
java.io.IOException: Invalid Header-Signatur, lesen 7021802808062469458, erwartete -2226271756974174256
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 112)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
bei com.general.test.ReadDoc.main (ReadDoc.java: 16)
Könnten Sie bitte lassen Sie mich wissen, wenn ich mich jedes fehlende Gläser / Notwendigkeit, etwas anderes zu diesem Java-Klasse ausführen zu tun.
Vielen Dank im Voraus für Ihre Hilfe.
Grüße,
Subramanyam.
Nachdem dieser Code ausgeführt i got unten Ausnahme. Bitte geben Sie mir eine Lösung für dieses execption. Ich habe bereits einfügen jar auch, aber ich habe diese execption. Eine Sache habe ich nicht erhalten, diese EncryptedDocumentException.class in das Glas.
Exception in thread "main" java.lang.NoClassDefFoundError: org / apache / poi / EncryptedDocumentException
bei ws.WordRead.main (WordRead.java: 38)
ERROR: Unable to JDWP JNI 1,2 Umfeld zu bewegen, jvm-> getenv () return code = -2
JDWP exit error AGENT_ERROR_NO_JNI_ENV (183): [../../../ src / share / back / util.c: 820]
Hallo Nishikanta,
Ich habe verwendet POI-3.0.2-Final.jar und POI-Notizblock-3.0.2-FINAL-20080204.jar Paket für diesen Code.
Nach Ausführen dieses Codes excption "java.io.FileNotFoundException: hello.doc (The system cannot find the file specified)" wurde genereted
ja, wo kann ich muß hello.doc (Ich habe es auf meinem Desktop) thankss
Hallo Slim,
Legen Sie einfach die hello.doc wo. Class-Datei befindet. Wenn Sie die doc-Datei setzen sich an einem anderen Ort als den Speicherort Pfad in der Quellcode. Es funktioniert gut.
Danke,
Hitesh Agrawal
hallo,
Dank für die Antwort.
das Skript sehr gut funktionieren.
was ist die Wirkung des Einsatzes "in den Absätzen [i] = Ziffern [i]. replaceAll (" \ \ cm? \ r? \ n ","");"
Danke
Hallo,
Danke für diesen Beitrag, ist es sehr nützlich sein.
Ich versuche, ein Wort auf mein Wort-Datei nach dem Lesen der Datei zu finden.
Wie kann ich das tun??
Thanks a lot
java.io.IOException: Unable to gesamten Header zu lesen; 6 Bytes zu lesen, erwarteter 512 Bytes
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
bei org.apache.poi.hwpf.HWPFDocument.verifyAndBuildPOIFS (HWPFDocument.java: 133)
bei org.apache.poi.hwpf.HWPFDocument. (HWPFDocument.java: 146)
bei transactionDB.changeFormat.main (changeFormat.java: 45)
Fehler zeigen, was ich zu tun haben, sagen Sie mir bitte
Hallo hitesh,
thanks for sharing diesem Beispiel. Ich habe eine andere Anforderung mit Word-Datei. Ich möchte ein Bild in Word-Dokument mit POI hinzufügen, aber weiß nicht, wie dies zu tun.
Danke,
Ankur Raiyani
Wie lese ich Wort Kommentare und Lesezeichen mit Java? Do u haben ein Beispiel-Code? Jede Hilfe wird gebeten.
hallo Freunde,
Kann jemand mir helfen in diesem ... ... ... ich hatte diesen Code verwenden und im geting dieser Ausnahmen ... ... ich bin mit poi-2.5.1-final-20040804.jar.and poi-Notizblock-3,5-beta5-20090219.jar Dateien ... ... .., wie Sie den Speicherort Pfad im Quellcode ... .. ich die Datei im Desktop gehalten hatte
java.io.IOException: Invalid Header-Signatur, lesen 85966670672, erwartete -2226271756974174256
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 88)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
bei rb.action.FileRead.main (FileRead.java: 15)
Sathish Raja,
Haben Sie das Problem behoben, wenn Sie das Forum der festen Schritten
Hallo Hitesh,
wo speichere ich die POI-3.0.2-Final.jar und POI-Notizblock-3.0.2-FINAL-20080204.jar Dateien. Ich versuche nur zu dem obigen Beispiel zum Laufen zu bringen. Cheers for the help.
Darren
Hallo Freunde,
Am Ausführen dieses Codes bekomme folgende error.can mir jemand sagen, wie dieses Problem zu beheben.
java.io.IOException: Unable to komplette Header lesen, -1 Bytes zu lesen, erwarteter 512 Bytes
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
Hallo! im wirklich verloren ... Ich bin sehr neu in diesem poi aber ich habe diese für mein Projekt, die ein Word-Dokument mit Hilfe von Java ... Wie kann ich "Einfuhr" das Paket für org.apache.poi gelesen wird, verwenden? Ich habe den poi-3.5-beta6 heruntergeladen und es hat mich gebeten, Ameise und Wald zu installieren .. es hat mich gebeten, die Umgebungsvariable auf ANT_HOME und .. FORREST_HOME gesetzt please help me .. im confused!
Hallo Freunde,
Ich versuche, um die Schriftgröße des Textes verändern.
Um dies schreibe ich ein HWPF Strom auf eine andere und somit können die Schriftart ändern, aber was ich genau brauchen, ist die andere Schriftart (und / oder Größe) für jedes Wort / Absatz. Grundsätzlich, mehr als eine Schriftgröße in einem einzigen Word-Datei.
Kann jemand bitte sagen Sie mir, wie man über Dabei gehen?
was ich gerade brauchen, ist ...
DGD gedgfe
rbr brbr gbntghth
rghh rtfhtyh bnfgh
dass jedes Wort mit verschiedenen Schriftart-Eigenschaften ist
werden Fehlermeldungen:
java.lang.NoClassDefFoundError: org / apache / poi / HPSF / WritingNotSupportedException
hallo,
Ich habe ur Java-Programm zu Word-Dokument zu lesen ausgeführt. es funktioniert gut, aber wenn das Word-Dokument ein hava Tabellen. Ihr Code erzeugen ein bösartiges Skript-Code ausgeführt und infinte Schleife.
Bitte sagen Sie mir gibt es keine Methoden zum Lesen einer Daten aus Tabellen in ein Word-Dokument.
@ Ankur Raiyani
Haben Sie etwas Glück bekommen Apache POI, um Bilder in ein Word-Dokument einfügen. Ich versuche, das gleiche zu tun.
Vielen Dank.
plzzzz schnell i need help: Ich verwende 2 Dateien. Datei mit Kopf-und Datei ohne Header, wenn ich die Datei, die ohne Kopf geben Sie mir diesen Fehler java.io.IOException: Invalid Header-Signatur, lesen 0 × 665C316674725C7B geben, erwartet 0xE11AB1A1E011CFD0
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 107)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
bei wordtotext.Main.main (Main.java: 30)
und den zweiten Lauf Datei gute plz helpme