Reading Microsoft Word-Dokument in JAVA
Wenn es um die Lesung von Microsoft Office Word-Dokument Java nicht in jedem Bau-Klassen haben, um damit umgehen, aber Apache POI-Paket entwickelt, die von Apache-Foundation gibt Ihnen die Macht des Lesens Microsoft Word-Dokument in Java. Mehr Informationen über die Apache POI-Paket finden Sie unter der Apache POI
; Import org.apache.poi.poifs.filesystem .*; ; Import org.apache.poi.hwpf .*; ; Import org.apache.poi.hwpf.extractor .*; ; import java.io. *; public class readDoc ( main ( String [ ] args ) public static void main (String [] args) ( "Hello.doc" ; Filesname String = "Hello.doc"; ; POIFSFileSystem fs = null; versuchen ( POIFSFileSystem ( new FileInputStream ( filesname ; fs = new POIFSFileSystem (neu FileInputStream (filesname; / / Konnte nicht geschlossen werden die Klammern am Ende, als meine Website erlauben es nicht zu schließen HWPFDocument ( fs ) ; HWPFDocument doc = new HWPFDocument (fs); WordExtractor ( doc ) ; WordExtractor wir = new WordExtractor (doc); paragraphs = we. getParagraphText ( ) ; String [] = wir Absätzen. GetParagraphText (); . println ( "Word Document has " + paragraphs. length + " paragraphs" ) ; System. Out. Println ("Word-Dokument hat" + Absätze. Länge + "Ziffern"); int i = 0 ; i < paragraphs . length ; i ++ ) { for (int i = 0; i <Absätzen. Länge; i + +) ( = paragraphs [ i ] . replaceAll ( " \\ cM? \r ? \n " , "" ) ; Absätze [i] = Absätzen [i]. ReplaceAll ("\ \ cm? \ r? \ n", ""); . println ( "Length:" + paragraphs [ i ] . length ( ) ) ; System. Out. Println ("Länge:" + Absätzen [i]. Length ()); ) ) Exception e ) { catch (Exception e) ( ; e. printStackTrace (); ) ) )
Code Erläuterung:
- Erstellen neuer POIFSFileSystem Object und das Bestehen der Microsoft Word-Dokument, um es
- Erstellen eines neuen Objekts der Klasse HWPFDocument, ist diese Klasse die speziell für den Umgang mit Microsoft Word-Dokument
- WordExtractor wird all die Worte aus dem Word-Dokument zu extrahieren
- getParagraphText () wird der gesamte Text Absatz weise Extrakt
- Schließlich versuchen wir, den Inhalt zu lesen Absatzes

Benutzerdefinierte Suche


































Hallo,
Ich bin immer unter Ausnahme während der Ausführung dieses Beispiel.
Könnten Sie bitte lassen Sie mich wissen, wenn ich jeden fehlenden Gläsern am / müssen Sie nichts mehr tun, um diese Java-Klasse ausführen.
Vielen Dank im Voraus für Ihre Hilfe.
Regards,
Subramanyam.
Hallo,
sorry für den Spam. Anbringen Ausnahme.
Ich bin immer unter Ausnahme während der Ausführung dieses Beispiel.
java.io.IOException: Invalid Header-Signatur; 7021802808062469458 lesen, rechnen -2226271756974174256
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 112)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
bei com.general.test.ReadDoc.main (ReadDoc.java: 16)
Könnten Sie bitte lassen Sie mich wissen, wenn ich jeden fehlenden Gläsern am / müssen Sie nichts mehr tun, um diese Java-Klasse ausführen.
Vielen Dank im Voraus für Ihre Hilfe.
Regards,
Subramanyam.
Nach diesen Code auszuführen Ich habe unten Ausnahme. Bitte geben Sie mir eine Lösung für dieses execption. Ich habe bereits einfügen jar auch, aber ich bekam dieses execption. Eine Sache habe ich nicht bekommen dieses EncryptedDocumentException.class in das Glas.
Exception in thread "main" java.lang.NoClassDefFoundError: org / apache / poi / EncryptedDocumentException
bei ws.WordRead.main (WordRead.java: 38)
ERROR: Kann JDWP bekommen JNI 1.2 Umwelt, JVM-> getenv () return code = -2
JDWP exit error AGENT_ERROR_NO_JNI_ENV (183): [../../../ src / share / zurück / util.c: 820]
Hallo Nishikanta,
Ich habe verwendet POI-3.0.2-Final.jar und POI-Notizblock-3.0.2-final-20080204.jar Paket für diesen Code.
Nach Ausführen dieses Codes excption "java.io.FileNotFoundException: hello.doc (Das System kann die Datei nicht finden spezifiziert)" wurde generierten,
Also wo platziere ich hello.doc (Ich habe es auf meinem Desktop muss) thankss
Hallo Slim,
Einfach den hello.doc wo. Class-Datei befindet. Wenn Sie setzen die doc-Datei an einen anderen Ort als den Speicherort Weg in den Quellcode. IT wird gut funktionieren.
Vielen Dank,
Hitesh Agrawal
hallo,
Danke für die Antwort.
das Skript funktioniert sehr gut.
Was ist die Wirkung des Einsatzes "Absätze [i] = Absätzen [i]. ReplaceAll (" \ \ cm? \ r? \ n ","");"
Dank
Hallo,
Danke für diesen Beitrag ist es sehr nützlich sein.
Ich versuche, ein Wort über meine Word-Datei finden Sie nach dem Lesen der Datei.
Wie kann ich es tun?
Vielen Dank
java.io.IOException: Kann gesamten Header lesen; 6 Bytes gelesen; erwarteten 512 Bytes
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
bei org.apache.poi.hwpf.HWPFDocument.verifyAndBuildPOIFS (HWPFDocument.java: 133)
bei org.apache.poi.hwpf.HWPFDocument. (HWPFDocument.java: 146)
bei transactionDB.changeFormat.main (changeFormat.java: 45)
Fehleranzeige, was ich zu tun haben, sagen Sie mir bitte
Hallo hitesh,
Thanks for sharing diesem Beispiel. Ich habe eine andere Anforderung mit Word-Datei. Ich möchte ein Bild in Word-Dokuments mit POI hinzufügen, aber nicht wissen, wie dies zu tun.
Vielen Dank,
Ankur Raiyani
Wie lese ich Wort Kommentare und Lesezeichen mit Hilfe von Java? Do u haben einen Beispielcode? Jede Hilfe wäre willkommen.
hallo Freunde,
Kann mir jemand helfen in diesem ... ... ... Ich hatte diesen Code verwenden und diese Ausnahmen im geting ... ... Ich bin mit POI-2.5.1-final-20040804.jar.and POI-Notizblock-3.5-beta5 20090219.jar-Dateien ... ... .. wie Sie den Speicherort Pfad im Quellcode angeben ... .. Ich hatte die Datei in Desktop erhalten
java.io.IOException: Invalid Header-Signatur; lesen 85966670672, erwartet -2226271756974174256
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 88)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
bei rb.action.FileRead.main (FileRead.java: 15)
Sathish Raja,
Haben Sie das Problem behoben, wenn feste Bitte posten Sie die Schritte
Hallo Hitesh,
wo lagere ich die POI-3.0.2-Final.jar und POI-Notizblock-3.0.2-final-20080204.jar Dateien. Ich versuche nur zu dem obigen Beispiel zum Laufen zu bringen. Cheers für die Hilfe.
Darren
Hallo Freunde,
Auf Ausführen dieses Codes bekomme folgende error.can mir jemand sagen, wie dieses Problem zu beheben.
java.io.IOException: Kann gesamten Header lesen; -1 Bytes zu lesen; erwarteten 512 Bytes
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
Hallo! Im wirklich verloren ... Ich freue mich sehr auf diese neue POI aber ich habe diese für mein Projekt, um ein Wort zu lesen, doc ... ist mit Hilfe von Java verwenden Wie kann ich "Einfuhr" das Paket für org.apache.poi? Ich habe den POI-3.5-beta6 heruntergeladen und es hat mich gebeten, Ameise und Forrest installieren .. sie bat mich, die Umgebungsvariable ANT_HOME und FORREST_HOME .. gesetzt bitte helft mir .. im verwechselt!
Hallo Freunde,
Ich versuche, um die Schriftgröße eines Textes zu ändern.
Dazu Schreiben eines HWPF ich bin Stream zu einem anderen und somit kann die Schriftart zu ändern, aber was ich genau brauchen, ist die andere Schriftart (und / oder Größe) für jedes Wort / Absatz haben. Grundsätzlich, mehr als eine Schriftgröße in einem einzigen Stück Word-Datei haben.
Kann jemand bitte sagen Sie mir, wie man über das??
was ich genau brauchen, ist ...
DGD gedgfe
rbr brbr gbntghth
rghh rtfhtyh bnfgh
ist, dass jedes Wort mit unterschiedlichen Eigenschaften font
Erste Fehler:
java.lang.NoClassDefFoundError: org / apache / poi / HPSF / WritingNotSupportedException
hallo,
Ich habe ur Java-Programm zum Word-Dokument zu lesen hingerichtet. es funktioniert gut, aber wenn das Word-Dokument hava a Tabellen. Ihr Code erzeugen ein bösartiges Skript und Code ausgeführt Infinite Loop.
Bitte sagen Sie mir gibt es keine Methoden, um einen Daten aus einer Tabellen in Word-Dokument zu lesen.
@ Ankur Raiyani
Hast du kein Glück bekommen Apache POI zum Einfügen von Bildern in ein Word-Dokument. Ich versuche, das gleiche zu tun.
Vielen Dank.
plzzzz schnell Ich brauche Hilfe: Ich benutze 2 Dateien. Datei-Header mit und ohne Header-Datei, wenn ich die Datei, ohne Header geben Sie mir diesen Fehler java.io.IOException: Invalid Header-Signatur; 0x665C316674725C7B lesen, rechnen 0xE11AB1A1E011CFD0 eingeben
bei org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 107)
bei org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
bei wordtotext.Main.main (Main.java: 30)
und die zweite Datei guten plz helpme laufen
Vielen Dank, u 4 d-Code
System.out.println (Ziffern [i]. ToString ()); / / Drucken der Absätze
bitte jemand kann mir mit dem Java-Code geben, durch die ich kann "Bild einfügen" in ein MS Word-Datei an einem beliebigen Ort, und auch bedenken, dass es einige caontent auf it.plz Antwort hat mich ..
lass es mich bitte wissen, wie Bild einfügen in ein Word-doc-Datei
lass es mich wissen, wie können wir die Bilder zu lesen. doc-Datei mit Text mit Hilfe von Java
Ausgezeichnet.
Danke sehr.
Ich bin begineer o java.When kompiliere ich dieses Beispiel habe ich 9 Fehler.
Helft mir bitte ...
Paket org.apache.poi.poifs.filesystem existiert nicht
Import org.apache.poi.poifs.filesystem .*;
Paket org.apache.poi.hwpf existiert nicht
Import org.apache.poi.hwpf .*;
Paket org.apache.poi.hwpf.extractor existiert nicht
Import org.apache.poi.hwpf.extractor .*;
Symbol nicht finden können
Symbol: class POIFSFileSystem
Lage: Klasse readDoc
POIFSFileSystem fs = null;
Symbol nicht finden können
Symbol: class POIFSFileSystem
Lage: Klasse readDoc
fs = new POIFSFileSystem (neu FileInputStream (filesname));
Symbol nicht finden können
Symbol: class HWPFDocument
Lage: Klasse readDoc
HWPFDocument doc = new HWPFDocument (fs);
Symbol nicht finden können
Symbol: class HWPFDocument
Lage: Klasse readDoc
HWPFDocument doc = new HWPFDocument (fs);
Symbol nicht finden können
Symbol: class WordExtractor
Lage: Klasse readDoc
WordExtractor wir = new WordExtractor (doc);
Symbol nicht finden können
Symbol: class WordExtractor
Lage: Klasse readDoc
WordExtractor wir = new WordExtractor (doc);
9 Fehler
Bitte mir jemand helfen ...
Lassen Sie mich wissen über die grundlegenden Arbeit von mir, aus einem Dokument zu lesen ..
Hallo UJJAL,
Sie müssen Apache POI-Bibliotheken in Ihrem Classpath hinzufügen, damit es funktioniert. Sie können die Pakete von Apache POI http://poi.apache.org/ und auch Sie versuchen, java Microsoft Word-Dokumente lesen, als Sie in erfordert auch diese Bibliotheken wie auch. http://poi.apache.org/ hwpf / index.html
Vielen Dank,
Hitesh Agarwal
Sehr schöne Informationen.
Ist es möglich zu bearbeiten. Doc und / oder. Docx-Dokumente mit POI? Ich möchte in der Lage sein, bestimmte Textfragmente in mehreren Word-Dokumenten zu ersetzen und dann speichern aktualisierte Dokumente auf der Festplatte.
Dieser Code lesen. Doc-Datei Absatz für Absatz.
Wie kann ich diese Datei lesen Satz für Satz?
Vielen Dank im Voraus.
Wie kann ich gelesen doc mit Text und Bildern?
und wie kann ich Text mit Stil lesen?
Hallo,
Wie zu einem String in einem anderen in. Doc-Dokumente zu ersetzen?
Ich denke, es gibt eine Menge von schweren Fehlern in der Umsetzung der HWPF Format, zB die folgenden:
HWPFDocument doc = new HWPFDocument (InputStream);
doc.write (outputStream);
dreht. doc-Dateien in somethig, die nicht mit Word geöffnet werden mehr.
Hitesh,
Vielen Dank für diese. Hervorragende post .. mich gerettet eine Tonne Benutzer.
Wie ermitteln die Position der. Doc-Datei ....
bitte ...
Senden Sie mir den Code ...
Wie ermitteln die Position der. Doc-Datei .... Apache POI
bitte ...
Senden Sie mir den Code ...
Hallo
Können Sie mir bitte sagen wie man eine doc-Datei, die Bilder haben, mit ihm zu lesen.
Post einen Code, wenn möglich ..