Läsa Microsoft Word-dokument i JAVA
När det gäller behandlingen Microsoft Office Word-dokument Java har inga i bygga klasser för att hantera detta, men Apache POI-utvecklat Apache Foundation ger dig möjlighet att läsa Microsoft Word-dokument i Java. Mer information om Apache POI paketet finns på Apache POI
; import org.apache.poi.poifs.filesystem .*; ; import org.apache.poi.hwpf .*; ; import org.apache.poi.hwpf.extractor .*; ; import java.io. *; public class readDoc ( main ( String [ ] args ) public static void main (String [] args) ( "Hello.doc" ; String filesname = "Hello.doc"; ; POIFSFileSystem fs = null; Försök ( POIFSFileSystem ( new FileInputStream ( filesname ; fs = new POIFSFileSystem (ny FileInputStream (filesname; / / Kunde inte stänga hängslen i slutet på min webbplats inte gjorde det möjligt att stänga HWPFDocument ( fs ) ; HWPFDocument doc = new HWPFDocument (FS); WordExtractor ( doc ) ; WordExtractor vi = new WordExtractor (doc); paragraphs = we. getParagraphText ( ) ; String [] stycken = vi. GetParagraphText (); . println ( "Word Document has " + paragraphs. length + " paragraphs" ) ; System. Ut. Println ("Word-dokument har" + stycken. Längd + "punkterna"); int i = 0 ; i < paragraphs . length ; i ++ ) { for (int i = 0; i <punkter. längd; i + +) ( = paragraphs [ i ] . replaceAll ( " \\ cM? \r ? \n " , "" ) ; punkterna [i] = punkterna [i]. replaceAll ("\ \ cm? \ r? \ n", ""); . println ( "Length:" + paragraphs [ i ] . length ( ) ) ; System. Ut. Println ("Längd:" + stycken [i]. Längd ()); ) ) Exception e ) { catch (Exception e) ( ; e. printStackTrace (); ) ) )
Kod Förklaring:
- Skapa nya POIFSFileSystem Object och avläggande av Microsoft Word-dokument till det
- Skapa nya objekt av HWPFDocument klass, denna klass med särskilt ansvar för hantering av Microsoft Word-dokument
- WordExtractor kommer att packa alla ord från Word-dokument
- getParagraphText () kommer att extrahera all text punkt vise
- Slutligen försöker vi läser stycket innehåll

Anpassad sökning
Populära artiklar:
- Remote URL anslutning via Proxy i Java
- Starta klass Metoder använda Reflektion i Java
- Läsa nya e-postmeddelanden från Java-program
- Java Plugin upptäckt med hjälp av JavaScript
- Singleton Design Mönster i Java
- Datum Manipulation i JAVA
- HTTP Form POST-begäran med AJAX och servlets
- HTTP POST filinnehåll i JAVA
- Att skicka Undantag mail via Apache Log4J
- Programmatiskt loggning använder Apache Log4J



































Hej,
Jag får följande undantag när du kör detta exempel.
Kan ni låta mig veta om jag saknar några burkar / behöver göra något annat för att utföra detta java klass.
Tack på förhand för din hjälp.
Hälsningar,
Subramanyam.
Hej,
ledsen för spam. knutna undantag.
Jag får följande undantag när du kör detta exempel.
java.io.IOException: Ogiltig rubrik undertecknande, läsas 7021802808062469458, förväntade -2226271756974174256
på org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 112)
på org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
på com.general.test.ReadDoc.main (ReadDoc.java: 16)
Kan ni låta mig veta om jag saknar några burkar / behöver göra något annat för att utföra detta java klass.
Tack på förhand för din hjälp.
Hälsningar,
Subramanyam.
Efter springa den här koden jag fick nedan undantag. Vänligen ge mig någon lösning på detta execption. Jag har redan in burken också, men ändå jag fick detta execption. En sak jag inte få den här EncryptedDocumentException.class i burken.
Undantag i tråden "main" java.lang.NoClassDefFoundError: org / apache / poi / EncryptedDocumentException
på ws.WordRead.main (WordRead.java: 38)
FEL: JDWP gick inte att få JNI 1,2 miljön, JVM-> GetEnv () returkod = -2
JDWP utträde fel AGENT_ERROR_NO_JNI_ENV (183): [../../../ src / share / back / util.c: 820]
Hej Nishikanta,
Jag har använder POI-3.0.2-Final.jar och POI-anteckningsblock-3.0.2-FINAL-20080204.jar paket för denna kod.
efter att ha kört den här koden excption "java.io.FileNotFoundException: hello.doc (Systemet kan inte hitta filen)" var genereted
så där gör jag måste placera hello.doc (Jag skapade den på skrivbordet) thankss
Hej Slim,
Bara placera hello.doc där. Klass filen finns. Om du sätter DOC-fil på annan ort än ange platsen sökvägen i källkoden. Det kommer att fungera bra.
Tack,
Hitesh Agrawal
hej,
tack för svaret.
skriptet fungerar mycket bra.
vad är effekten av att använda "punkterna [i] = punkterna [i]. replaceAll (" \ \ cm? \ r? \ n ","");"
tack
Hej,
Tack för det här inlägget, det är mycket användbart.
Jag försöker hitta ett ord om mitt Word-fil efter att ha läst filen.
Hur kan jag göra det??
Tack så mycket
java.io.IOException: Det går inte att läsa hela huvudet, 6 byte läsa; förväntade 512 bytes
på org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
på org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
på org.apache.poi.hwpf.HWPFDocument.verifyAndBuildPOIFS (HWPFDocument.java: 133)
på org.apache.poi.hwpf.HWPFDocument. (HWPFDocument.java: 146)
på transactionDB.changeFormat.main (changeFormat.java: 45)
Fel visa vad jag har att säg mig behaga
Hej Hitesh,
Tack för att detta exempel. Jag har ett annat krav med Word-fil. Jag vill lägga till en bild i Word-dokument med hjälp av IP, men vet inte hur man gör detta.
Tack,
Ankur Raiyani
Hur kan jag läsa ordet kommentarer och bokmärken med Java? Gör fullständig har en prov-kod? Någon hjälp skulle uppskattas.
hej vänner,
Kan någon hjälpa mig i detta ... ... ... jag har använda den här koden och im geting detta undantag ... ... jag brukar POI-2.5.1-final-20040804.jar.and POI-anteckningsblock-3.5-beta5-20090219.jar filer ... ... .. hur man ange platsen sökvägen i källkoden ... .. jag hade hållit filen i skrivbord
java.io.IOException: Ogiltig rubrik undertecknande, läsas 85966670672, förväntade -2226271756974174256
på org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 88)
på org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
på rb.action.FileRead.main (FileRead.java: 15)
Sathish Raja,
Har du fast frågan, om fasta posta stegen
Hej Hitesh,
var gör jag lagra POI-3.0.2-Final.jar och POI-anteckningsblock-3.0.2-FINAL-20080204.jar filer. Jag försöker bara få exemplet ovan fungerar. Skål för hjälp.
Darren
Hej vänner,
Den verkställande denna kod är att få följande error.can någon berätta för mig hur du löser detta problem.
java.io.IOException: Det går inte att läsa hela huvudet, -1 byte läsa; förväntade 512 bytes
på org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 78)
på org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 83)
hello! im verkligen förlorat ... Jag är mycket ny på detta POI men jag måste använda detta för mitt projekt är att läsa ett ord doc Använda Java ... Hur kan jag "import" paketet för org.apache.poi? Jag har laddat ner POI-3.5-beta6 och bad mig att installera myra och skogen .. Det bad mig att ställa in miljövariabeln att ANT_HOME och FORREST_HOME .. behag hjälpa mig .. im förvirrat!
Hej vänner,
Jag försöker att ändra teckenstorlek i en text.
För att göra detta skriver jag en HWPF ström till en annan och därmed kan ändra teckensnitt, men vad jag exakt behöver är att ha olika teckensnitt (och / eller storlek) för varje ord / stycke. I grund och botten att ha mer än en teckenstorlek i ett enda ord-fil.
Kan någon behaga tala mig hur man ska göra det??
vad jag exakt behöver är ...
DGD gedgfe
rbr brbr gbntghth
rghh rtfhtyh bnfgh
som varje ord har olika teckensnitt egenskaper
blir fel:
java.lang.NoClassDefFoundError: org / apache / IP / hpsf / WritingNotSupportedException
hej,
Jag har utförts ur java program för att läsa word-dokument. Det fungerar bra, men om ordet handling Hava ett bord. din kod producera ett skadligt skript och koden körs infinte slinga.
tala om för mig finns det någon metoder för att läsa en data från en tabell i Word-dokument.
@ Ankur Raiyani
Hade du någon tur att få apache POI att infoga bilder i ett Word-dokument. Jag försöker göra samma sak.
Tack så mycket.
plzzzz snabbt jag behöver hjälp: Jag använder två filer. fil med rubrik och fil utan rubrik när jag gå in på filen utan huvud ge mig det här felet java.io.IOException: Ogiltig rubrik undertecknande, läsas 0x665C316674725C7B, förväntade 0xE11AB1A1E011CFD0
på org.apache.poi.poifs.storage.HeaderBlockReader. (HeaderBlockReader.java: 107)
på org.apache.poi.poifs.filesystem.POIFSFileSystem. (POIFSFileSystem.java: 151)
på wordtotext.Main.main (Main.java: 30)
och den andra filen kör bra plz helpme
Tacka fullständig 4 d-nummer
System.out.println (punkterna [i]. ToString ()); / / för att skriva ut punkter
behaga någon kan ge mig av Java-koden genom vilket jag kan infoga bilden i ett MS Word-fil på varje plats, och anser också att den har några caontent på it.plz svara mig ..
låt mig veta hur du infogar bilden i ett Word doc-fil
låt mig veta hur kan vi läsa bilder av. doc-fil tillsammans med text med hjälp av java
Utmärkt.
Tack så mycket.
Jag begineer o java.When jag sammanställa detta exempel jag fick 9 fel.
Hjälp mig snälla ...
paket org.apache.poi.poifs.filesystem finns inte
import org.apache.poi.poifs.filesystem .*;
paket org.apache.poi.hwpf finns inte
import org.apache.poi.hwpf .*;
paket org.apache.poi.hwpf.extractor finns inte
import org.apache.poi.hwpf.extractor .*;
kan inte hitta symbol
symbol: klass POIFSFileSystem
plats: klass readDoc
POIFSFileSystem fs = null;
kan inte hitta symbol
symbol: klass POIFSFileSystem
plats: klass readDoc
fs = new POIFSFileSystem (ny FileInputStream (filesname));
kan inte hitta symbol
symbol: klass HWPFDocument
plats: klass readDoc
HWPFDocument doc = new HWPFDocument (FS);
kan inte hitta symbol
symbol: klass HWPFDocument
plats: klass readDoc
HWPFDocument doc = new HWPFDocument (FS);
kan inte hitta symbol
symbol: klass WordExtractor
plats: klass readDoc
WordExtractor vi = new WordExtractor (doc);
kan inte hitta symbol
symbol: klass WordExtractor
plats: klass readDoc
WordExtractor vi = new WordExtractor (doc);
9 fel
Hej UJJAL,
Du måste lägga till Apache POI bibliotek i din klass väg att få det att fungera. Du kan ladda ner Apache POI paket från http://poi.apache.org/ och du försöker läsa Microsoft Word-dokument i java än ni också kommer att kräva detta bibliotek också. http://poi.apache.org/ hwpf / index.html
Tack,
Hitesh Agarwal
Behaga någon hjälpa mig ...
Låt mig veta om de grundläggande uppgift för mig att läsa ur ett dokument ..
Mycket trevlig information.
Är det möjligt att redigera. Doc och / eller. DOCX dokument med POI? Jag skulle vilja kunna ersätta vissa textfragment i flera Word-dokument och sedan spara uppdaterade dokument till disk.
Denna kod läser en. Doc-fil punkt för punkt.
Hur kan jag läsa denna fil mening för mening?
Tack på förhand.
Hur kan jag läsa doc med text och bilder?
och hur jag kan läsa text med stil?
Hej,
Hur man byter en sträng efter en annan i. Doc dokument?
Jag tror att det finns en hel del allvarliga buggar i genomförandet av HWPF format, t.ex. följande:
HWPFDocument doc = new HWPFDocument (inputStream);
doc.write (outputStream);
svängar. doc-filer till somethig som inte kan öppnas med Word längre.
Hitesh,
Tack för detta. Utmärkt post .. bevarat jag en ton av sökande.
Hur identifierar rubriken till den. Doc-fil ....
snälla ...
sända jag koden ...
Hur identifierar rubriken till den. Doc-fil .... använder Apache POI
snälla ...
sända jag koden ...
Hej
Kan du berätta för mig hur man läser en doc-fil som har bilder med den.
Post del kod om möjligt ..
@ Subramanyam
hej
im vill läsa en doc-fil med POI-gränssnittet men im geeting ett fel på paketet och ordet extractor plz hjälpa mig
tack på förhand