永发信息网

如何从word文件的二进制流中提取文本

答案:2  悬赏:80  手机版
解决时间 2021-02-28 10:59
如题,请问如何实现?

你这个是直接从文件得来,我是想word文件已经存入数据库里面了,所以你的方法不适合
最佳答案
用BufferedReader很容易实现的.我写了一个,仅供参考:
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.Reader;

public class ReaderWordFile
{
public static void main(String[] args){
//我是假设我的word文件为F:盘下的test.doc.所以先创建这个文件.
File file = new File("F://test.doc");
FileInputStream fis=null;
Reader reader=null;
BufferedReader br=null;
try {

fis = new FileInputStream(file);
reader = new InputStreamReader(fis);
br = new BufferedReader(reader);
String strLine;
StringBuffer sb = new StringBuffer();

while((strLine = br.readLine())!=null){
sb.append(strLine+"\n");
}

System.out.println(sb.toString());
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
try {

fis.close();
reader.close();
br.close();
} catch (IOException e) {
e.printStackTrace();
}

}

}
}

当然这样做,这个word文件必须得是纯文本文件.所以这个方法更适合于读取txt文件.

补充:
word文件已经在数据库里了?你想从数据库中读取word文件?
如果word是以binary或image存在在数据库中的.你也可以把这些数据封装在一个输入流里面.你仅仅只是多做了ODBC-JDBC桥而已,当然不同的数据库都对Java提供了JDBC包,且都是免费下载的到的,使用起来就更方便了.
我不明白word文件的来源到底是文件,还是数据源有什么区别?
你掌握一种思想就行了.
全部回答
同问。。。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
豪庭丽晶假日酒店-会议厅我想知道这个在什么
王大娘家有公鸡46只,母鸡比公鸡多37只,母鸡有
单选题下列说法中,不正确的一项是A.古人称山
公交车刷卡一元怎么有时一块五
詹姆斯鞋有两个粘条的是什么?
五谷丰登的五谷是指哪五谷?
(21分)阅读下列材料,回答问题。材料一新教
易语言媒体播放控件
雨心亭茶庄怎么去啊,有知道地址的么
什么样的地垫好
复元堂这个地址在什么地方,我要处理点事
按哪个穴位能行气,帮助消化
海捣网的东西为什么保税区在中国
檀木湾村怎么去啊,有知道地址的么
铜绿的主要成分是碱式碳酸铜〔Cu2(OH)2CO3
推荐资讯
移动出了移动手机贷了?
怎么我看人家电脑硬盘内存那么大 而我的总大
请问笔记本电脑光盘怎么放进去
华为手机 流量不稳定 经常闪动 连不上网了
英语作文 灰姑娘的故事 要用一般过去时态
为何伊丽莎白一世的遗愿包括后嗣国君不能以
怎么样的狗狗健康
珠海历史文化遗址有哪些
寒假旅游地点推荐?
将Access数据库中的数据发布在Internet上可以
下面关于哺乳动物关节组成的叙述,正确的是DA
红旗区新乡视界馆驿站地址在什么地方,想今天
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?