写个抓取我们学校主页的java代码,
部分代码如下,
URL url = new URL("http://www.sdust.edu.cn/");
InputStreamReader isr = new InputStreamReader(url.openStream());
BufferedReader br = new BufferedReader(isr);
String sum = "";
String p;
String a;
while ((a = br.readLine()) != null) {
sum = sum +"\n"+ a;
}
System.out.println(sum);
br.close();
isr.close();
我想问怎么改编码方式java。我输出后中文出现乱码,找了很多代码,有的太长了,没看懂
java 编码问题 ?上网抓的源码,中文出现乱码,怎么改成UTF-8
答案:2 悬赏:60 手机版
解决时间 2021-01-24 15:17
- 提问者网友:动次大次蹦擦擦
- 2021-01-24 09:12
最佳答案
- 五星知识达人网友:杯酒困英雄
- 2021-01-24 09:42
修改代码: 指定字符集UTF-8
InputStreamReader isr = new InputStreamReader(url.openStream(),"UTF-8");
InputStreamReader isr = new InputStreamReader(url.openStream(),"UTF-8");
全部回答
- 1楼网友:我住北渡口
- 2021-01-24 10:14
那是编码方式不统一的缘故。网页内容一般都是utf-8,而汉字编码却是GB2312。你先将获取到的内容格式化后再转码成GB2312货值直接转换成GB2312试一试,应该是可行的
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯