一个Htmlparser的问题

[复制链接]
查看11 | 回复1 | 2010-12-10 13:52:51 | 显示全部楼层 |阅读模式
public class TestClass {
public static void main(String[] args){
TestClass t=new TestClass();
t.ggg("http://comment4.news.sina.com.cn/comment/skin/default.html?channel=cj&newsid=31-1-9085297&style=0");
}
public static void ggg(String url) {

GetStyleHtml gsh = new GetStyleHtml(url);//里面自己填
Wildcard wildcard = new Wildcard(); //通配符类,用于批量生成字符串,使用方法见Wildcard.java文件内的注释
String[] scripts = wildcard.generateString("sinaCMNT.curpage.reload_page(#p@#);", 1, 0, 1);
gsh.AddScripts(scripts);
Vector sources = gsh.get();
String fileName = new String();
try {
for (int i = 0; i < sources.size(); ++i) {

fileName = "Eureka_" + i+ ".html";

System.out.println(sources.get(i));
FileWriter fw = new FileWriter("d:\\comments\\"+fileName);


fw.write(sources.get(i));

fw.flush();

fw.close();

System.out.println("Complete output html code to " + fileName);
}
} catch (IOException e) {
System.out.println(e);
}

}
}
在这个类里面,ggg函数是好使的,可以把新闻评论网页成功保存到本地。
但是在别的类里面条用这个方法的时候,保存下来的网页就是乱码。
有人知道是什么原因吗》

回复

使用道具 举报

千问 | 2010-12-10 13:52:51 | 显示全部楼层
编码格式不一致导致乱码。看看页面编码,参数传递,后台编码,有数据库还要看数据库编码是否一致。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行