网页信息抽取

[复制链接]
查看11 | 回复2 | 2011-3-1 15:49:21 | 显示全部楼层 |阅读模式
各位大虾:
小弟希望从网页上抽取特定的数据,比如说从网页的超级连接上我们知道网页上有10个名字,我想把这十个名字都提取出来,该用什么样的方法呢?
需要自动抽取

回复

使用道具 举报

千问 | 2011-3-1 15:49:21 | 显示全部楼层
可以看看HtmlParser,有过滤HTML标签的功能;也可以直接用正则表达式。
回复

使用道具 举报

千问 | 2011-3-1 15:49:21 | 显示全部楼层
查看网页源代码,在代码中提取
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行