C++提取网页所有链接

[复制链接]
查看11 | 回复0 | 2008-2-27 12:42:34 | 显示全部楼层 |阅读模式
用ASCII方式,作为只读文件打开网页.搜寻标签(A 和 HREF 也可能小写,也可能大小写混合),一个网页有很多标签.HREF= 后面双引号之间的字符串就是链接地址.如果字符串不是以http开始,它就是相对地址.查网页头部[B], 若有,HREF= 后面双引号之间的字符串就是基地址.基地址与相对地址连起来就是绝对链接地址.若没有[B] 标签, 要用本网页地址推出基地址.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行