python BeautifulSoup获取a标签问题

[复制链接]
查看11 | 回复3 | 2011-12-26 22:13:31 | 显示全部楼层 |阅读模式
# encoding: UTF-8#请自行下载lxml库from lxml.html import fromstring#伟大无敌的lxml库class_name="row"#先找到class=row的所有DOM对象dxpath="./td[1]/a"#再根据xpath找到对应的 a 标签f=open("1.TXT")#读取你的测试文档a=f.read()f.close()dom = fromstring(a)b = dom.find_class(class_name)#找到所有class=row的对象print len(b)if len(b):
for b1 in b:
ddd...
回复

使用道具 举报

千问 | 2011-12-26 22:13:31 | 显示全部楼层
还是BeautifulSoup好用的。详见我的教程:【教程】Python中第三方的用于解析HTML的库:BeautifulSoup(此处不能贴地址,可以通过google搜标题,即可找到帖子地址)...
回复

使用道具 举报

千问 | 2011-12-26 22:13:31 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行