python BeautifulSoup获取a标签问题

显示全部楼层 · 2011-12-26 22:13:31

# encoding: UTF-8#请自行下载lxml库from lxml.html import fromstring#伟大无敌的lxml库class_name="row"#先找到class=row的所有DOM对象dxpath="./td[1]/a"#再根据xpath找到对应的 a 标签f=open("1.TXT")#读取你的测试文档a=f.read()f.close()dom = fromstring(a)b = dom.find_class(class_name)#找到所有class=row的对象print len(b)if len(b):
for b1 in b:
ddd...

千问 · 2011-12-26 22:13:31

还是BeautifulSoup好用的。详见我的教程：【教程】Python中第三方的用于解析HTML的库：BeautifulSoup(此处不能贴地址，可以通过google搜标题，即可找到帖子地址)...

千问 · 2011-12-26 22:13:31

大杂烩...