Getting the href of <a> tag which is in <li>
如何获取给定代码中"子论坛"类下的所有标记的Href?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | `<li class="subforum"> Link1 Text </li> <li class="subforum"> Link2 Text </li> <li class="subforum"> Link3 Text </li> ` |
我试过这个代码,但显然不起作用。
1 2 3 4 | `Bs = BeautifulSoup(requests.get(url).text,"lxml") Class = Bs.findAll('li', {'class': 'subforum"'}) for Sub in Class: print(Link.get('href'))` |
文档:使用标记名导航
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | import bs4 html = '''<li class="subforum"> Link1 Text </li> <li class="subforum"> Link2 Text </li> <li class="subforum"> Link3 Text </li> `''' soup = bs4.BeautifulSoup(html, 'lxml') for li in soup.find_all(class_="subforum"): print(li.a.get('href')) |
出:
1 2 3 | Link1 Link2 Link3 |
为什么使用
搜索具有特定css类的标记非常有用,但css属性的名称
您就快到了,只需为您所找到的每个
1 2 3 | Class = Bs.findAll('li', {'class': 'subforum"'}) for Sub in Class: print(Sub.find("a").get('href')) # or Sub.a.get('href') |
但是,有一种更简单的方法-CSS选择器:
1 2 | for a in Bs.select("li.subforum a"): print(a.get('href')) |
这里,
附带说明,在