Python - which is considered better for scrapping: selenium or beautifulsoup with selenium?
这个问题是针对Win10上的Python 3.6.3、BS4和Selenium 3.8的。
我正在尝试用动态内容刮取页面。我试图搜集的是数字和文本(例如http://www.oddsportal.com)。从我的理解使用请求+美汤不会做这个工作,因为动态内容会被隐藏。所以我必须使用其他工具,比如我们的Selenium WebDriver。
那么,考虑到我无论如何都会使用Selenium WebDriver,您是否建议忽略BeautifulSoup并坚持使用Selenium WebDriver函数,例如
1 | elem = driver.find_element_by_name("q")) |
或者是使用硒+美容汤被认为是更好的做法?
你对这两条路线中哪条能给我提供更方便的功能有什么看法吗?
谢谢。
美人汤
要创建一个强大而高效的框架来使用动态内容来抓取页面,您必须在框架中集成
这里是一个
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 | find_element_by_id find_element_by_name find_element_by_xpath find_element_by_link_text find_element_by_partial_link_text find_element_by_tag_name find_element_by_class_name find_element_by_css_selector # and find_elements_by_name find_elements_by_xpath find_elements_by_link_text find_elements_by_partial_link_text find_elements_by_tag_name find_elements_by_class_name find_elements_by_css_selector |
所以大多数情况下你不需要
尤其是