使用Python和Selenium的刮表

Scraping Table using Python and Selenium

我正试图用python刮掉下面的表。尝试拉HTML标记来查找元素id_dt1_ngy00等等，但是一旦填充了页面，就找不到它了，所以有人告诉我使用Selenium并成功地获取了一些数据。

https://www.insidefutures.com/markets/data.php？page=quote&sym=ng&x=13&y=8页

这些数字每10分钟更新一次，所以这个网站是动态的。使用下面的代码，但它以线性格式打印所有内容，而不是以表格形式显示为行和列的格式。下面包括两个部分的样本输出

1
2
3
4
5
6
7
8
9
10

Contract
Last
Change
Open
High
Low
Volume
Prev. Stl.
Time
Links

五月21日(NGK21)

1
2
3
4
5
6
7
8
9

2.550s
+0.006
2.550
2.550
2.550
1
2.544
05/21/18
Q / C / O

Jun’21(NGM21)

1
2
3
4
5
6
7
8
9

2.576s
+0.006
0.000
2.576
2.576
0
2.570
05/21/18
Q / C / O

下面的代码导入时间来自BS4进口美汤来自Selenium导入WebDriver将熊猫作为PD导入

browser=webdriver.chrome(可执行文件u path="c:userssiddkpycharmprojectswebsrapingvenvseleniumwebdriverchromedriver.exe")

browser.get("https://www.insidefutures.com/markets/data.php？"page=quote&sym=ng&x=14&y=16")

html=browser.page_源soup=beautifulsoup(html，'html.parser')

thu tags=汤。查找所有(tr)对于标签中的th：打印(th.get_text())

我想在熊猫中提取这些数据，并每天分析平均值等。请帮忙。我已经用尽了自己的力量，通过多次迭代来编写代码。