我试图用python和BeautifulSoup4编写一个程序,它可以查看某个游戏的蒸汽市场头版(在本例中是Rust),并查看每个项目并取其名称和价格。到目前为止,我已经成功地实现了第一页的工作(因为每一页只显示10项,但是当我更改第二页的web地址时,我得到的第一页的输出与第一页完全相同。我为第一页使用的网址是:守则是:import urllib.request
for web_page in range(1,3):
然后使用Python/Selenium搜索站点,GoodReads.com查找该标题。获取结果的URL,并生成一个新的.CSV文件,其中包含列1=book标题和列2=Site URL
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver
我对编码和Python相当陌生,所以如果这是一个愚蠢的问题,我很抱歉。我想要一个脚本,它可以遍历所有19,000个搜索结果页面,并为所有的urls抓取每个页面。我已经完成了所有的报废工作,但不知道如何处理页面使用AJAX分页这一事实。通常,我只需使用url循环来捕获每个搜索结果,但这是不可能的。这是页面:with io.open('heritageURLs.txt', 'a', encoding='utf8') a