我有一个卷曲页面抓取与卷曲,并希望抓住所有的链接与一定的id。据我所知,最好的方法是使用dom和xpath。下面的代码抓取了大量的url,但删除了其中的许多,并抓取了不是url的文本。$curl_scraped_page是用卷曲抓取的页面。$dom = new DOMDocument();$xpath = new DOMXPath($dom);
$hrefs =$
我已经抓取了所有联盟名称的所有文本。但我也需要一个XPATH或任何指示器,这样我才能告诉selenium:如果我在GUI中从下拉菜单中选择了例如EFL联赛2 (ENG 4),那么在web应用程序中使用相应的xpath来选择正确的联赛。- I try to get a link/xpath for each corresponding league to use later with selenium
scrape_leagues_xpath= driver.find_elements_b
我正在从一个叫启动印度的网站上抓取数据,我试图删除配置文件的URL和名称,但一些配置文件没有,如果一些配置文件没有URL,我应该将名称和URL设置为无,为此我尝试了许多替代方案,如try-except)
next = self.driver.find_elements_by_xpath("//*[@id='persona-results']//a[@class='img-wrap'write it