我们取消了Amazon.in网站,以检索任何产品的价格。所有产品在“span”标签中的“id”属性都有不同的值,例如;
id = 'priceblock_ourprice', id = 'priceblock_saleprice', and id = 'priceblock_dealprice'.
我们的任务是使用find_all(..)检索产品的价格美汤法。根据我们的基本知识,我们只能给出find_all(..)的一个参数方法如下所示:
m = soup1.find_all('span', {'id': &
我正在使用美汤来编辑一个html文件。我已经能够添加标记,但是在script元素中添加javascript代码时遇到了问题。
我有以下代码:
soup = BeautifulSoup(differencehtml, 'html.parser')
# create a new tag
tag = soup.new_tag("script")
tag.append = jscodestring # this is not adding the javascript to the html file
# tag.string = jscodestring # al
作为标题,我尝试使用read_html,但出现以下错误:
In [17]:temp = pd.read_html('C:/age0.html',flavor='lxml')
File "<string>", line unknown
XMLSyntaxError: htmlParseStartTag: misplaced <html> tag, line 65, column 6
我做错了什么?
更新01
HTML在顶部包含一些javascript,然后是一个html表。我使用R来处理它,通过解析html by XML
当我用漂亮的汤登录一些产品后,我试着从网页上刮起东西来。有一种情况是,产品不再可用。该网页只有在没有产品的页面上才有一个div类,如下所示
<div class="alert alert-danger">
<p>There is an error</p>
所以我知道
if soup.find_all('div', {'class': 'alert'}):
print('Alert...')
或
if soup.find_all('div', {