我试图使用美丽的汤刮从rottentomatoes.com的电影引号。页面源很有趣,因为引号是由span类“粗体quote_actor”直接进行的,但是引号本身没有类,例如():。
我想使用美丽汤的find_all捕捉所有的引号,没有演员的名字。我尝试过很多没有成功的事情,例如:
moviequotes = soup(input)
for t in web_soup.findAll('span', {'class':'bold quote_actor'}):
for item in t.parent.next_siblings:
我现在是一个学生,我现在学习的是美丽的汤,所以我的讲师就像我一样从商店里收集数据,但是我不能擦拭产品的细节。目前,我正在尝试从中抓取数据。我只想弄清楚产品的名称和价格。有人能告诉我为什么我不能用漂亮汤刮数据吗?
这是我的代码:
from requests import get
from bs4 import BeautifulSoup
url = "https://shopee.com.my/shop/13377506/search?page=0&sortBy=sales"
response= get (url)
soup=BeautifulSoup(response
我正在用美丽的汤刮一些基本的数据。我需要的源代码的部分如下:
<div class="header-team">Team name 1</div>
<div class="header-team">Team name 2</div>
这两条线不是相邻的。
我正在尝试这样做:
for team in soup.findAll('div', 'header-team')
print team
但是把所有的代码都拿回来。我尝试在.text上添加,但它返回了一个错误。
我想从当地一家电影院的网站上刮点东西,当某部电影在运行时,我会一直拍下去。
我找到了一张表格,其中列出了如下形式的时间:
[<time datetime="2020-01-31T21:15:00+01:00">21:15</time>].
如果我用漂亮汤作为x.find_all(“时间”)。我得到了上面所示的所有时间。但我只想要“日期时间”,所以在本例中,2020-01-31T21: 15: 00 + 01: 00。现在当我搜索x.find_all(‘time’)‘日期时间’时,我得到以下错误:
TypeError: list indices must
我是python的新手。我想在eclipse中运行python脚本,因为我对此有点适应。我正在尝试导入和运行美丽汤在eclipse oxygen.Import是成功的,但我得到一个错误(未解决的导入汤)与以下code.However美丽汤是工作良好与anaconda.enter图像描述在这里
从bs4导入BeautifulSoup as soup
我正在尝试使用python在web上刮取一个HTML表。HTML页面中有很多表,但是我只想刮一个特定的表。我正在用漂亮的汤做这个网刮。
我的代码如下所示:
page = get("http://uobgoldprice.com/history/2018/September/10/")
html = BeautifulSoup(page.content, 'html.parser')
for p in html.select('tr'):
if p.text == "ARGOR CAST BAR":
pri
我试图提取非本地链接(链接不是自我引用或不属于相同的领域,我正在从网页上刮出)在美丽的汤。下面是允许我做相反操作的代码:
import re
from bs4 import BeautifulSoup
from urllib import parse, request
def get_links(root, html):
soup = BeautifulSoup(html, 'html.parser')
for link in soup.find_all('a', href=re.compile('https://www\.eecs\.
<p>
A
<span>die</span>
is thrown \(x = {-b \pm
<span>\sqrt</span>
{b^2-4ac} \over 2a}\) twice. What is the probability of getting a sum 7 from
both the throws?
</p>
在上面的html中,我只需要删除“(标记)”中的标记,即\(x = {-b \pm <span>\sqrt</span> {b^2-4ac} \
我在用美汤刮网。所以,我有HTML代码,它有8个表。我在试着从这些桌子上提取内容。
for row in soup('table')[4].tbody('tr'):
tds = row('td')
print tds[0].string, tds[1].string
它给出了错误:
for row in soup('table')[4].tbody('tr'):
TypeError: 'NoneType' object is not callable
据我所知,soup('t