腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
为
python
webscraping
脚本
中
的
错误
创建
异常
、
、
、
我是一个在
python
和编程方面的乞讨者。 我用
python
编写了一段代码,用于将特定网站
的
数据转换为csv数据。一般来说,它对我来说工作得很好。我通常会让它在晚上运行,那时网站
的
响应会更快更稳定。 问题是:有时我自己
的
连接失败了,或者在网站上发生了一些不稳定
的
事情,
脚本
返回了一个
错误
,这让我失去了很多时间。我想用一些
错误
处理方法来改进代码,这样它就可以继续检查insternet连接是否正常工作,并在它工作时移动到下一个链接,而不是崩
浏览 15
提问于2020-08-07
得票数 1
回答已采纳
1
回答
为什么我不能给tryCatch (R)
的
错误
函数
中
的
变量赋值?
、
、
我正在
创建
一个
webscraping
脚本
,它有时要求我在遇到
错误
时引发
异常
。但是,即使使用tryCatch函数,也会弹出
错误
消息(尽管不会中断代码)。但是,当出现
错误
时,我已经
为
变量指定了一个新值。然而,它似乎没有被分配。为什么会发生这种情况?我希望拥有与
Python
和try相同
的
功能。}, found_university
浏览 1
提问于2022-08-25
得票数 2
回答已采纳
5
回答
使用crontab运行selenium (
python
)
、
、
、
我有一个
python
脚本
,它使用下一行selenium调用chrome。ff = webdriver.Chrome('/home/user01/
webScraping
/CollectAndGo/chromedriver')
python
脚本
是从shell
脚本
调用
的
。
python
/home/user01/
webScraping
/
浏览 8
提问于2014-05-28
得票数 18
回答已采纳
1
回答
csv -
python
抓取
的
多个读数
、
、
Instaloader() print(profile.followers) 我想通过csv传递多个用户,
脚本
将为每个用户运行
浏览 18
提问于2021-01-16
得票数 0
1
回答
Python
抓取: soup.select
的
问题
、
我正在开发一个
python
脚本
,用于从特定站点( )
中
刮取数据这次我使用soup.select方法,类名为W(100%) M(0),我
的
代码如下所示:import pandas as pdtable = soup.select("W(100%) M(0)
浏览 4
提问于2022-09-13
得票数 0
1
回答
错误
2002 (HY000):无法通过Lubuntu20.04LTS上
的
socket '/var/run/mysqld/mysqld.sock‘(2)连接到本地MySQL服务器
、
、
(scrapy_course) andylu@andylu-Lubuntu-PC:~/Desktop/Misc_
python
_scripts/Scrapy_
Webscraping
_Course/books_crawler下一首,我尝试连接到mysql:( andylu@andylu-Lubuntu-PC:~/Desktop/Misc_
python
_scripts/Scrapy_
Webscraping
_Course/books_crawler最后
浏览 0
提问于2020-12-06
得票数 0
1
回答
webkitbrowser注入javascript修改输入文本值时出错
、
、
、
、
我在使用
Python
2.7
中
的
WebkitBrower从网页获取输入文本
的
值时遇到了问题。下面是示例代码: user_agent='Mozilla/5.0 (compatible; MSIE 9.0; TOB 6.11; Windows NT 6.1
浏览 2
提问于2015-01-01
得票数 1
回答已采纳
1
回答
Selenium将在没有根权限
的
情况下运行,显示WebDriverException: Message: Service /usr/bin/chromedriver意外退出
错误
、
、
、
、
我有一个selenium
脚本
,在另一个
python
程序
中
执行。此程序只在我使用ssh作为root登录到服务器时执行,而不是由www-data用户执行,因为它返回时会出现
错误
:我使用以下命令运行
脚本
: os.system('
python
3 /var/website/
webscraping
.py'
浏览 16
提问于2021-12-31
得票数 2
回答已采纳
2
回答
如何
创建
一个for循环来填充DataFrame?
、
、
我已经开始学习
python
,并偶然发现了一个利用
python
的
机会,这是我在工作
中
的
优势。 i+= 1但最终还是出现了这样
的
错误
: Traceback (most recent call l
浏览 4
提问于2022-05-27
得票数 0
2
回答
用
Python
和selenium抓取URL
、
、
、
我正在尝试让
python
selenium
脚本
工作,它应该执行以下操作: 我希望我们能使这个工作,然后请帮助我一步一步地使它运行。gDrive/AudioBookReviews/
WebScra
浏览 0
提问于2019-09-08
得票数 2
回答已采纳
2
回答
将刮取
的
数据加载到Postgresql
中
、
我已经结合了一些关于网络抓取
的
教程,并制作了一个简单
的
网页爬虫,这是刮新张贴
的
问题在这里所以。我想将它们加载到我
的
postgresql数据库
中
,但是我
的
爬虫给我看
的
解码
错误
有问题。
错误
:
浏览 3
提问于2015-06-09
得票数 1
回答已采纳
1
回答
如何完全删除
python
中
包含类
的
HTML标记?
、
、
、
我有一个网络刮刀,从CNN,福克斯,和英国广播公司在BeautifulSoup
的
文章。然后,在进行了一些预处理之后,我将原始文章返回给API。但是,我不知道如何完全删除包含
Python
中
令人讨厌
的
类
的
HTML标记。我尝试了lxml清理器,但是我可以删除标记,但不仅仅是包含某个类
的
标记。如果在本例
中
我试图删除“帮助”,我想要一个
脚本
,该
脚本
将转换如下所示
的
HTML: <p class="help&quo
浏览 1
提问于2022-03-08
得票数 0
回答已采纳
2
回答
更改URL字符串
中
的
单个值
、
、
我正在学习网络抓取,我正在example.
webscraping
.com上练习。我可以从一个页面中提取我想要
的
信息,但我想知道如何以最简单
的
方式遍历多个页面。然而,即使
创建
一个整数并尝试将其作为字符串输入到URL
中
,该url上有一个计数器,以便在每个完整
的
循环周期后更改url,我也没有任何运气。我意识到这可能不是普遍接受
的
方法,但我不知道除了
创建
字典和尝试之外还有其他方法,但它似乎打开了另一个蠕虫罐头。此外,webloop是一个函数,在该函数
中
浏览 2
提问于2019-11-06
得票数 0
1
回答
Python
请求目录相对于
脚本
目录
、
、
尝试
webscraping
的
第一步,并遵循一个简单
的
教程。我正在运行
的
脚本
位于"C:/
Python
“
中
我正在运行
的
完整代码是 import requests page = requests.get("http://dataquestio.github.io/web-scraping-pages/simple.html") 我收到
错误
消息 File C:\
浏览 14
提问于2020-01-04
得票数 0
回答已采纳
1
回答
ConnectionError: HTTPSConnectionPool(host='www.google.com',port=443):
、
、
、
我想从google.com
中
抓取网页结果。我遵循了这个问题
的
第一个答案,。不幸
的
是,我得到了连接
错误
。我碰巧也查过其他网站,它没有连接。是因为公司
的
代理设置吗?文件"c:\users\appdata\local\programs\
python
\
python
37\
webscraping
\lib\site-packages\requests\api.py",第75行,在get返回请求(‘get’,url,params=params,**
浏览 1
提问于2018-10-29
得票数 0
1
回答
使用BeautifulSoup抓取问题
、
我刚开始使用
python
进行数据抓取,它给了我和
错误
以及idk如何解决它。 single_phone = soup.find('li', class_ = 'Listing').text 这就是
错误
信息使用
python
/olxweb.py进行E:\Softwares\Anaconda\
python
.exe“D:/Cours
浏览 0
提问于2021-06-20
得票数 1
回答已采纳
2
回答
Python
中
退出代码0
的
条件语句
、
当
脚本
成功完成时,有什么方法可以让
Python
打印语句呢?code variable' == 0:else:如何将退出代码
的
值传递给变量我觉得这将是一个很好
的
事情,包括在
脚本
为
其他用户。 谢谢。
浏览 0
提问于2016-02-29
得票数 0
回答已采纳
1
回答
为什么BeautifulSoup和多处理会在列表中产生超出范围
的
索引?
、
、
、
下面是抛出
异常
的
函数: page = requests.get(url) File "/System/Library/Frameworks/
Python
.framework/Versions/2.7/lib/
python
2.7_value In
浏览 7
提问于2018-01-09
得票数 0
1
回答
如何将文件保存到包含“&”等特殊字符
的
路径
中
?(“&”与英文键盘中键入
的
“&”不同)
、
、
我需要将一个文件写入包含R中一个特殊字符
的
特定路径,路径类似于:C:/Users/Technology & Innovation/
Webscraping
files/US_data/data我发现“&”和“&”有细微
的<
浏览 2
提问于2020-11-12
得票数 2
1
回答
为
一个简单
的
python
脚本
获取一个跟踪
错误
来刮取GoodReads.com urls
、
、
这是一个
脚本
,用于获取图书标题列表(BookTitles.txt),搜索站点Goodreads以获得每个标题
的
第一个结果,并将一个URL列表返回给csv文件(GoodReadsBooksNew.csv)我得到
的
错误
如下:追溯(最近一次调用):文件"/home/i
浏览 0
提问于2019-11-24
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券