R中的WebScraping动态页

文章/答案/技术大牛

发布

2回答

、

链接看起来像这样：url %>% html_nodes(".article-title当你向下滚动时，网站会加载更多的结果，但我想我至少会得到第一个结果。下面给出了一些链接，链接28:32看起来很有希望，但我认为它们是来自侧边栏的链接，而不是来自文章的

浏览 1提问于2017-08-09得票数 0

回答已采纳

1回答

csv - python抓取的多个读数

、、

我有下面的代码： from instaloader import Instaloader, Profile profile = Profile.from_username(L.context, PROFILE) print(profile.followers) 我想通过csv传递多个用户，脚本将为每个用户运行。谢谢。

浏览 18提问于2021-01-16得票数 0

1回答

在python中通过Beautifulsoup抓取和下载修改了名称的Pdf文件

、、、

pentagon-papers" folder_location = r'E:\webscraping' response = requests.get，但作为他们的描述。例如，我希望表中的第三个文件名

浏览 10提问于2021-05-19得票数 0

回答已采纳

2回答

关键字参数与变量冲突

、、、

我的代码是用来废弃洋葱网站的，尽管我能够连接到TOR和web刮刀作为独立的工具，但是当我尝试组合这两个代码块时，我一直在代码中的关键字参数方面出现了许多错误，甚至试图删除它会给我带来错误，我对我应该做的事情有些迷茫:\Users\admin\Desktop\WebScraping",) TypeError:不能混合str和non参数试图取代project_folder=<

浏览 5提问于2022-02-07得票数 0

1回答

我正在做一个研究州发行的市政债券的项目，但我在获取数据时遇到了麻烦。使用XML包和下面的代码，我能够获得其中的一些内容。当我像以前一样尝试同样的方法时，我最终得到了 nys="http://emma.msrb.org/SecurityView/SecurityDetailsTrades.aspx?&C页面时，它是标准的。使用htmlParse(nys)后，输出与T&C页面的页面源代码相同，而不是数据实际所在的页面。因此，当

浏览 3提问于2012-09-30得票数 3

回答已采纳

1回答

如何将文件保存到包含“&”等特殊字符的路径中？(“&”与英文键盘中键入的“&”不同)

、、

我需要将一个文件写入包含R中一个特殊字符的特定路径，路径类似于：C:/Users/Technology ＆ Innovation/Webscraping files/US_data/data我发现“&”和“&”

浏览 2提问于2020-11-12得票数 2

1回答

Python抓取: soup.select的问题

、

我正在开发一个python脚本，用于从特定站点( )中刮取数据这次我使用soup.select方法，类名为W(100%) M(0)，我的代码如下所示：import pandas as pdtable = soup.select(table:has(-soup-contains("W(100%) M(0)")))这并

浏览 4提问于2022-09-13得票数 0

2回答

有没有办法使用selenium从网页中与打开的外部应用程序警报进行交互？

、、、、

我尝试使用driver.switch_to.window(driver.window_handles[1])切换具有弹出窗口的选项卡，并关闭第一个选项卡，但都不起作用这是我尝试接受弹出窗口driver.switch_to_alert().accept()的代码

浏览 0提问于2020-06-01得票数 0

2回答

需要在Python Need驱动程序中复制CMS页面的源代码

、、

我刚接触过Selenium2.53.6和Chrome，所以我可能忽略了一些非常简单的东西。我需要在Python3.3.6Webriver中复制CMS页面的源代码。我试过page_source，它没有做我需要做的事情。但是，我可以在webdriver中打开页面，它正在显示源代码，但我无法选择内容并将其复制到剪贴板上。perform() ActionChains(driver).key_down(Keys.COMMAND).send_keys('c').key_up(Keys.COMMAND).perfor

浏览 0提问于2016-09-15得票数 0

2回答

将大字符串输出转换为字典

、、、

我有一个类似于这样的函数，当给出一个url时，它会在who.is上查找域： w = whois.whois(url)因此，只要看一下它，我就能看到布局是用来把它变成字典的，但我不知道如何用尽可能有效的方式来实现它。我需要删除不想要的文本底部，并删除所有的换行符和缩进。单独做并不是很有效率。我希望能够将任何url传递给函数，并有一个可以使用的字典。任何帮助都会很感激的。Registrant type':

浏览 2提问于2017-05-10得票数 0

回答已采纳

2回答

如何在matploitlib中呈现尼泊尔文文本

、、

如何在x和ylabels中显示单词("आन्तरिक")。matplotlib.pyplot import figure y = [10,9,8,7,6] plt.plot(x

浏览 20提问于2020-10-10得票数 0

4回答

Python web抓取，获取FileNotFound错误

、

我最近已经让这段代码正常工作了，但现在得到了以下错误： Traceback (most recent call last): 文件"/home/l/gDrive/AudioBookReviews/WebScraping/GoodreadsScraper.py"，第3行，在重新加载(Sys)NameError中:未定义名称'reload‘ 代码如下：https://pastebin.com/Y5NQiVEp

浏览 47提问于2019-09-01得票数 2

回答已采纳

1回答

在r标记中修剪打印命令的空白

、

当我用命令print(df[[i]])打印数据帧的字符变量时，character在行间显示不需要的空格。我想要的输出将保留换行符，但在行之间没有空格，类似如下所示。我只需使用R中的print(df[[i]])命令就可以获得它，但无法在R中获得它UPDATE:，问题似乎是，在中间的latex文件中，有时会进行标记

浏览 0提问于2018-04-30得票数 0

1回答

它总是告诉我用法，而不是创建正确的文件。

、、

正如您所看到的，我使用了正确的命令，它不断地告诉我用法，而不是为我创建正确的文件。(WebScraping) G:\>pipreqs G:\PY CODE\WebScraping pipreqs [options] [<path>]Traceback (most recent call last): File "D:\anaconda\envs\<

浏览 8提问于2022-06-20得票数 -1

1回答

需要输入的R中的Webscraping

、、

我以前曾使用R中的rvest包来刮取唯一的URL。编辑：，我已经研究过了，似乎RSelenium可以处理这样的任务。不幸的是，我没有接触过它。

浏览 4提问于2022-01-30得票数 1

1回答

ConnectionError: HTTPSConnectionPool(host='www.google.com'，port=443)：

、、、

我想从google.com中抓取网页结果。我遵循了这个问题的第一个答案，。不幸的是，我得到了连接错误。我碰巧也查过其他网站，它没有连接。是因为公司的代理设置吗？请注意，我正在使用虚拟env "Webscraping“。q=StackOverflow").text url = result.geturlparse(url

浏览 1提问于2018-10-29得票数 0

1回答

如何使用scrapy获取嵌套文本值

、、

下面是提取的div代码，我需要从中获取输出，尝试通常的提取不起作用 <div class="container-hauptinfo

浏览 4提问于2020-05-10得票数 0

2回答

pyqt4:循环主渲染类？

、、、

我有一个PyQt4类，可以下载用于报废目的的网页。当我在实例化时将url列表传递给Render类时(单次调用)，但是当我尝试用多个url列表循环r= Render(url，cb=scrape)时，在第一个循环之后，执行将停止或挂起，而不会引发任何错误。我想单独循环类，因为urls列表属于不同的类别，并且必须存储单独提取的内容。我被这个问题困扰了一段时间。',

浏览 0提问于2016-01-05得票数 2

回答已采纳

1回答

从url下载和保存图像时被拒绝权限的错误

我正在努力使网页刮刀，下载图片从搜索的关键字。代码完全正常工作，直到它必须从提取的URL下载该图像import requestsimport urllib params = {"q": search} r = requests.get("http://wwww.bing.com/images(&q

浏览 0提问于2019-08-20得票数 0

回答已采纳

1回答

webkitbrowser注入javascript修改输入文本值时出错

、、、、

我在使用Python2.7中的WebkitBrower从网页获取输入文本的值时遇到了问题。下面是示例代码： user_agent='Mozilla/5.0 (compatible; MSIE 9.0; TOB 6.11; Windows NT 6.1; WOW64;

浏览 2提问于2015-01-01得票数 1

回答已采纳

点击加载更多