腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何用python
爬
取数据并保存到excel?
利用python
爬
取豆瓣
电影
排行榜(https://movie.douban.com/chart)的数据并保存到excel中。用相同代码
爬
取网页豆瓣top250的数据可以
爬
取到excel中,但将网址及相关信息改为网页豆瓣
电影
排行榜中的信息时便无法
爬
取,也找不出问题所在。以下图片为完整代码。
浏览 331
提问于2021-01-09
1
回答
快速采矿器不保存爬虫Web结果
、
、
、
我试图从IMDB网站上抓取一个特定
电影
评论的评论。为此,我
使用
爬行网站,我已经嵌入循环,因为有74页。
爬
网网址是:
浏览 2
提问于2016-04-18
得票数 0
回答已采纳
3
回答
无法
使用
css选择器获取python中的数据
、
、
嗨,我想从这个得到
电影
标题url = "https://www.the-numbers.com/market/" + "2019" + "/top-grossing-movies"for i in range(len(movie_list)):我得到响应200,没有问题
爬
其他信息当我打
浏览 4
提问于2020-09-14
得票数 1
回答已采纳
1
回答
如何使搜索引擎不读取.
php
扩展urls
、
、
我如何才能限制搜索引擎不读取我们的.
php
url,因为我们希望我们干净的url出现在搜索引擎中。我
使用
htaccess文件从所有的urls中删除.
php
,但是搜索引擎同时
使用
了这两个urls,即
使用
.
php
和不
使用
.
php
。 我想让搜索引擎只读没有.
php
扩展名的urls。
浏览 7
提问于2015-12-15
得票数 0
4
回答
Scrapy问题
、
、
restrict_xpaths(), tags=('a', 'area'), attrs=('href'), canonicalize=True, unique=True, process_value=None)谢谢你的帮助。
浏览 1
提问于2009-11-28
得票数 9
回答已采纳
1
回答
使用
PHP
更改div内容
、
我正在创建一个
电影
数据库网站。我正在尝试实现的是,当用户点击最新
电影
集合(如图所示)中的一部
电影
时,主
电影
横幅(当前显示“变形金刚”,如图所示)将
使用
PHP
更新并显示所选
电影
的标题和海报。
php
echo $row ["Title"]?
php
echo $rating?
php
echo $runTime?
php
echo $director?
浏览 29
提问于2021-04-22
得票数 0
1
回答
即使网址从seed.txt中删除,网站也会被爬行(Nutch2.1)
、
我尝试检查隐藏的种子文件,但没有找到,并且在我运行
爬
网命令的NUTCH_HOME/ run /local中只有一个文件夹urls/seed.txt。请告诉我可能是什么问题?
浏览 1
提问于2013-04-17
得票数 1
1
回答
Solr 5.0和Nutch 1.10
、
我在windows server 2008 R2上
使用
solr5.0,nutch1.10和cygwin。我发出的命令如下:据我所知,2是爬行的轮数。当我发出这个命令将数据传递给Solr时:然后执行搜索,那么我总共只得到了20个url。
浏览 0
提问于2015-06-03
得票数 0
2
回答
Wordpress自定义帖子类型中的Strage问题?
我有一个博客,我已经添加了一个自定义的帖子类型‘
电影
’。我已经将它链接到我的单人
电影
.
php
。并添加了以下代码: <div id="container"> <a title="<?
php
the_title(); ?>" href=&qu
浏览 2
提问于2011-09-21
得票数 0
2
回答
单击提交按钮时在后台运行
PHP
脚本,无需重新加载页面
我需要运行一个
php
脚本(网站爬虫)上提交按钮点击,而不是页面重新加载。后台脚本运行后,应出现确认/警报弹出窗口,表明站点
爬
网程序已结束。有什么想法吗?
浏览 0
提问于2012-04-17
得票数 0
1
回答
我想进行网络
爬
网,但有些项目已
爬
网,但有些项目未
爬
网。我不知道原因
、
我正在
使用
python中的BeautifulSoup来抓取一个网站。在对addrs、a_earths进行
爬
网时,无法对末尾的points = soup.select('.addr_point')此部分进行
爬
网。我不知道原因(中的红色虚线框)import urllib.parseimport re url = 'http://www.dooinauction.com/auc
浏览 5
提问于2020-02-24
得票数 1
2
回答
.*)之后
使用
([0-9]+)
、
、
.*)-p([0-9]+)$ cat.
php
?n=$1&page=$2 [L] 但问题是,脚本使(.*)之后的所有内容都像一个变量,并且(0-9+) = nothing。
浏览 2
提问于2014-03-24
得票数 0
1
回答
SharePoint 2010 search中的
爬
网程序影响规则和
爬
网规则有何不同?
、
、
SharePoint 2010 search中的
爬
网程序影响规则和
爬
网规则有何不同?
浏览 1
提问于2011-02-13
得票数 4
回答已采纳
2
回答
PHP
搜索引擎重定向到另一个页面
、
、
我有一个个人
电影
数据库网站。我创建了一个搜索引擎,用户可以
使用
一个或多个搜索标准(即
电影
长度、标题、类型、演员等等)。现在,我的搜索引擎名为"search.
php
“,表单指向”sear-go.
php
“。搜索结果列在一个表中。现在,我想验证用户是否选中了搜索-go.
php
中的“随机
电影
”框,如果是这样的话,它将选择一个随机的
电影
ID,然后显示
电影
描述(details.
php
),而不是显示结果表。我不知道我是否
浏览 2
提问于2013-08-08
得票数 0
回答已采纳
4
回答
如何
使用
PHP
/jQuery列出文件夹中的所有文件
、
、
、
上下文$dir = "/images/"; $a = scandir($dir); 数组( => .1 => ..2 =>
电影
1.mkv 3 =>
浏览 0
提问于2019-01-12
得票数 1
1
回答
自定义帖子类型小帮助?
我有添加自定义帖子类型字段名称‘
电影
’。现在我已经做了这些事情,它的工作很好,但问题是,(即当我点击任何
电影
,它只显示我一个
电影
帖子,(即我点击头像
电影
它显示我的头像
电影
帖子,但当我点击星门
电影
它显示我的头像
电影
帖子。
php
the_ID(); ?>" <?
php
post_class(); ?>> <a title="<?
php
浏览 0
提问于2011-09-20
得票数 0
1
回答
怎样在不
使用
API的前提下
爬
取Twitter数据?
、
、
、
、
由于现在Twitter API 数据
爬
取付费,所以我想在不
使用
Twitter API的情况下
使用
python
爬
取到特定关键词的Twitter数据或者Reddit数据,有什么好办法吗?
浏览 467
提问于2024-01-06
1
回答
如何使MOSS 2007我的站点配置文件字段不作为可搜索链接?
、
、
、
、
我有一个MOSS 2007实例,其中我的客户希望我的网站配置文件中的内容不显示为链接。我们如何才能做到这一点?
浏览 1
提问于2009-09-28
得票数 0
2
回答
如何将“短链接”从"href“转换为实际的URL?
、
、
、
、
比方说,我在
爬
一个网页,我把它的所有链接都刮掉了。在python中,如何转换这样的链接:Products.aspx与以下实际链接的链接:https://example.com/Contact.html 我
使用
DuckDuckGo的强大功能在堆栈溢出上到
浏览 1
提问于2019-11-18
得票数 0
回答已采纳
1
回答
重复的标题标签。
谷歌分析公司在我的
php
上显示了29个重复的标题标签。这是一个电子商务网站,我知道重复的标题标签是恼人的蜘蛛
爬
一个网站,我想解决这个问题和流线的问题。
浏览 4
提问于2013-10-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python爬取动态网页-豆瓣电影
如何使用 Python 爬取豆瓣电影 Top250?
使用requests+正则表达式爬取猫眼电影排行
python3爬电影天堂
scrapy爬取豆瓣热门电影
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券