腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何处理UUIDS?
、
、
、
过程是这样
的
。我有一组数据,其中包括网址,公司名称和一些其他有关公司
的
信息
。我读取这些数据,获取URL,抓取它们,并用随机
生成
的
UUID保存抓取
的
数据。UUID uuid = UUID.randomUUID(); 这对于第一轮爬行来说是很好
的
。问题是当我想重新抓取数据
的
时候。我将有一组新
的
数据-which可能是重复
的
-因此将
生成
一个新
的
UUID和一个新
的
记录。但这
浏览 1
提问于2017-09-21
得票数 0
1
回答
如何用python
爬
取
数据并保存到excel?
利用python
爬
取
豆瓣电影排行榜(https://movie.douban.com/chart)
的
数据并保存到excel中。用相同代码
爬
取
网页豆瓣top250
的
数据可以
爬
取到excel中,但将网址及相关
信息
改为网页豆瓣电影排行榜中
的
信息
时便无法
爬
取
,也找不出问题所在。以下图片为完整代码。
浏览 340
提问于2021-01-09
1
回答
如何使用Apache Nutch抓取
ajax
网站?
我想
爬
这个网站:使用Apache。该网页
动态
加载
ajax
内容。如果我用默认配置爬行它,Nutch只会带来头和页脚,
动态
加载
的
内容就会丢失。我用
的
是Nutch 1.14。
浏览 0
提问于2018-06-08
得票数 0
回答已采纳
2
回答
Clojure网站到html和javascript?
、
问题是:有没有一种方法可以将一个用clojure编写
的
网站编译成HTML和Javascript文件,而不需要服务器上
的
.WAR文件?谢谢。
浏览 3
提问于2013-02-14
得票数 2
2
回答
Google
的
爬虫会索引异步加载
的
元素吗?
、
、
、
s.parentNode.insertBefore(ns, s); </script></html> 有没有办法通知谷歌
的
爬虫在页面完全加载
浏览 1
提问于2011-10-04
得票数 5
2
回答
大神有没有研究过美团
的
_token
生成
方法?
、
、
如题,我最近在做一个数据分析,想要用到美团
的
美食
信息
,于是就想用python
爬
取
美团
的
数据,但是在构造爬虫
的
时候发现美团有一个_token参数,百思不得其解,还请大神指教
浏览 2259
提问于2018-09-12
1
回答
如何让Python
的
机械化POST
ajax
请求?
、
我正在尝试爬行
的
网站使用
的
是javascript:在
ajax
上拉入我需要
爬
取
的
额外
信息
。我尝试了各种不同
的
排列: r = mechanize.urlopen("https://site.tld/dir/" + url, urllib.urlencode({'none' : 'n
浏览 2
提问于2010-07-12
得票数 6
回答已采纳
1
回答
关于正则表达式
的
问题?
、
、
、
、
图片哪位大神可以教教我应该怎么改正则表达式才可以匹配我想要
的
数据
浏览 120
提问于2023-09-27
1
回答
转换浏览器cookies并在cURL
爬
网中使用
、
、
首先,这样做
的
目的是
爬
取
我们
的
一个登录应用程序,并获取有关作业运行
的
数据,而我可能无法通过任何其他方式获取这些数据。我可以通过浏览器登录,也可以检查我
的
cookie;那么我如何(及时地)将这些
信息
添加到cURL调用中,以便我可以使用PHP来解析返回页面(和链接)?
浏览 3
提问于2015-11-18
得票数 0
2
回答
如何查看我
的
网站上所有可公开访问
的
链接/页面的列表?
、
、
我想在我
的
网站上看到所有公开访问链接
的
列表,这样我就知道用户可以访问哪些页面。是否有网站或应用程序可以抓取我
的
网站并显示此类
信息
?
浏览 1
提问于2011-12-04
得票数 0
1
回答
IE 8
的
问题
我
的
网站在mozila上工作正常,但当我们转到IE 8时,它在状态栏上显示错误User Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows
浏览 0
提问于2011-04-04
得票数 0
1
回答
如何避免
爬
取
CGI
生成
的
日历网页
、
网页由CGI程序
生成
。大多数网页
的
URL都包含诸如?id=2323&title=foo之类
的
表达式。然而,我面临
的
一个问题是,这个网站有一个日历。也会
生成
一些类似日期
的
网页。这意味着纳奇将试图抓取一些无害
的
网页,如year=2030&month=12。如何在Nutch中避免这样
的
陷阱?编写很多正则表达式?
浏览 1
提问于2012-01-27
得票数 0
回答已采纳
0
回答
java怎样
爬
取
js
动态
请求
的
数据?
、
、
image.png
动态
加载
的
数据获取不到(cd.fangfaxian.com)
浏览 229
提问于2020-04-28
2
回答
内容框中
的
其他菜单
、
很抱歉,如果我
的
问题已经在某个地方得到了解释,但我不知道如何实际调用它/定义我
的
搜索问题。 我正在“绘制”在html5中
的
主页,它工作得很好。我
的
菜单在顶部,它可以在页面上导航我(就像index.html#abc一样)。在其中一个内容框中,我希望在框中有一个额外
的
菜单。我想根据我在那里选择/点击
的
内容来加载内容。我在考虑在php中加入内容,但我没有使用html5和php
的
经验,所以我甚至不知道这是否可行。抱歉
的
!
浏览 0
提问于2016-06-17
得票数 0
1
回答
如何在htacces中将/page.php?1重命名为/welcome.html?
、
、
、
我有一个cms,不能
生成
友好
的
url这是最好
的
方法吗? 任何帮助都将不胜感激
浏览 2
提问于2010-12-02
得票数 0
回答已采纳
1
回答
是否在导航到另一个页面时保持网站url不变?
、
、
我希望我
的
站点地址栏在我转到子页面时不要更改它
的
地址,它应该显示我
的
index.html,即使我进入子页面。
浏览 1
提问于2011-03-07
得票数 2
回答已采纳
1
回答
平面HTML页面的搜索索引
、
、
、
、
我希望添加搜索功能到一个现有的完全静态
的
网站。很可能,新
的
搜索功能本身需要是
动态
的
,因为搜索索引需要定期更新(当人们对静态内容进行更改时),并且当用户与其交互时,需要
动态
生成
搜索结果。我希望使用Python添加这个功能,因为Python是我
的
首选语言,尽管我对此持开放态度。 在这种情况下,Google Web Search API将不起作用,因为索引
的
内容位于私有网络上。一个名为mnoGoSearch
的
工具可能是一个选择,因为我认为它
浏览 2
提问于2013-01-29
得票数 1
回答已采纳
1
回答
由
ajax
jquery
生成
的
爬
网html
、
、
我想抓取一个网站页面,然后将一些
信息
保存到我
的
计算机上,但是一些网站内容是由
ajax
生成
的
。 我
的
问题是,我可以抓取一个包含
ajax
生成
内容
的
站点吗?
浏览 1
提问于2012-02-14
得票数 1
回答已采纳
1
回答
使用Apify抓取多个页面
、
可以使用带有伪URL
的
Apify抓取多个页面吗? 当人们问同样
的
问题时,答案大多指向伪URL,如果有可能或不可能这样做,并不会直接解决问题。如果我在运行爬虫
的
时候不知道伪URL,并且我从一个页面上抓取了10个链接-然后想要抓取这10个链接,那怎么做呢?
浏览 15
提问于2019-03-19
得票数 0
2
回答
从
ajax
调用访问js
生成
的
内容。
、
我正在使用
ajax
加载一个页面 //
ajax
content在主页上,我包含了具有全局样式表和javascript库
的
头文件我有相同
的
包含文件在第2页,我正在通过
ajax
加载。我
的
JS在2ns页面中
动态
生成
html标记,我
的
问题是当我将第二个页面加载到我
的
主页中时,全局JS并没有应用于第二个页面。 所以现在我
的</
浏览 2
提问于2011-04-03
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
分析动态Ajax 爬取今日头条街拍美图
python+Chrome爬取动态异步生成的页面内容
分析Ajax爬取B站python视频
用python爬取优酷会员,模拟ajax请求!
Python爬虫:动态爬取QQ说说并生成词云,分析朋友状况
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券