腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
从
维基百科
表
中
抓取
数据
、
、
、
我只是想把
维基百科
表格
中
的
数据
整理成一个熊猫
数据
框。 我需要复制三列:“邮政编码,自治市,邻里”。
浏览 26
提问于2019-02-27
得票数 0
回答已采纳
1
回答
通过R实现
维基百科
上的Sumbit查询
我正在尝试开发一个R脚本,它接受一个字符串,并将其提交到
维基百科
搜索框
中
。在到达该字符串所在的页面之后,R程序应该
从
该页面提取所有的
表
。例如,如果字符串是曼彻斯特联队,R脚本应该在
维基百科
上提交一个查询,该查询将它带到曼彻斯特联队页面,并提取所有
表
并将其转换为
数据
帧。附言:我刚刚开始在R
中
尝试web
抓取
,所以如果有任何帮助,我将不胜感激。
浏览 1
提问于2014-09-04
得票数 0
2
回答
从
维基百科
页面
中
抓取
表
数据
、
我正在学习如何将BeautifulSoup库与Python一起使用,并且为了实践,我试图
从
维基百科
的页面:
中
删除体裁标题。在我的代码
中
,我已经做到了这一点:soup"html.parser") td = table.f
浏览 3
提问于2020-10-13
得票数 1
回答已采纳
1
回答
从
R
中
的
维基百科
抓取
表格
、
、
我想知道是否有人有有用的想法或代码来
从
维基百科
上
抓取
表格。 具体来说,我对
维基百科
上“各县选举结果”部分的总统选举结果
表
很感兴趣。可以使用以下链接找到示例
表
,并向下滚动到“按县列出的结果”部分:https://en.wikipedia.org/wiki/1948_United_States_presidential_election_in_Texas我尝试了以下StackOverflow帖子
中
的一些解决方案:Importing w
浏览 51
提问于2021-06-29
得票数 0
回答已采纳
4
回答
从
多个
表
维基百科
中
抓取
表
、
、
、
我正试着从这个url
中
抓取
表
。那里有五张不同的桌子。但我的目标是第一张
表
。它没有太多的标识,那个
表
只包含这个标识。class="wikitable sortable jquery-tablesorter"My_table = soup.find('table',{'class':'wik
浏览 0
提问于2020-09-11
得票数 2
回答已采纳
6
回答
如何
抓取
整个
维基百科
?
、
、
、
那么,如何
抓取
整个
维基百科
呢?有人能给我一些指导吗?我是否需要专门找到这些URL并放置多个起始URL? 关于使用WebSphinx的API的教程,谁有好的网站的建议?
浏览 1
提问于2010-02-23
得票数 8
回答已采纳
1
回答
从
维基百科
提取个人日期
数据
、
、
、
我试图
从
维基百科
中提取出生和死亡
数据
。我使用过DBpedia和维基
数据
,但在这个特殊的例子
中
,日期与
维基百科
不匹配。为什么会有这种差异?这个日期信息可以通过编程方式
从<
浏览 2
提问于2019-10-21
得票数 2
回答已采纳
1
回答
ImportXML解析错误-使用excel工作
表
抓取
维基百科
、
、
、
、
我正在尝试使用ImportXML公式
从
维基百科
网站收集一些
数据
到excel表格
中
。这是
维基百科
的页面。 这是我
从
浏览器XPath选择器
中
获得的代码。
浏览 12
提问于2019-11-10
得票数 1
回答已采纳
1
回答
如何
从
维基百科
打印表格
我正在尝试
抓取
维基百科
网站作为一个小任务,以了解网络
抓取
。我要
抓取
的链接是:https://en.wikipedia.org/wiki/List_of_countries_by_population_in_2000 我想根据他们的人口在
维基百科
链接
中
列出这些国家的名单我已经签出了HTML标记,该
表
在class = wikitable
中
可用。但是当我运行我的代码时,它正在打印其他
表
的结果,这些<e
浏览 33
提问于2019-09-26
得票数 0
回答已采纳
2
回答
重用Google工作
表
中导入公式
中
的
数据
数组(通过查询语句)
、
我试图从不同但相同的模式
表
中
检索值列表。然而,我正在努力减少ImportHTML调用次数,因为sheets必须使性能达到最佳。我遇到了一些问题:在新的工作
表
中
,其中A1 = =ImportHtml("https://en.wikipedia.org/wiki/List_of_countries_by_population_(Unit
浏览 4
提问于2020-10-07
得票数 0
回答已采纳
1
回答
将大量
维基百科
表
刮到MySQL
数据
库的最佳方法
、
、
、
什么是
抓取
维基百科
主要文章页面中所有HTML表格的最佳编程方法,其中页面标题与某些关键字匹配?然后,我想把列名和
表
数据
放到
数据
库
中
。 还会获取URL和页面名称以进行属性设置。
浏览 8
提问于2013-07-31
得票数 0
3
回答
从
维基百科
抓取
数据
、
、
我研究了一些框架,比如Scrapy,然后我发现有一些网站是专门为
维基百科
服务的,比如。这两种方法
中
的任何一种都有什么特定的优势,或者哪一种更适合将信息加载到在线
数据
库
中
?
浏览 0
提问于2012-09-14
得票数 6
回答已采纳
1
回答
从
各个
维基百科
页面
中
抓取
特定的
表
。
、
、
、
我试图
从
维基百科
(如)
中
为过去两届奥运会中的每一个国家“竞争对手”,并把它变成一个
数据
格式。我可以找到每个国家的URL列表,但是当我开始
抓取
时,我会面临这样的问题:每一页都有一个不同顺序的“竞争对手”
表
(有时是第一个,有时是第二个),再加上我可以找到一个唯一的标题来标识该
表
()。
浏览 2
提问于2022-04-20
得票数 1
1
回答
使用python
从
维基百科
中
刮
表
?
、
、
、
我试着
从
维基百科
的页面上
抓取
表格
数据
:,我试过使用pd.read_html语法,但它不适用于我试图刮的
表
(尼泊尔按地区分列的新冠肺炎确诊病例)。我试着用“美丽汤”和“熊猫”来收集
数据
,但是它不起作用 url = 'https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Nepal'
浏览 0
提问于2020-04-06
得票数 1
回答已采纳
1
回答
我在
数据
清理方面有一些问题
、
、
、
我已经
从
维基百科
页面上
抓取
了一个表格,接下来我将清理
数据
。我已经将
数据
转换为Pandas格式,现在我在清理
数据
时遇到一些问题import requestswebsite_url
中
删除"Not assigned“值: canada=canada.Borough.drop("Not assigned",a
浏览 2
提问于2019-04-08
得票数 0
1
回答
如何使用BeautifulSoup只获取
维基百科
页面上所有
表
的第一行
数据
?
、
、
、
我正在尝试
从
维基百科
页面
中
抓取
数据
。 albumdatasaved = albumdatasaved + "\n" + albumdata[1:] 我只需要每个
表
的第一行
数据
浏览 2
提问于2019-04-08
得票数 0
回答已采纳
3
回答
从
维基百科
检索音乐艺术家
数据
?
当涉及到音乐的流派分类时,我发现
维基百科
比大多数其他
数据
源拥有更多有趣的流派信息。 我似乎记得有一个
数据
库
从
维基百科
上收集了这类信息,并使其更容易访问,但我今天无法谷歌任何东西。如果我尝试检索此
数据
,我有哪些选择?有没有像我描述的那样的东西,或者我需要去一个屏幕
抓取
?
浏览 5
提问于2009-01-19
得票数 8
回答已采纳
1
回答
用php和mysql
从
维基百科
中提取描述和关键词
、
、
、
、
我有一个
从
维基百科
特色文章的所有链接的网页,我提取所有它们的标题,描述和关键字。但我有一个问题,当网络爬虫开始提取文章的内容时,我的
数据
库
中
的字段描述仍然是空的,关键字显示“数组数组”。如何提取
维基百科
文章的描述和关键词?<?
浏览 1
提问于2012-11-27
得票数 0
4
回答
使用XML包将html
表
抓取
到R个
数据
框
中
、
、
、
、
如何使用XML包
抓取
html
表
? 以上的这个
维基百科
页面为例。我想在R
中
读一读,并获得“巴西对国际足联认可球队的所有比赛清单”
表
作为data.frame。我该怎么做呢?
浏览 9
提问于2009-09-08
得票数 159
回答已采纳
2
回答
抓取
器刮不出页面。
、
、
我正在使用Rcrawler提取
维基百科
页面的信息框。我有一个音乐家的名单,我想提取他们的名字,道布,死亡日期,乐器,标签等。然后我想创建一个所有艺术家的
数据
作为行和
数据
存储为列/向量。
浏览 2
提问于2018-07-31
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从安装到数据抓取、存储原来这么简单
如何按照 Excel 中的目录,从多个工作表中查找出完整数据?
解决access多表删除查询中 无法从指定的数据表中删除 的错误提示
Go 爬虫在大规模数据抓取中的性能如何
python中的哈希表数据结构
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券