首页
学习
活动
专区
圈层
工具
发布

维基百科 MediaWiki API 解析

使用开放的 API 做一个自己的小项目,是一个很好的学习方法。但好像开放的 API 选择并不多。这里给大家多一个选择,简单介绍一下维基百科使用的 MediaWiki API。...Wikipedia 我们常说的维基百科,一般是指 Wikipedia,它是基于 MediaWiki 的一个网络百科全书。 但要理解的是,除了 Wikipedia,还有很多别的 Wiki 站点。...文档 在了解到维基百科的 API 是开放的之后,我就找到了官方的 API 文档,但以我目前的水平,这个文档几乎完全看不懂。...希望本文可以让你对 MediaWiki 的内容获取有一个大概的了解,让你能用它做出自己的项目。 本文所有内容都来自以下官方文档,如果能看懂,就不用再往下看啦。...MediaWiki API 的一点皮毛而已,但我还是花了些时间才总结出来的。

4.6K10

搭建属于你自己的维基站点:MediaWiki

MediaWiki 是一个全球著名的开源的,运行于 PHP+MySQL 环境下的 wiki 程序 。例如,全球最大的 wiki 项目 维基百科,就是使用 MediaWiki 运营的成功范例。...更多关于 MediaWiki 的介绍,我们可以 在这里找到 。 服务器配置 搭建 LAMP 环境后,我们还需要安装一些额外的 PHP 5 模块 。以下 4 个模块的安装,都是可自主选择是否安装的。...设置 MediaWiki 下面我们将来设置 MediaWiki,以便它可以被正常使用 。打开浏览器访问 Droplet 的主页:http://你的服务器 IP 。...接着,将进入 MySQL 的设置页面 。对于数据库类型我们选择 MySQL(或兼容)。 数据库主机,我们填写 localhost,数据库名称,用户名和密码,请使用之前你所设置的信息 ,表前缀可以为空。...*参考来源 n0,FB小编 secist 编译,转载请注明来自 FreeBuf

3.5K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    MediaWiki 是一个免费开源的维基软件

    参考资料 Matomo(原名 Piwik)是一个开源的网站分析平台 Composer 是 PHP 的依赖管理工具 能否用Docker替代虚拟化?...Hello-World 是一个最简单的 Docker 镜像 PHP是一种开源的服务器端脚本语言 MongoDB 是一个开源的 NoSQL 数据库 Monica 是一款开源的个人关系管理(PRM)工具 Hitch...是一个高性能的HTTP代理服务器 MediaWiki 简介 MediaWiki 是一个免费开源的维基软件,由维基媒体基金会开发,最初用于维基百科。...特点 开源免费 支持多语言 完善的版本控制 强大的扩展系统 丰富的API接口 良好的可扩展性 支持多种数据库 最新更新内容及时间 截至2023年10月: 最新稳定版...官网地址 https://www.mediawiki.org 文档地址 官方文档:https://www.mediawiki.org/wiki/Documentation 用户手册:https:

    68410

    【玩转腾讯云】七.基于CVM快速搭建部署属于自己的维基百科

    简介 MediaWiki是全球最著名的开源wiki程序,运行于PHP+MySQL环境。MediaWiki从2002年2月25日被作为维基百科全书的系统软件,并有大量其他应用实例。...MediaWiki的开发得到维基媒体基金会的支持。 MediaWiki是建立wiki网站的首选后台程序,国内的灰狐维客等站点都采用这套系统。...轻松部署Node.js 【玩转腾讯云】五.手把手教你用VNC搭建Ubuntu可视化界面(一) 【玩转腾讯云】六.3分钟打造个人专属云盘,速度吊打某云盘 【玩转腾讯云】七.基于CVM快速搭建部署属于自己的维基百科...安装配置mediawiki知识库 5.1 访问安装页面 我们通过浏览器访问进入到mediawiki知识库的安装向导中,访问地址的构成为“您的域名+mediawiki-1.34.1/" 如下图进入到安装页面...管理——安装扩展——fileinfo中,点击安装 image.png 在提示中,咨询我们是否要安装fileinfo,我们点击确定,安装fileinfo扩展 image.png 5.2 进入配置向导 我们返回配置向导的浏览器

    4.7K1516

    从互联网爬虫、自动驾驶到对话机器人,什么是Semantic(语义)?

    Semantic Mediawiki Mediawiki就是Wikipedia所使用的wiki程序的名字。由PHP开发,2002年启动,2003年命名。...Semantic MW是Mediawiki的一个插件,也就是给MW增加了语义。 那么它做了什么呢,维基百科的一个作用其实是总结知识,而总结来的知识更好的用途是可以查询。...例如你可以维基百科查询中国有多少人口,美国有多少人口,只要分别在中国、美国的页面看就有。那么如果你想知道人口超过1000万的国家都有哪些?只下的呢?2000万呢?...当然你也可以自己或者请人专门去收集、总结这些内容,但是一个明显更好的做法是,假设维基百科是可查询的,我只需要像SQL语句一样“SELECT NAME FROM WIKI WHERE POPULATION...首先我们看我们在对话过程中有什么上下文吧(简单版本,复杂的可能还包括更多轮次的信息、槽值实体等): 上一句机器人(我,即假设我是机器人)表达了什么意图(第一轮可以为空) 当前用户表达了什么意图(第一轮可以为空

    1.3K10

    钱塘干货 | 数据收集和处理工具一览

    InvestigateIX: 用于搜索加密外部设备 Recoll: 适用于Linux系统的桌面搜索引擎 Fuzzy search with lists:清单搜索、模糊搜索 搜素数据库和API 如果你想编程...LibreOffice Calc:开源表格程序 Document cloud:文档管理系统,管理纸质文件扫描版本或者PDF 格式文件 Semantic MediaWiki: MediaWiki(著名开源引擎...,可用于构建企业/个人知识库,维基百科就是使用MediaWiki的成功范例)的免费开源扩展,可供用户存储、调用数据 Drupal CMS:内容管理模块,可以让你快速便捷地以用户界面创制自己的内容格式、数据字段和表格...如果你觉得不够,我们还推荐: Wikipedia list of open source text mining software:维基百科上整合的开源文本挖掘软件列表 ?...API,也能完成数据分析 ?

    3K70

    维基百科中的数据科学:手把手教你用Python读懂全球最大百科全书

    解析XML 解决第一个问题——定位文章,我们使用SAX(Simple API for XML) 语法解析器。...解析维基百科文章 维基百科运行在一个叫做MediaWiki的软件上,该软件用来构建wiki。这使文章遵循一种标准格式,这种格式可以轻易地用编程方式访问其中的信息。...为了有效地获取这些信息,我们引进了强大的 mwparserfromhell, 一个为处理MediaWiki内容而构建的库。...幸运的是,答案是肯定的——使用MediaWiki templates。 文章模板 模板(templates)是记录信息的标准方法。...如果函数找到了我们想要的文章,它会从文章中提取信息,然后返回给handler。首先,我将展示更新后的endElement 。

    2K30

    命令行上的数据科学第二版 三、获取数据

    866k 0 --:--:-- --:--:-- --:--:-- 891k … with 1760 more lines ➊ 记住,trim只是用来让输出很好地适应终端 如你所见,curl下载维基百科的服务器返回的原始...例如,指定一个包含来自 R 的标准数据集的 SQLite 数据库,我可以从表mtcars中选择所有行,并按mpg列对它们进行排序,如下所示: $ sql2csv --db 'sqlite:///r-datasets.db...Web API 并不意味着要以漂亮的布局呈现,比如网站。相反,大多数 Web API 以结构化格式返回数据,比如 JSON 或 XML。...3.7.2 流式 API 一些 Web API 以流的方式返回数据。这意味着一旦你连接到它,数据将继续涌入,直到连接被关闭。..." | > sample -s 10 > wikimedia-stream-sample 这个特定的 API 返回对 Wikipedia 和 Wikimedia 的其他属性所做的所有更改。

    2.9K40

    rust 开发编译 Android 动态库实践

    在学习 rust 的时候也可以照着这些语言特性去对比自己是否掌握了。 那么 rust 到底强大在哪里?在 Kotlin 刚出的时候宣传的点就是空安全 ,弥补 Java 在这方面的不足。...而 rust 可以说对比的是 C++,弥补 C++ 在空指针和野指针(悬垂指针)方面的不足,当然 rust 的优势还不足如此。...以下是来自维基百科的介绍,有些特性我暂时还没体验过,先摘录一波: Rust 是由 Mozilla 主导开发的通用、编译型编程语言。。...(j_recipient).unwrap().as_ptr() 21 ) 22 ); 23 // 返回一个新的字符串 24 let output = env.new_string...recipient.to_str().unwrap()).unwrap(); 25 output.into_inner() 26} 抛开 rust 具体语法不看,代码内容也很简单,传一个字符串,返回一个新的字符串

    3.9K10

    90%的开发者都忽略的文本向量化技巧!

    # 返回样式如: [[2]], 取出其中的数字需要使用[0][0] token_index = t.texts_to_sequences([token])[0][0] - 1 zero_list...执行过程若给定训练语料仅一句话:Hope can set you free(愿你自由成长),窗口大小为3,因此模型的第一个训练样本来自Hope can set。...执行过程Hope can set you free,窗口大小为3,因此模型的第一个训练样本来自Hope can set,因skipgram模式,所以将用can作输入 ,Hope和set作输出。...4 使用fasttext训练和使用word2vec4.1 第一步: 获取训练数据将研究英语维基百科的部分网页信息,大小约300M。可通过Matt Mahoney的网站下载。..." xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.3/ http://www.mediawiki.org/xml/export-0.3

    43500

    Java开发人员必备工具之 10 个大数据工具和框架

    先来看看大数据的概念。根据维基百科,大数据是庞大或复杂的数据集的广义术语,因此传统的数据处理程序不足以支持如此庞大的体量。 在许多情况下,使用SQL数据库存储/检索数据都是很好的选择。...Redis是一个开源的使用ANSI C语言编写的、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。...8、Solr ——开源企业搜索平台,用Java编写,来自Apache Lucene项目。 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。...用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。...Memcached是一套分布式快取系统,当初是Danga Interactive为了LiveJournal所发展的,但被许多软件(如MediaWiki)所使用。

    1.2K30

    给 Java 开发者的 10 个大数据工具和框架

    当今IT开发人员面对的最大挑战就是复杂性,硬件越来越复杂,OS越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂。...根据维基百科,大数据是庞大或复杂的数据集的广义术语,因此传统的数据处理程序不足以支持如此庞大的体量。 在许多情况下,使用SQL数据库存储/检索数据都是很好的选择。...8、Solr ——开源企业搜索平台,用Java编写,来自Apache Lucene项目。 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。...用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。...Memcached是一套分布式快取系统,当初是Danga Interactive为了LiveJournal所发展的,但被许多软件(如MediaWiki)所使用。

    1.3K40

    给 Java开发者的10个大数据工具和框架

    越来越复杂,编程语言和API越来越复杂,我们构建的应用也越来越复杂。...根据维基百科,大数据是庞大或复杂的数据集的广义术语,因此传统的数据处理程序不足以支持如此庞大的体量。 在许多情况下,使用SQL数据库存储/检索数据都是很好的选择。...8、Solr ——开源企业搜索平台,用Java编写,来自Apache Lucene项目。 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。...用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。...Memcached是一套分布式快取系统,当初是Danga Interactive为了LiveJournal所发展的,但被许多软件(如MediaWiki)所使用。

    1.4K110

    Web Hacking 101 中文版 十八、内存(一)

    这里是来自 Apple 的一个图片: 这里第一个例子展示了可能的缓冲区溢出。...这里是来自维基百科的图片: 虽然缓冲区溢出需要更详细的分析,读取越界和 Heartbleed 超出了本书的范围。...如果你对它们感兴趣,这里是一些不错的资源: Apple 的文档 维基百科:缓冲区溢出词条 维基百科:NOP 垫 OWASP:缓冲区溢出 heartbleed.com 内存截断 内存截断是一种技巧,用于通过使代码执行一些不常见或者非预期的行为...这对于管理自己的内存的低级语言是有问题的。 现在,对于 Web 应用,当 Web 应用和库、外部 API 以及其它用 C 写成的东西交互的时候,这就有关系了。...但是,如果你刚起步,可能你需要花费一些时间,来寻找和漏洞相关的简单注入,在更有经验时,再返回到缓冲区溢出。

    78820

    2025年知识管理系统推荐:9款融合AI能力的智能知识库全面对比

    本文将对比分析 9 款具有代表性的知识管理产品,包括腾讯乐享知识库、Worktile、GitBook、MediaWiki、Bookstack、幕布、坚果云、Evernote、SharePoint 等,通过多维度横向评测...AI能够自动识别文档中的关键概念和实体,生成结构化的知识问答对,建立知识点之间的关联关系,实现知识的自动分类和标签化。 ...提供美观的文档展示界面和强大的搜索功能。 技术优势 支持代码高亮、API文档生成等开发者友好的功能。具备良好的文档组织和导航能力。 应用场景 特别适合技术团队、开源项目文档管理和API文档编写。...局限性:主要面向技术用户,对非技术用户的友好性有限。 四、MediaWiki:开源维基系统 MediaWiki是维基百科使用的开源维基软件,适合构建大型的知识库和百科系统。 ...技术团队:可选择GitBook(适合技术文档)或MediaWiki(适合大型知识库)。 项目协作团队:推荐Worktile,能够将知识管理与项目管理有机结合。

    1.4K10

    ubuntu14.04下安装ngnix,mediawiki,nodebb,everything,gitlab

    本周折腾了以下几个东西,mediawiki(维基),nodebb(论坛),gitlab(私有git服务器)。 本来的目的是搭建一个wiki,选用了mediawiki后,使用apache搭建好了。...10、解决php-fpm与nginx的小bug 按上述步骤操作后,由于nginx与php-fpm之间的一个小bug,会导致这样的现象: 网站中的静态页面 *.html 都能正常访问,而 *.php 文件虽然会返回...简而言之,原因是nginx无法正确的将 *.php 文件的地址传递给php-fpm去解析, 相当于php-fpm接受到了请求,但这请求却指向一个不存在的文件,于是返回空结果。...不成问题, 但它在向php-fpm传递php文件路径时,会形成:/www//test/script.php 这样的文件地址无效(获取不到正确的php文件),于是出现返回空白的问题。...文件夹的权限,比如简单粗暴改成777 chmod -R 777 /www/mediawiki 然后就可以正常使用mediawiki了。

    2.6K10

    【NLP自然语言处理】文本张量表示方法

    # 返回样式如: [[2]], 取出其中的数字需要使用[0][0] token_index = t.texts_to_sequences([token])[0][0] - 1...CBOW模式下的word2vec过程说明: 假设我们给定的训练语料只有一句话: Hope can set you free (愿你自由成长),窗口大小为3,因此模型的第一个训练样本来自Hope can...数据来源:http://mattmahoney.net/dc/enwik9.zip 在这里, 我们将研究英语维基百科的部分网页信息, 它的大小在300M左右。...data/enwik9 # 原始数据将输出很多包含XML/HTML格式的内容, 这些内容并不是我们需要的 mediawiki xmlns="http://www.mediawiki.org/xml...学习了CBOW模式下的word2vec过程说明: 假设我们给定的训练语料只有一句话: Hope can set you free (愿你自由成长),窗口大小为3,因此模型的第一个训练样本来自Hope

    41410
    领券