首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >爬虫--下载视频

爬虫--下载视频

作者头像
简单、
发布于 2018-07-18 07:06:09
发布于 2018-07-18 07:06:09
70900
代码可运行
举报
运行总次数:0
代码可运行
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
#-*-coding:utf-8-*-

from bs4 import BeautifulSoup

from urllib import urlretrieve

import requests

import re


def getVideo(page):
    
    res = requests.get('http://www.budejie.com/video/%s' %page)

    soup = BeautifulSoup(res.text,'lxml')

    reg = r'data-mp4="(.*?)"'  #获取属性值(视频)的正则表达式

    for i in re.findall(reg,res.text):
"""
findall函数返回的总是正则表达式在字符串中所有匹配结果的列表,
此处主要讨论列表中“结果”的展现方式,即findall中返回列表中每个元素包含的信息。
"""

        name = i.split("/")[-1]

        print "downloading.......:%s" %name

        urlretrieve(i,"MP4/%s" %name)

for i in range(1,12):

    getVideo(i)

Tags: None

Archives QR Code

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
爬虫实例十四:爬取王者荣耀英雄的背景故事
首先,进入王者荣耀官网:https://pvp.qq.com/ 按照以下步骤打开一个新的页面,得到第一个目标网址。
远方的星
2021/07/25
9330
爬虫实例十四:爬取王者荣耀英雄的背景故事
python爬虫:爬取网站视频
python爬取百思不得姐网站视频:http://www.budejie.com/video/
py3study
2020/01/11
3.5K0
python爬虫实例
参考: https://beautifulsoup.readthedocs.io/zh_CN/v4.4.0/#find-all
cuijianzhe
2022/06/14
6170
python爬虫实例
Python爬虫系列(一)初期学习爬虫的拾遗与总结(11.4更)
---- 最近,为了提取裁判文书网的有关信息,自己迈入Python的学习之路,写了快两周的代码,自己写这篇文章总结下踩过的坑,还有遇到一些好的资料和博客等总结下(站在巨人肩膀上,减少重复工作),以便自己后期复习和参考和、分享给大家交流学习,也欢迎大家补充些精彩内容。 一、环境搭建和工具准备 1、为了省去时间投入学习,推荐直接安装集成环境 Anaconda 2、IDE:Pycharm、Pydev 3、工具:Jupyter Notebook(安装完Anaconda会有的) 二、Python基础视频教程
致Great
2018/04/11
1.4K0
Python爬虫系列(一)初期学习爬虫的拾遗与总结(11.4更)
图解爬虫,用几个最简单的例子带你入门Python爬虫
爬虫一直是Python的一大应用场景,差不多每门语言都可以写爬虫,但是程序员们却独爱Python。之所以偏爱Python就是因为她简洁的语法,我们使用Python可以很简单的写出一个爬虫程序。本篇博客将以Python语言,用几个非常简单的例子带大家入门Python爬虫。
ZackSock
2020/12/08
8350
图解爬虫,用几个最简单的例子带你入门Python爬虫
python爬虫爬取《斗破苍穹》小说(入门必备)
小菌之前分享过几篇关于python爬虫的实战经典案例,相信许多没有学过python的小伙伴们肯定都按奈不住纷纷自学去了,哈哈O(∩_∩)O本次小菌带来的同样是适合入门级爬虫爱好者的一个基础案例——爬取《斗破苍穹》全文内容~
大数据梦想家
2021/01/27
1.4K0
python爬虫爬取《斗破苍穹》小说(入门必备)
python 数据抓取三种方法
*利用之前构建的下载网页函数,获取目标网页的html,我们以https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/为例,获取html。
程序员小新
2021/12/31
7690
Python网络爬虫入门篇
学习者需要预先掌握Python的数字类型、字符串类型、分支、循环、函数、列表类型、字典类型、文件和第三方库使用等概念和编程方法。
用户1679793
2019/03/22
2.1K0
Python网络爬虫入门篇
四种Python爬虫常用的定位元素方法对比,你偏爱哪一款?
我们以获取第一页 20 本书的书名为例。先确定网站没有设置反爬措施,是否能直接返回待解析的内容:
CDA数据分析师
2021/03/09
2.8K0
四种Python爬虫常用的定位元素方法对比,你偏爱哪一款?
用python带你爬取小视频,看完“身体一天不如一天”
另外,关于python编程学习,小编给大家提供一个学习交流裙,欢迎到访:六一 一,五三零,一零一
诸葛青云
2019/06/27
7490
用python带你爬取小视频,看完“身体一天不如一天”
python爬虫爬网站的视频和图片
centos6.5 python2.6.6   http://www.budejie.com/( 纯属测试,并无恶意 )
py3study
2020/01/07
6020
Python爬虫抓取网站模板的完整版实现
下面分享下抓去网站模板的完整版实现,亲测可用。(注:仅限个人爱好者研究使用,不要用于其他非法用途。)
杨永贞
2022/10/04
1.7K0
Python爬虫抓取网站模板的完整版实现
实战讲解四种不同爬虫解析数据方法,必须掌握!
爬虫解析数据有很多种,爬取不同的数据,返回的数据类型不一样,有html、json、xml、文本(字符串)等多种格式!
Python研究者
2021/05/13
4990
实战讲解四种不同爬虫解析数据方法,必须掌握!
python战反爬虫:爬取猫眼电影数据 (一)
python战反爬虫:爬取猫眼电影数据 (二)(https://blog.csdn.net/Sui_da_xia/article/details/106051519 )
数字积木
2021/04/15
1.4K0
python爬取考研网的信息
https://yz.chsi.com.cn/zsml/queryAction.do
我被狗咬了
2019/09/23
9880
python爬取考研网的信息
Python爬虫入门知识!
Python现在非常火,语法简单而且功能强大,很多同学都想学Python!所以小的给各位看官们准备了高价值Python学习视频教程及相关电子版书籍,欢迎前来领取!
python学习教程
2019/07/10
5730
Python爬虫入门知识!
【Python爬虫】120行代码爬取豆瓣电影,附源码
学习爬虫,拿豆瓣电影进行练手,无奈豆瓣电影存在反爬机制,爬完250就会重定向要求我进行登陆操作,所以我这一次只爬取前50进行相关测试,废话不多说,我们来看下源代码:
python学习教程
2019/07/10
4.8K0
项目实战 | Python爬虫概述与实践(二)
《项目实战 | python爬虫概述及实践(一)》中介绍了网络爬虫的定义、分类和基本流程。
用户3946442
2022/04/11
9050
项目实战 | Python爬虫概述与实践(二)
Python 学习入门(6)—— 网页爬虫
Python抓取网页方法,任务是批量下载网站上的文件。对于一个刚刚入门python的人来说,在很多细节上都有需要注意的地方,以下就分享一下在初学python过程中遇到的问题及解决方法。
阳光岛主
2019/02/19
2.2K0
Python 学习入门(6)—— 网页爬虫
python实现简单的网络爬虫,仅限无反扒的网站
pc安装python-3.7.3(64位操作系统).exe,使其电脑具备编译python代码的环境。
菜菜有点菜
2024/06/07
2720
python实现简单的网络爬虫,仅限无反扒的网站
相关推荐
爬虫实例十四:爬取王者荣耀英雄的背景故事
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档