Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python简单爬取58同城

Python简单爬取58同城

作者头像
kenvie
发布于 2022-01-20 08:34:35
发布于 2022-01-20 08:34:35
1.2K00
代码可运行
举报
文章被收录于专栏:kenviekenvie
运行总次数:0
代码可运行

爬取网站为:https://jn.58.com/chuzu/?PGTID=0d100000-0010-997a-6ba0-3b2a61df3202&ClickID=2

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import requests
from lxml import etree

url = 'https://jn.58.com/chuzu/?PGTID=0d100000-0010-997a-6ba0-3b2a61df3202&ClickID=2'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
# print(response.text)
html = etree.HTML(response.text)  # 将结果存储到html中
data_title = html.xpath('//div[@class="des"]/h2/a/text()')  # 标题
data_money = html.xpath('//div[@class="money"]/b/text()')  # 价钱

for data_t in data_title:  # 标题
    print(str(data_t).strip())

运行结果:

版权属于:kenvie

本文链接:https://cloud.tencent.com/developer/article/1937751

商业转载请联系作者获得授权,非商业转载请注明出处。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021 年 11 月,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python简单爬取永劫无间官方网站公开插画
import requests import os from lxml import etree url = 'https://www.yjwujian.cn/media/#/pic' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36' } response = re
kenvie
2022/01/20
1.3K0
Python简单爬取永劫无间官方网站公开插画
Python爬取某壁纸网站的壁纸
import requests from lxml import etree import os url = 'http://simpledesktops.com/browse/' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36' } r = requests.ge
kenvie
2022/01/20
1.3K0
Python爬取某壁纸网站的壁纸
爬取58同城二手手机
在开始编写代码前需要将Python3.7安装并配置于环境变量中(windows一般安装python环境后会自动添加进环境变量),以及使用pip命令安装上面提到的3个python库,这些都准备好以后开始使用PyCharm或者Sublime Text 3编写代码,这里我习惯于使用PyCharm编写python代码。 进入58同城的二手手机页面https://gy.58.com/shouji/ ,使用浏览器的开发者工具(直接按F12键即可)寻找页面规律。爬去58同城二手手机的数据。 使用shift+ctrl+c选
暖月寒星
2020/03/12
7130
Python解析百度贴吧,去掉代码注释
爬取百度贴吧的时候遇到的问题就是爬下来有数据的代码都被注释掉了,python获取不到,所以要把代码注释取消掉
kenvie
2022/01/20
8290
Python解析百度贴吧,去掉代码注释
Python爬取小说并写入word文档
目标网站就是我们知名的笔趣阁:https://www.biquzw.la/,知名的搬运网站,受众很大,书源也是海量的,主要是没限制的话,好爬!
MinChess
2023/03/08
9980
Python爬取小说并写入word文档
Python爬取电影天堂
摘取部分网友的回复: 1、之前在北京买房,谁想房价开始疯长,链家的房价等数据分析只给了一小部分,远远不能满足自己的需求。于是晚上花了几个小时的时间写了个爬虫,爬下了北京所有的小区信息及北京所有小区的所有历史成交记录。
Dwyane
2018/12/04
8750
Python爬取电影天堂
Python爬虫—批量爬取图片
写一个简单地爬取图片的代码吧,以便下次用的时候直接调用0.0 这里选择图库 中国作为抓取页面。
SakuraTears
2022/01/13
9210
Python爬虫—批量爬取图片
用Python爬取自主品牌汽车,看看国产汽车究竟长什么样?(下)
上一篇的推文讲了三家自主品牌车企,上汽、长安、吉利。接下来讲讲剩下的七家,东风、北汽、长城、一汽、广汽、江淮。
小F
2020/10/09
5700
用Python爬取自主品牌汽车,看看国产汽车究竟长什么样?(下)
Python将Post返回的数据进行简单解析
import requests import json url = 'https://www.vivo.com/store/shops' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36' } From_data = { "province": "山东省",
kenvie
2022/01/20
3.4K0
【爬虫】爬取菜鸟教程Python前100个例题
import requests from lxml import etree base_url = 'https://www.runoob.com/python/python-exercise-example%s.html' def get_element(url): headers = { 'cookie': '__gads=Test; Hm_lvt_3eec0b7da6548cf07db3bc477ea905ee=1573454862,1573470948,15734786
天道Vax的时间宝藏
2021/08/11
8950
Python爬取百度知道数据进行解析、存库
在百度知道搜索板蓝根,爬取前75页,并存入数据库 import requests from lxml import etree import pymysql from fake_useragent i
kenvie
2022/01/20
1K0
Python简单Post例子
import requests import json url = 'https://www.vivo.com/store/shops' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36' } From_data = { "province": "山东
kenvie
2022/01/20
9750
【爬虫】爬取扇贝网单词书
# By Vax # At time - 2020/12/27 21:59 # linked from import json import requests from lxml import e
天道Vax的时间宝藏
2021/08/11
7540
Python的Xpath介绍和语法详解
XPath是一门在XML和HTML文档中查找信息的语言,可以用来在XML和HTML文档中对元素和属性进行遍历
Lansonli
2021/10/09
4.3K0
Python爬虫基础
爬虫基础简介 http协议 概念: 服务器和客户端进行数据交互的一种形式 user-Agent: 请求载体的身份表示 Connection : 请求完毕后,是断开连接还是保持连接 Content-Type : 服务器相应客户端的数据类型 # user-Agent ( NetWork-All-Headers ) Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638
shaoshaossm
2022/12/26
4590
【爬虫】爬取酷狗音乐榜单热搜榜前100名歌曲歌手名称加歌单
# By Vax # At time - 2021/1/3 15:40 # linked from import json, requests from lxml import etree class KuDog(object): def __init__(self): self.base_url = 'https://www.kugou.com/yy/singer/index/%s-%s-1.html' self.headers = { '
天道Vax的时间宝藏
2021/08/11
9190
Python简单解析英雄联盟英雄列表
接口地址:https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js?ts=2727979 接口来自官方网站,如失效自行抓包 i
kenvie
2022/01/20
9880
Python简单解析英雄联盟英雄列表
根据话题爬取微博与评论
思路阐述 微博获取 weibo.com获取微博url、用户名称以及微博内容等信息 进一步根据用户名称在weibo.com中进行用户url获取 根据构建的用户url在weibo.cn中爬取微博发布者的信息 微博评论获取 根据上面获取的微博标识,构建weibo.cn中对应微博的地址 根据正则表达式获取评论内容 完整代码 # -*- coding: utf-8 -*- # @Time : 2021/12/8 10:20 # @Author : MinChess # @File : weibo.py # @So
MinChess
2022/12/26
5480
初学者的20个爬虫经典案例视频_李昌钰水门事件20集大经典案例
链接:aHR0cHM6Ly9iai5mYW5nLmxpYW5qaWEuY29tL2xvdXBhbi8=
全栈程序员站长
2022/11/07
1.2K0
初学者的20个爬虫经典案例视频_李昌钰水门事件20集大经典案例
Python 爬取豆瓣电影当前上映电影信息
爬取当前时间段豆瓣电影中正在上映的电影的相关信息,如电影名、导演、演员表、上映时间、制作方等信息,然后再通过字典的方式,将其保存在本地文件当中,以便我们查询;
村雨遥
2022/06/15
8110
Python 爬取豆瓣电影当前上映电影信息
相关推荐
Python简单爬取永劫无间官方网站公开插画
更多 >
领券
一站式MCP教程库,解锁AI应用新玩法
涵盖代码开发、场景应用、自动测试全流程,助你从零构建专属AI助手
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档