首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    回家的低价票难抢?注意!可能是被“爬虫”吃了

    不到两个月,2018年春节要来了。 “今年我得早下手,抢张回家的低价机票。”在北京打工的小王对科技日报记者说,由于老家在云南,春节机票太贵,他都选择坐两天两夜的火车回去,长途跋涉,苦不堪言。 然而,就在小王摩拳擦掌,准备使出“洪荒之力”抢张便宜机票时,看到网上曝出这样一则消息:航空公司放出的低价机票,80%以上被票务公司的“爬虫”抢走,普通用户很少能买到。 小王傻眼了,“爬虫”究竟是什么鬼?它又是怎么抢机票的?难道就没有办法治理吗? 借助超链接信息抓取网页 “‘爬虫’技术是实现网页信息采集的关键技术之一,通

    07

    还在用Future轮询获取结果?CompletionService快了解下

    领导一直不给他安排其他开发任务,就一直让他看看代码熟悉业务。二胖每天上班除了偶尔跟坐在隔壁的前端小姐姐聊聊天,就是看看这些枯燥无味的业务代码,无聊的一匹。虽然二胖已是久经职场的老油条了,但是看到同事们的周报都写的满满的,而自己的周报,就一两行,熟悉了什么功能。心里还是慌得一匹,毕竟公司不养闲人啊。于是乎二胖终于鼓起勇气为了向领导表明自己的上进心,主动向领导要开发任务。领导一看这小伙子这么有上进心,于是就到任务看板里面挑了一个业务逻辑比较简单的任务分配给了二胖。二胖拿到这个任务屁颠屁颠的回到座位。任务比较简单,就是通过爬虫去爬取某些卖机票(某猪、某携、某团等)的网站的一些机票,然后保存到数据库。

    03

    还在使用Future轮询获取结果吗?CompletionService快来了解下。

    二胖上次写完参数校验(《二胖写参数校验的坎坷之路》)之后,领导一直不给他安排其他开发任务,就一直让他看看代码熟悉业务。二胖每天上班除了偶尔跟坐在隔壁的前端小姐姐聊聊天,就是看看这些枯燥无味的业务代码,无聊的一匹。虽然二胖已是久经职场的老油条了,但是看到同事们的周报都写的满满的,而自己的周报,就一两行,熟悉了什么功能。心里还是慌得一匹,毕竟公司不养闲人啊。于是乎二胖终于鼓起勇气为了向领导表明自己的上进心,主动向领导要开发任务。领导一看这小伙子这么有上进心,于是就到任务看板里面挑了一个业务逻辑比较简单的任务分配给了二胖。二胖拿到这个任务屁颠屁颠的回到座位。任务比较简单,就是通过爬虫去爬取某些卖机票(某猪、某携、某团等)的网站的一些机票,然后保存到数据库。

    01

    多线程获取结果还在使用Future轮询获取结果吗?CompletionService快来了解下吧。

    二胖上次写完参数校验(《二胖写参数校验的坎坷之路》)之后,领导一直不给他安排其他开发任务,就一直让他看看代码熟悉业务。二胖每天上班除了偶尔跟坐在隔壁的前端小姐姐聊聊天,就是看看这写枯燥无味的业务代码,无聊的一匹。虽然二胖已是久经职场的老油条了,但是看到同事们的周报都写的满满的,而自己的周报,就一两行,熟悉了什么功能。心里还是慌得一匹,毕竟公司不养闲人啊。于是乎二胖终于鼓起勇气为了向领导表明自己的上进心,主动向领导要开发任务。领导一看这小伙子这么有上进心,于是就到任务看板里面挑了一个业务逻辑比较简单的任务分配给了二胖。二胖拿到这个任务屁颠屁颠的回到座位。任务比较简单,就是通过爬虫去爬取某些卖机票(某猪、某携、某团等)的网站的一些机票,然后保存到数据库。

    00

    干货 | 携程机票实时数据处理实践及应用

    作者简介 张振华,携程旅行网机票研发部资深软件工程师,目前主要负责携程机票大数据基础平台的建设、运维、迭代,以及基于此的实时和非实时应用解决方案研发。 携程机票实时数据种类繁多,体量可观,主要包括携程机票用户访问、搜索、下单等行为日志数据;各种服务调用与被调用产生的请求响应数据;机票服务从外部系统(如GDS)获取的机票产品及实时状态数据等等。这些实时数据可以精确反映用户与系统交互时每个服务模块的状态,完整刻画用户浏览操作轨迹,对生产问题排查、异常侦测、用户行为分析等方面至关重要。 回到数据本身,当我们处理数

    05

    如何运用Python的AI爬虫技术,采集比天眼查更完整的数据?我的经验分享

    用Python的AI爬虫技术,采集到比天眼查更完整和更及时的数据,提高python的挖掘性能,其实天眼查、查查查这些网站的数据还是具有延迟性,很多数据还是不够完整,而且很多数据源都是通国各种网站数据采集整合过来的,最近在研究Python的多进程和多线程AI智能引擎技术实现一个全网数据挖掘和分析的引擎,搜索引擎技术就是能够扫描全网,然后收录一些有用的价值,像百度搜索引擎、google搜索引擎,他们就是采用爬虫技术,对全网进行24小时的扫描,然后把各种网站的数据进行采集做快照,基于这种搜索引擎技术,我们如果要爬取比天眼查、查查查更完整的数据,只要在我们搜索引擎里面植入我们自己的代理IP池技术,采用python的多进程技术进对目标网站进行分任务,每个进程负责一个目标网站,然后采用python的多线程技术,每个来负责翻页爬取,每个线程负责10页的翻页,然后再启动守护进程24小时进行全网扫描。欢迎交流(qq:1742396457),下面是我自己写的代码,结果效率和爬取得到的数据结果还是超出满意:

    03

    安全报告 | 2018上半年互联网恶意爬虫分析:从全景视角看爬虫与反爬虫

    导语: 互联网最激烈的对抗战场,除了安全专家与黑客之间,大概就是爬虫与反爬虫领域了。据统计,爬虫流量早已超过了人类真实访问请求流量。互联网充斥着形形色色的爬虫,云上、传统行业都有不同规模的用户被爬虫爱好者盯上,这些爬虫从哪里来?爬取了谁的数据?数据将被用于何处? 近日,腾讯云发布2018上半年安全专题系列研究报告,该系列报告围绕云上用户最常遭遇的安全威胁展开,用数据统计揭露攻击现状,通过溯源还原攻击者手法,让企业用户与其他用户在应对攻击时有迹可循,并为其提供可靠的安全指南。本篇报告中,云鼎实验室通过部署的

    04

    腾讯安全发布民航业信息安全解决方案,解决航空公司这四大痛点

    近年来,云计算、大数据、人工智能等新技术不断进步,并与民航技术结合实现融合发展。国际民航的信息化、协同化、智能化已成趋势。同时,民航系统信息安全建设的重要性也日益凸显。 5与8日至9日,第二届民航网络安全与信息化发展趋势高峰会在成都召开。航空公司、机场集团、空管、各大机场和航空公司的相关职能部门、所属企业、高等院校、科研机构以及信息技术提供商等相关企事业单位代表和业内专家学者等汇聚一堂,共同探讨民航网络安全信息化建设,完善网络安全和信息化管理机制,提高重要网络和信息系统的安全保障水平。 腾讯安全云鼎实验室

    05
    领券