首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【开放源代码】微博搜索用户爬虫

    保证阅读体验,文中广告已关闭~ 超级方便微博用户信息爬虫 是根据微博用户 Uid 来抓取公开用户微博信息,但是很多时候,我们可能只知道这个用户微博名字,并不知道 Uid,本次开放爬虫就是完成从微博用户名到...Uid 转换。...该爬虫抓取接口是 https://s.weibo.com/user,需要该接口下最好是已登录 cookie。...headers=headers, params=params) return parseResponse(response) 拿到 response 后稍微解析一下就能拿到 Uid,如果出错或者没有搜索到...最后依旧是微博话题爬虫日常更新,修复了群里朋友提出若干问题,提升了稳定性。可以去 2021 新版微博话题爬虫发布 获取最新微博话题爬虫。

    1.1K20

    PHP源代码分析-字符串搜索系列函数实现详解

    今天和同事在讨论关键字过虑算法实现,前几天刚看过布隆过滤算法,于是就想起我们公司内部查找关键字程序,好奇是怎么实现。...于是查找了一下源代码,原来可以简单地用stripos函数查找, stripos原型如下: int stripos ( string haystack, string needle [, int 一般地都会建一个关键词库...于是查找了一下PHP源代码关于这个函数实现,如果想知道一个函数在PHP哪个模块的话可以简单写一个函数get_module. php <?...if (p == NULL) {             return NULL;         }         p++;     }     return NULL; } 查到这里就能看到实现搜索原理了...不过这个搜索只是简单地调用了memchr和memcmp函数,至于memcmp用了什么算法比较两个字符串就不太清楚,我们知道在一个长度为n字符串里面查找字符串为m字符串,那么最坏 时间复杂度是O(

    1.8K20

    solr_架构案例【京东站内搜索】(附程序源代码)

    注意事项:首先要保证部署solr服务Tomcat容器和检索solr服务中数据Tomcat容器,它们端口号不能发生冲突,否则web程序是不可能运行起来。...一:solr服务端口号、我这里solr服务tomcat容器端口号已经修改为8083: ? 二:检索solr服务中数据tomcat容器端口号、我这里是8080: ?...需求:使用Solr实现电商网站中商品信息搜索功能,可以根据关键字搜索商品信息,根据商品分类、价格过滤搜索结果,也可以根据价格进行排序,实现分页。 界面如下: ? 1、架构分析: ?...自己开发应用: Controller层作用:获取搜索条件,并响应搜索结果到前台页面。...Service层作用:接收Controller传递过来参数,根据参数拼装一个查询条件,调用dao层方法,查询商品数据;接收返回商品列表和商品总数量,根据每页显示商品数量计算总页数。

    1.3K70

    Facebook搜索向量搜索

    概述 不管是搜索系统还是推荐系统中,向量召回都是一个不可或缺一个部分,担负着重要作用。...传统搜索以文本匹配为主,通过query中词(如果是中文,需要首先对query进行分词)检索所有的候选doc,如果doc中出现了query中词,则表示命中,最后返回所有命中doc。...Facebook将向量召回应用在社交网络搜索中,针对其场景特殊性,提出将用户上下文环境考虑进query向量中。...特征工程 在FaceBook向量搜索中,基于其特定场景,使用到特征包括query和document文本特征、位置特征、社交Embedding特征。 文本特征。...在文本特征中使用是字符n元组,这样,相比词n元组,得到模型效果更好。 位置特征。在本地广告、小组或事件搜索场景中,位置匹配是很重要。query侧增加搜索城市,地区,国家和语言。

    2.5K50

    源代码寿命

    软件考古 在已经存在很多年并且已经有自己一系列源码运作公司里,编写软件就像是类似软件学考古一种磨练,深入研究应用就像在挖掘一个古老城市,逐层揭开过去种种面纱。...我们一直在学习:更好理解领域,更好理解领域解决方案,新架构方式,新工具,新方法,新标准以及新思路。...你会去修改你十多年前写代码吗?或者花时间去分析其中需要修改部分?或者干脆每次都新建一个新小模块来解决?这些修改代价是很昂贵。...而现在问题是:偿还这种“技术债”是正确事,但是修改以前代码一般都会比你上周写或者上个月写东西慢。如果以前代码应该修改地方你没有及时去修改,这将影响你开发新功能。...我对大量源代码做过调查,其中包括商业以及开源,设计各种语言(Java,C#,Ruby)。总体上,这些代码都遵循一个相似的规则: 大约70%代码,在你写后12个月内一直在使用,没有发生修改。

    1.3K10

    视觉搜索是移动搜索未来?

    在《展望3B大战之后搜索变数》一文中,我曾分析过移动搜索与传统搜索不同——搜索诉求从获取信息变为更加本地化、生活化实体搜索搜索方式从WEB网页变为APP;输入方式也因为使用场景移动性、移动设备特征和网络环境而发生了巨大变化...移动设备摄像头已是标配,视觉搜索极具想象空间,Google Glass就被认为是一个基于视觉搜索可穿戴设备。 什么是视觉搜索? 视觉搜索最简单说法就是“以图搜图”。...不过,上面说图像识别技术还只是一种一对一匹配技术,远远还没发展到搜索程度,如同雅虎时代“网址索引”阶段,而视觉搜索则到了Google和百度为代表第二代搜索阶段。...我们世界不可能会充满二维码,它天生是给机器读。而视觉搜索呢?人眼所见即所得。只要人类能看到,它都可以帮你进行抓取并搜索。 未来视觉搜索是什么样呢?...摄像头是移动互联网时代入口,就像PC时代搜索框一样。这是Google和百度等搜索巨头都对视觉搜索投入大量资源原因——流量入口是搜索引擎生命之源。

    1.7K40

    【分享】精简Linux源代码

    作者:付汉杰 Linux是现在最流行操作系统,含有大量源代码。Xilinx 2020.1使用Linux 5.4,含有大约67430个文件。大部分文件没有被使用到。...分析Linux源代码代码实现时,经常查找函数或者数据结构定义。如果分析所有文件,既消耗软件查找时间;也会找到多个定义,增加理解代码难度。...如果我们知道Linux编译流程起始时间,那么删除所有访问时间比Linux编译起始时间早文件,就能达到精简Linux源代码目的。在编译Linux之前,可以通过touch命令创建一个文件。...这个文件atime,就是编译Linux开始时间。因此比较这个文件,和其它Linux文件,就能找到所有访问时间比Linux编译起始时间早文件,从而实现精简Linux源代码。...再恢复对应文件,既精简了Linux源代码,也不影响Linux编译流程。对Linux 5.4进行精简后,剩余大约8800个文件,减少了大约58000个文件,精简了超过87%文件数量。

    2.7K20

    如何有效阅读源代码

    无论是JDK中常用类源码,还是常用框架源码,都是经过开发者深思熟虑、不断完善才形成,所以想要理解当时作者设计意图和思想不是很轻松。...读源码守则第一条,切勿急躁,因为急也没用,要就是慢功夫细读;第二条,切勿贪多,刚开始不要太在意细节,因为你可能会陷入细节中,若此时遇到更加难懂细节,不仅会挫败你兴趣和信息,还很耽误时间,不要急着把所有细节都弄都很明白...Spring框架源码,可以以BeanFactory bf= new XmlBeanFactory(new ClassPathResource("applicationContext.xml"))为入口,深入源代码中阅读主干路实现原理...这一段阅读过程会看到很多实现细节,比如XML验证、解析等,可以先不要深入研究具体实现细节,知道大体实现即可,这样可以快速掌握整体结构,等整体骨骼结构弄明白了,再回过头来细细研究具体细节实现。...阅读过程中,可以编写一些单元测试,然后通过断点调试验证细节、跟踪线索,同时可以配合看一些书籍,这样可以提高阅读源码速度和效率。

    93560

    源代码管理SVN使用

    SVN 全称是Subversion,集中式版本控制之王者 SVN 版本控制,需要自己搭建一个管理代码服务器,提供开发人员,上传和下载 1.基本介绍 使用环境 要想利用SVN管理源代码,必须得有2套环境...服务器 用于存储客户端上传源代码 可以在Windows上安装Visual SVN Server 大部分情况下,公司开发人员不必亲自搭建SVN服务器 客户端 上传本地源代码到服务器,或者更新服务器代码到本地...查看日志:svn log ⑨.添加 提交一个新建文件到服务器,需要2个步骤 添加新建文件到本地版本控制库中:svn add 提交刚才添加操作到服务器:svn commit 如果直接提交一个没有添加到本地版本控制库中文件...: 再次展⽰示所有的选项 c.选择postpone查看⽂文件中代码 在冲突文件中有冲突展示 >>>>>> .r16 在代码中修改后保存文件...再删除多余文件 d.解决冲突之后命名:svn resolved ⽂文件名 4.总结 去到公司第一天,下载公司代码到电脑上 svn checkout 修改了某个早已存在旧文件,然后提交到服务器

    2K70

    搜索引擎高级搜索方法

    普通搜索可以满足基本需求,特殊搜索一直都是网站SEO必修课。 介绍下搜索方法高级搜索方法,之前在某平台看到过,没太在意,如今再次被人提起,就整理下。...1.site: site是最常用搜索指令,它是用来搜索某个域名下所有文件(注意:文件须是搜索引擎收录文件)。 2.双引号 把搜索词放在双引号,代表完全匹配搜索。...搜索结果返回页面包含双引号中出现所有词,连顺序也必须完全匹配。百度和谷歌都支持这个指令。 3.减号 减号(-)代表搜索不包含减号后面的词页面。...8.alltitle: 该标签返回结果是页面标题中包含多组关键词文件,如:alltitle:SEO搜索引擎优化就相当于intitle:SEO intitle:搜索引擎优化返回是标题中既包含"SEO..."也包含"搜索引擎优化"页面。

    1.7K10

    有开源代码文献

    https://blog.csdn.net/zhangjunhit/article/details/53261053 有意思文献合集 Image Stitching 代码 车道检测相关资源列表...https://github.com/amusi/awesome-lane-detection 相机标定开源代码 目标检测开源代码汇总 跟踪算法开源代码汇总 人脸检测识别代码汇总 人群分析、人群计数...开源代码文献及数据库 语义分割+视频分割 开源代码文献集合 网络优化加速开源代码汇总 OCR 资源汇总 字符区域检测:https://github.com/eragonruan/text-detection-ctpn...Two-stream ConvNets http://yjxiong.me/others/action_recog/ https://github.com/yjxiong/caffe 基于单张RGB图像...Feature Correspondence CVPR2017 c++ code: https://github.com/JiawangBian/GMS-Feature-Matcher 基于语义视频快进

    1.1K40

    IntelliJ 搜索和全局搜索怎么用

    要在 IntelliJ 中进行搜索,我们最常想到就是 Ctrl + F。 其实这个快捷键在 IntelliJ 中是在当前打开文本中进行搜索,如果我们希望进行全局搜索应该怎么用呢?...如果你尝试搜索文字时候,你可能会发现,如果你需要内容在代码里面,这个搜索没有任何显示结果。 你只需要注意: 双击 Shift 搜索界面只会搜索名字。这个名字包括有文件名,操作名字等。...如果你有字符串在文件内,这个搜索是搜不到。但是非常好用是,你可以用这个搜索搜索 IntelliJ 快捷键。...例如,你可以输入 push 然后搜索, 你可以看到界面中会显示 push 快捷键。 Ctrl + Shift + F 这个就是我们常用全文搜索了。...你可以对搜索内容有些过滤,比如说只搜索特定文件扩展名等。 这个就是全文搜索了。 请注意不要和双击 Shift 混淆了,搜索内容不一样。

    2K50

    软著源代码要求多少页_怎么查看源代码编码格式

    大家好,又见面了,我是你们朋友全栈君 申请软件著作权登记时候会被要求提交60页源代码。...为了帮助开发者朋友一次性顺利通过软件著作权登记审查,下面为大家分享下自己总结60页源代码整理攻略。...第一步:请点击下载 软件著作权登记源代码模板; 第二步:将打算申请软著软件名称及版本号替换模板里左上角“自助登记安卓版应用软件V1.0”; 第三步:打开软件代码文件,复制代码; 第四步:回到本文档...,“Ctal+A”全选本文档内容; 第五步:点击鼠标右键,选择“只粘贴文本”方式粘贴所复制代码; 第六步:按照上述方式粘贴大致80页左右源代码; 第七步:删除代码中作者及版权信息,删除方式:通过...代码修改完毕即60页整、每页50行源代码。若软件所有的代码加起来都不足60页则需要提供所有的源代码,此种形式第一页代码最好是登陆/开始对应代码,最后一页代码最好是退出/结束对应代码。

    2K20
    领券