首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AWStats简介

    安装 [url]http://sourceforge.net/projects/awstats/[/url] 下载安装包后: GNU/Linux:tar zxf awstats-version.tgz awstats的脚本和静态文件缺省都在wwwroot目录下:将cgi-bin目录下的文件都部署到 cgi-bin/目录下:/home/apache/cgi-bin/awstats/ mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats 把图标等文件目录复制到WEB的HTML文件发布目录下,例如:/home/apache/htdocs/ 下发布 更多的批量更新脚本等在tools 目录下,可以一并放到cgi-bin/awstats/ 目录下 升级国内主要 搜索引擎和蜘蛛定义,安装GeoIP的应用库:C [url]http://www.maxmind.com/download/geoip/api/c/[/url] 解包,编译安装 perl -MCPAN -e ‘install “Geo::IP”‘ 或者使用纯Perl包 perl -MCPAN -e ‘install “Geo::IP::PurePerl”‘ 下载GeoIP/GeoIPCityLite包:解包并部署到awstats目录下:

    03

    如何运用Python的AI爬虫技术,采集比天眼查更完整的数据?我的经验分享

    用Python的AI爬虫技术,采集到比天眼查更完整和更及时的数据,提高python的挖掘性能,其实天眼查、查查查这些网站的数据还是具有延迟性,很多数据还是不够完整,而且很多数据源都是通国各种网站数据采集整合过来的,最近在研究Python的多进程和多线程AI智能引擎技术实现一个全网数据挖掘和分析的引擎,搜索引擎技术就是能够扫描全网,然后收录一些有用的价值,像百度搜索引擎、google搜索引擎,他们就是采用爬虫技术,对全网进行24小时的扫描,然后把各种网站的数据进行采集做快照,基于这种搜索引擎技术,我们如果要爬取比天眼查、查查查更完整的数据,只要在我们搜索引擎里面植入我们自己的代理IP池技术,采用python的多进程技术进对目标网站进行分任务,每个进程负责一个目标网站,然后采用python的多线程技术,每个来负责翻页爬取,每个线程负责10页的翻页,然后再启动守护进程24小时进行全网扫描。欢迎交流(qq:1742396457),下面是我自己写的代码,结果效率和爬取得到的数据结果还是超出满意:

    03

    PL/SQL 集合的方法

    PL/SQL中提供了常用的三种集合联合数组、嵌套表、变长数组,而对于这几个集合类型中元素的操作,PL/SQL提供了相应的函数或过程来操 纵数组中的元素或下标。这些函数或过程称为集合方法。一个集合方法就是一个内置于集合中并且能够操作集合的函数或过程,可以通过点标志 来调用。本文主要描述如何操作这些方法。 一、集合类型提供的方法与调用方式 1、集合的方法与调用方式     EXISTS         函数EXISTS(n)在第n个元素存在的情况下会返回TRUE,否则返回FALSE。             通常使用EXISTS和DELETE来维护嵌套表。其中EXISTS还可以防止引用不存在的元素,避免发生异常。         当下标越界时,EXISTS会返回FALSE,而不是抛出SUBSCRIPT_OUTSIDE_LIMIT异常。     COUNT         COUNT能够返回集合所包含的元素个数,对于大小不确定的情形则COUNT非常有用。         可以在任何可以使用整数表达式的地方使用COUNT函数,如作为for循环的上限。         计算元素个数时,被删除的元素不会被count所统计。         对于变长数组来说,COUNT值与LAST值恒等。         对于嵌套表来说,正常情况下COUNT值会和LAST值相等。但是,当我们从嵌套表中间删除一个元素,COUNT值就会比LAST值小。     LIMIT         用于检测集合的最大容量         由于嵌套表和关联数组都没有上界限制,所以LIMIT总会返回NULL。         对于变长数组,LIMIT会返回它所能容纳元素的个数最大值,该值是在变长数组声明时指定的,并可用TRIM和EXTEND方法调整。     FIRST,LAST         FIRST和LAST会返回集合中第一个和最后一个元素在集合中的下标索引值。         对于使用VARCHAR2类型作为键的关联数组来说,会分别返回最低和最高的键值;键值的高低顺序是基于字符串中字符的二进制值。         但是,如果初始化参数NLS_COMP被设置成ANSI的话,键值的高低顺序就受初始化参数NLS_SORT所影响了。         空集合的FIRST和LAST方法总是返回NULL。只有一个元素的集合,FIRST和LAST会返回相同的索引值。         对于变长数组,FIRST恒等于1,LAST恒等于COUNT。         对于嵌套表,FIRST通常返回1,如果删除第一个元素,则FIRST的值大于1,如果删除中间的一个元素,此时LAST就会比COUNT大。         在遍历元素时,FIRST和LAST都会忽略被删除的元素。     PRIOR,NEXT,         PRIOR(n)会返回集合中索引为n的元素的前驱索引值;NEXT(n)会返回集合中索引为n的元素的后继索引值。         如果n没有前驱或后继,PRIOR(n)或NEXT(n)就会返回NULL。         对于使用VARCHAR2作为键的关联数组来说,它们会分别返回最低和最高的键值;键值的高低顺序是基于字符串中字符的二进制值。         PRIOR和NEXT不会从集合的一端到达集合的另一端,即最末尾元素的的next不会指向集合中的first。         在遍历元素时,PRIOR和NEXT都会忽略被删除的元素,即如果prior(3)之前的2被删除则指向1,如果1也被删除则返回null。     EXTEND         用于扩大嵌套表或变长数组的容量,该方法不能用于联合数组。         EXTEND有三种形式             EXTEND 在集合末端添加一个空元素             EXTEND(n) 在集合末端添加n个空元素             EXTEND(n,i) 把第i个元素拷贝n份,并添加到集合的末端         对嵌套表或变长数组添加了NOT NULL约束之后,不能使用EXTEND的前两种形式。         EXTEND操作的是集合内部大小,其中也包括被删除的元素。所以,在计算元素个数的时候,EXTEND也会把被删除的元素考虑在内。         对于使用DELETE方法操作的元素,PL/SQL会保留其占位符,后续可以重新利用。     TRIM         从集合的末尾删除一个(TRIM)或指定数量TRIM(n)的元素,PL/SQL对TRIM掉的元素不再保留占位符。         如果n值过大的话,TRIM(n)就会抛出SUBSCRIPT_BEYOND_COUNT异常。         通常,不要同时使用TRIM和DELETE方法。可把嵌套

    03

    使用 DBMS_REPAIR 修复坏块

    对于Oracle数据块物理损坏的情形,在我们有备份的情况下可以直接使用备份来恢复。对于通过备份恢复,Oracel为我们提供了很多种方式,冷备,基于用户管理方式,RMAN方式等等。对于这几种方式我们需要实现基于数据库以及文件级别的恢复。RMAN同时也提供了基于块介质方式的恢复。也就是说我们根本不需要还原数据文件,而是直接从备份文件基于块来提取以实现联机恢复。可参考基于RMAN实现坏块介质恢复(blockrecover) 。这是比较理想的情形。如果没有任何备份怎么办?我们可以使用Oracle自带的DBMS_REPAIR包来实现修复。注意,不要被文章题目有所误导。这里的修复是有损修复也就是说将受损的数据块标记为坏块,不对其进行访问而已。就好比我们磁盘有坏道,找个磁盘修复工具将坏道标出来不使用,同理。那受损的数据岂不是无力回天啦,呜呜......要记得随时备份阿。。

    02

    扫码

    添加站长 进交流群

    领取专属 10元无门槛券

    手把手带您无忧上云

    扫码加入开发者社群

    相关资讯

    热门标签

    活动推荐

      运营活动

      活动名称
      广告关闭
      领券