抓到一条超过60英寸和小于50英寸的鱼是不可能的,因为这个条件是矛盾的。一条鱼的长度不可能同时大于60英寸和小于50英寸。所以,抓到这样一条鱼的概率是0。
在半小时内,一条狮子鱼能消灭掉 20 条其它鱼类。当 iRobot 的创始人 Colin Angle 到百慕大时,他首次了解到这个问题。现在,他试图以技术方法解决它。...他说,‘你是造机器人的,为什么不制造一个机器人,解决这里的狮子鱼问题呢?’” Angle 对 Fastcompany 网站说,“我没有无视这个问题,而是说,’好,那能管用么?’” ?...它嵌入水中,击昏狮子鱼,并将其收到身体里。捕捉足够数量的狮子鱼后,Guardian 浮出水面。然后,这些鱼被销售到各个餐馆。 “人们对狮子鱼的需求是存在的。...如果你能抓到它们,有人会付钱给你,” Angle 说,“挑战在于,人们很难进入到深层水域。那是狮子鱼生存繁衍的主要区域。...由于机器人可远程控制,游戏化也是一个不错的方向。“当你坐在办公室里,想做些好事,你可以在 iPad 上捕捉狮子鱼。” Angle 说。 在 Angle 看来,捕鱼机器人只是公司迈出的第一步。
比如字符串girl和girlfriend,二者所拥有的公共子串数量显然与girl和其自身所拥有的公共子串数量相等,但是我们并不能据此认为girl和girlfriend是两个等同的匹配 为了解决该问题,有学者提出以非重复的...其基本思想是“降低已出现N-Gram条件概率分布,以使未出现的N-Gram条件概率分布非零,且经数据平滑后一定保证概率和为1,详细如下: 1.Add-one (Laplace) Smoothing 加一平滑法...举个例子,假设你在钓鱼,然后抓了18条鱼,种类如下:10 carp, 3 perch, 2 whitefish, 1 trout, 1 salmon, 1 eel,那么 下一条鱼是trout的概率是多少...很简单,我们认为是1/18 下一条鱼是新品种的概率是多少?不考虑其他,那么概率是0,然而根据Things seen once来估计新事物,概率是3/18 下一条鱼是trout的概率是多少?...{N} $$ 对于这个例子,$c^*(trout)=2*\frac{1}{3}=\frac{2}{3}$,$P_{GT}(trout)=\frac{2/3}{18}=\frac{1}{27}$,因此下一条鱼是
题目2两个玩家,轮流说2-30里的数。如果玩家说了的数和之前的被说的数有公因数,玩家输。你会当玩家1(先说)还是玩家 2(后说)。...题目8周六下雨的概率是0.3,周天下雨概率是0.4,如果是independent,求周末下雨概率。如果不independent,求周末下雨概率的range。...题目9 一头熊在河里捕鱼,它吃 3 条鱼可以吃饱,同时每条鱼被捉到的概率是0.5,计算河里第五条鱼存活的概率是多少。...题目10一个盒子有 100 元钱,你和对手分别在纸上写下数字,如果数字之和小于等于 100,那么你们可以各自拿到与自己写下数字价值相同的钱,而如果数字之和大于 100 则两个人都拿不到钱。...我们致力于打造一个全面、高效且互帮互助的社群。无论你是量化投资和机器学习领域的初学者,还是已有深厚背景的专业人士,这里都将是你学习新知识、分享经验、扩展人脉的理想之地。
数据库撑不住了 经过排查,你发现了问题。数据抓取量上来了,但是 MongoDB 却无法同时接收那么多的数据写入。数据写入速度远远小于爬取数据,大量的数据堆积在内存中。于是你的服务器爆炸了。...查询来不及了 现在报警程序要遍历100个数据库最近5分钟里面的每一条数据,确认是否有需要报警的内容。但是这个遍历过程就远远超过5分钟。...时间错开了 由于微博的综合搜索功能不是按照时间排序的,那么就会出现这样一种情况,早上10:01发的微博,你在12:02的时候才抓到。...不论你是在报警的时候筛选数据,还是筛选数据推送给 NLP 分析接口,如果你是以微博的发布时间来搜索,那么这一条都会被你直接漏掉——当你在10:05的时候检索10:00-10:05这5分钟发表的微博,由于这一条微博没有抓到...例如10:05开始检索在10:00-10:05抓取到的数据,无论它的发布时间是多少,都检索出来。 这样做确实可以保证不漏掉数据,但这样做的代价是你必须保存、检索非常非常多的数据。
在前面的文章中,我们从题目入手介绍了对称思想解题的三个根本套路,相关文章请戳: 对称思维的妙用之从解题到本质(三)——三个套路总结 对称思维的妙用之从解题到本质(二)——斗地主中有人抓到王炸的概率是多少...完了,因为青蛙和青蛙之间是对称的,在整个跳跃过程的状态机描述中,也只需要记录每个荷叶位置上的青蛙数目,跳转过程即为确定减少荷叶的索引,数量减一,后续不超过其数量位置的荷叶索引,数量加一即可。...又比如田忌赛马中,如果双方反复博弈,出每种马的概率应该是多少呢?...用GTO公式可以算,但是缓过来一想,你的策略概率经过排列变换以后的结果,如果变得不同,那么对方也轻而易举通过童谣的排列变换可以得到应对策略,因此只有3种马的6种排列随机分配,才是可能的唯一均衡解。...当然这里只是理解,不是证明,纳什定理没说仅有1个均衡解,有可能是3个或6个纯策略的石头剪刀布和赛马的解也说不定,但你会发现,那样依然是对称的。
如果你的服务器在换了机房或者网络发生了变更之后,延迟明显增加。这个时候你就要怀疑是不是网卡丢包或者是错包引起的了。...这个 (scaling factor) 的取值范围是 20-14,并且只通过握手包(SYN)包携带。这里显示的 -1 就是因为没有抓到握手包,所以不知道这个因子是多少。...而实际上窗口的大小很有可能大于 (window size)。 值得一提的是,wireshark 有个功能可以填充这个值,这个在没有抓到握手包的情况下非常有用。 ?...而 tcpdump 工作在网卡和协议栈之间,抓取的是网卡上层的包,所以我们可能会观察到大小超过 MTU 的包: ? 如果是在交换机端抓取的包肯定都是小于 MTU 的。...会将接收到的数据合并成较大的数据包,然后发送至 TCP/IP 协议栈。所以在接收端也是可以看到大小超过 MTU 的包。 可以使用 ethtool 来查看系统的这两个特性是否开启: ?
一个木桶里面有M个白球,每分钟从桶中随机取出一个球涂成红色(无论白或红都涂红)再放回,问将桶中球全部涂红的期望时间是多少? 你有一把宝剑。...每使用一个宝石,有50%的概率会成功让宝剑升一级,50%的概率会失败。如果宝剑的级数大于等于5的话,那么失败会使得宝剑降1级。如果宝剑的级数小于5的话,失败没有效果。...已知一随机发生器,产生0的概率是p,产生1的概率是1-p,现在要你构造一个发生器,使得它产生0和1的概率均为1/2。...已知一随机发生器,产生的数字的分布不清楚,现在要你构造一个发生器,使得它产生0和1的概率均为1/2。...在一条高速公路上,在30分钟内看到一辆汽车的可能性是0.95,那么在10分钟内看到一辆车的概率是多少?(假设过车的概率是恒定的)
结合实例理解 理解公式 我们用一个分类两种鱼的例子来说明贝叶斯规则以及它的合理性。 假设有两种鱼sea bass和salmon,随机取一条鱼,我们会如何猜测呢?...其实这里的60%和40%就是先验概率,用大写字母P表示。...,但是如果接下来的100条鱼都让你猜测,你还会用同样的决策规则吗?...现有一条鱼,经过测量,光泽度是5,那么我们怎么猜呢?...首先我们知道先验概率:$P(sea\ bass)$和$P(salmon)$, 其次我们知道每种鱼的光泽度分布:$p(x|sea\ bass)$和$p(x|salmon)$。
定否定词,寻找否定词相减的绝对值是否小于三 判断如果小于三, 如果为正就类似「 很不开心 」score+=(-1)*(degree)*(开心) 如果为负类似与「 不很开心 」score...,好、中、差) ╮(╯-╰)╭,其是机器学习,通过大量已经标签的数据训练出一个模型, 然后你在输入一条评论,来判断标签级别 宁馨的点评 国庆活动,用62开头的信用卡可以6.2元买一个印有银联卡标记的冰淇淋...举例来说,有个测试样本,其特征F1出现了(F1=1),那么就计算P(C=0|F1=1)和P(C=1|F1=1)的概率值。前者大,则该样本被认为是0类;后者大,则分为1类。...即上式P(F1|C),表示如果知道一个样本分为C类,那么他的特征为F1的概率是多少。 对于多个特征而言,贝叶斯公式可以扩展如下: ? 分子中存在一大串似然值。...挑了一盒55元的寿司,一共有12个寿司,三文鱼,大虾,螺肉,鳗鱼等各种口味都有, 每种看着都不错,配着酱油和芥末吃味道都挺好的。
因为之前注册表已经保存了数据库的账号和密码了,我这里直接打开,他就默认去连接了,我们来看看抓到的东西: ? 查看数据流:(红色的是服务器,蓝色的是客户端也就是我这台本机了) ? ?...下面进行我们web狗可以干的一些事: 开始前,我们先把抓包重置一下(这里注意一下,以后的你在进行每一个步骤之前都应该重置一下,这样就只会抓到你当前操作的包了) ? 然后来到我要测试的系统: ?...到了这里,分为两步走了: 1.白盒测试,或者说你有数据库账号的: 2.黑盒测试,你没有数据库账号的: 我说的是数据库账号,不是上面登录的用户账号。...不过这个系统是做了防护的,大部分的地方都不会有回显,这时候怎么办呢,我们来到方法一,我们不是有数据库的账号密码吗,来,登录MSSQL2008: 登录成功之后,查看自己的系统使用的数据库的ID是多少 ?...嘿嘿嘿,看一条,查一条,还不是美滋滋~~~ 好了,由于技术很菜。。本人的总结就只有这么多,哪个大佬还有更好的方法的欢迎指教。。我好加入我的笔记数据库~~~
评论上限可达 10w+ 此处抓取的评论不是同步从 weibo.com 抓取的,因此同一条微博的,抓取的结果和 weibo.com 看到的评论有时差,笔者觉得无伤大雅。...和微博话题只能最近几十页的数据相比,无 cookie 评论的上限大概在 10w+ 这个量级,实测最多抓到 30w。...能抓到 10w+,不是说网页上显示有 10w 条就能抓到 10w 条, 一来博主可能精选评论,二来微博会过滤,评论的数量显示只会往多了显示;除开这些原因,显示 100w+ 评论大概率能抓到 10w+。...共享数据集 其他人抓取好一个微博 30w 的评论数据集,如果你有同样的需求,输入微博 id 后,无需抓取,可以直接下载。...它是有 cookie 的,抓到的评论基本和 weibo.com 看到的保持一致。
没事使用Ladon一条命令就搞定,非常简单。...因为不同的站点使用的操作系统不一样,未必返回共性结果,所以我们使用Echo输出IsWebShell做为回显特征,当然你抓到不同的webshell,可以返回其它特征,本文只是例子,你也可以输出xxxx-88...LadonEXP测试wireshark抓到的命令执行包,成功回显特征IsWebShell。...当然我们也知道安装unrar的概率极低,但事后验证思路确实可行,发上几个权限。...,别人扫特定漏洞的包你可以轻松记录下来,看到没见过的POC,它不就是0day咯,当然这个概率可能比较低,或者抓到的是不太重要的0day,真正重要的如exchange、zimbra这些,可能需要高仿一些重要机构站点
例如时间就是一个典型的连续数据1.25分钟、1.251分钟,1.2512分钟,它能无限分割。连续数据就像一条平滑的、连绵不断的道路,你可以沿着这条道路一直走下去。 什么是分布呢?...用下面公式就可以了: p为成功概率,即为了在第x次尝试取得第1次成功,首先你要失败(x-1)次。 假如在表白之前,你计算出即使你尝试表白3次,在最后1次成功的概率还是小于50%,还没有抛硬币的概率高。...当然是根据概率的大小来做出决策了。比如你搞了个抽奖活动,最后算出来一天内中奖10次的概率都超过了90%,然后你顺便算了下期望,再和你的活动成本比一下,发现要赔不少钱。那这个活动就别搞了。...2)每一次事件都有两个可能的结果(成功,或者失败) 3)每一次成功的概率都是相等的 4)你感兴趣的是成功x次的概率是多少 案例: 抛5次硬币,有2次正面朝上的概率是多少 你买了之前我介绍你的5家公司的股票...,发生某件事情x次的概率是多大 案例:例如你搞了个促销抽奖活动,想知道一天内10人中奖的概率 例如你是公司质检管理员,想知道一个月内某机器损坏的10次(假如超过10次一句认为不合格)的概率是多少。
睡鱼(61***1) 9:51:38 是不是看错图了 Vincent(706***78) 9:52:03 不是你刚发的图吗?...***1) 9:53:01 1 2你说的老图上的 Vincent(706***78) 9:53:35 新图也是这样,你仔细看看 睡鱼(61***1) 9:55:08 3 摆位后 信息系统终端回时时显示部件到位情况...箭头的意思是:A请求B做某事,这个说得通吗? 睡鱼(61***1) 23:10:05 潘大说的合并是说"找到病人当前治疗(条码)"和"下传数据"合并吗。...,不是按了多少次按钮就是多少个箭头。...这是这两个系统交互的目的 潘加宇(3504847) 23:19:13 可不能画一条登录,再画一条输入金额。。。
胡言乱语 书接上回,沿着大佬所看的方向,你只能看到一条条湍急的河流,还有拥有异常活力的鲦鱼。 你有点疑惑,看向大佬,所以是啥? 大佬转头说道,v50,不然不给说。...大佬,指向下面的河流的鱼,说道此鱼名为嫩春鲦,只要吃下便可增加内力,但是和个人的体质有关,有的人每吃一条便可增长一部分的内力,有的人吃完一条之后就不会在增长内力。看你这样,也顶多一条完事了。...强挤出一声谢谢之后,小王就带着小美去捉鱼了。 在折腾了一下午之后,终于抓到了一只,烤熟之后小王给小美分了一半。在吃完之后,突然觉得体内一股暖流正在上升,这股暖流转而运行到腹部,便不再移动。...看你天赋异禀,不如拜入我门下,我定当好好培养你。 就这样你和小美都拜入白衣老者的门下,白衣老者就暂时叫他大长老。 大长老教你的第一课就是如何运用自己的内力。...看着小美一脸懵逼,你心里不禁暗自窃喜,这不就对应了虚拟机栈中的栈帧吗,每一个方法都对应一个栈帧,每个栈帧都存储该方法的参数,局部变量和返回值等信息。 大长老接着说道。
并且这个正态分布的方差越来越小。直观上来讲,想到大数定律的时候,你脑海里浮现的应该是一个样本,而想到中心极限定理的时候脑海里应该浮现出很多个样本。...中心极限定理的一个通俗例子:现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。...置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度,其给出的是被测量参数的测量值的可信程度,即前面所要求的“一个概率”。...同时,我们选择这个置信区间,目的是为了让“a和b之间包含总体平均值”这一结果具有特定的概率,就是置信水平。 ?...上图中:样本均值以95%的概率落入区间[-2, 2] 以下海捕鱼为例:我知道一百次网下去,可能会有95次网到我想要的鱼,但是我并不知道这一网能不能捕到想要的鱼。
同样,我们可以估计在一条合法消息中单词million的概率,306438个单词中有98个单词,大约相当于3127个单词中的1个。...这两种概率估计都很小,小于500分之一,但重要的是,前者高于后者:1 / 614高于1 / 3127。这意味着似然比,即第一个比例除以第二个比例大于1。...为了深入记忆,我们先尝试一条单条消息的消息。对于先验赔率,如上所述,你应该使用赔率1:1。 练习12:一个单词的垃圾邮件过滤器 让我们从一个只有一个词的消息开始:“million”。...答案:1854:159 练习11:贝叶斯定理(第2部分) 思考上述乳腺癌的情况。一名普通妇女进行X光照相检查,得到阳性检测结果,提示乳腺癌。你认为她患有乳腺癌的几率是多少?...使用你的直觉而不应用贝叶斯定理,并记录下来,你认为在阳性检查结果之后,她实际患乳腺癌的几率是多少。然后,使用贝叶斯定理计算患乳腺癌的后验概率。 首先计算先验赔率,然后乘以似然比。
状态空间中的每个状态都会出现在表格中的一列或者一行中。矩阵中的每个单元格都告诉你从行状态转换到列状态的概率。因此,在矩阵中,单元格做的工作和图中的箭头所示是一样。...这个规则在模拟中所产生的序列如下: 你注意到上面的序列和原来的不太一样了吗?第二个序列似乎具有跳跃性,而第一个(真实数据)似乎具有“粘性”。...它们是高度和重量的组合,被称为“主分量”。 拖动原始数据集中的点,可以看到PC坐标系统正在调整 PCA对于降维很有用。下面,我们将数据绘制成两条直线:一条由x值组成,另一条由y值组成。...一旦回过头来看看表格中的数据,这就显得很有道理了:北爱尔兰人吃的新鲜土豆要很多,吃的新鲜水果、奶酪、鱼和酒精饮料较少。...一个落下来的球可能落在红色的架子上(称之为A事件),或者落在蓝色架子上(称之为B事件),或者两者兼而有之。 那么给定一个球,它击中了红色架子(A事件),而后击中蓝色架子(B事件)的概率会是多少呢?
1 讲背景:丢硬币 随机丢硬币, 看是正面还是反面, 如果硬币的质量是均匀分布, 通常称为公平的硬币 (fair coin), 那么出现正面和反面的概率是 1/2。...3 做试验:p-value 牢记:p-value 就是硬币公平时观测结果发生的概率。 ---- 第一次硬币是反面,p-value 是多少?...额额额(挠挠头) 你心理开始变化了吧 当硬币公平时, 丢 4 次出现反面只有 6.25% 概率。 (50%)^4 = 6.25% ---- 第五次硬币又是反面!!! p-value 是多少?...要推翻硬币公平的假设 你还需要一个基准, 统计上叫做显著性水平, 我把它叫做“搞笑阈值” 当 p-value 还小于这个搞笑阈值, 那原假设明显就搞笑了嘛, 你还像个傻冒一样不推翻它?...但是通过做试验(收集一系列样本观测结果),计算 p-value,当小于事先设定好足够小的“搞笑阈值”的时候,你就有充足信心说硬币是不公平的,诚然,你有可能(possible)会错,但不太可能(not probable
领取专属 10元无门槛券
手把手带您无忧上云