首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【学习】用R和集算器计算连续上涨5天的股票

目标:通过日交易数据,从多只蓝筹股中选出连续上涨5天的股票。   ...思路:导入数据;过滤出上个月的数据;按照股票代码分组;将数据按日期排序;计算出每天比上一天的收盘价的增长额;计算出连续正增长的天数;过滤出正增长天数大于等于5的那些股票。   ...A3:=A2.group(Code),按股票代码分组。这和R语言中的split函数功能类似。点击该单元格可以在右边看到计算结果: ?   每行是一个分组,点击其中一行,可以看到分组内的数据: ?...(Date)>=as.POSIXlt('2012-06-01')& as.POSIXlt(Date)POSIXlt('2012-06-30')) #filter by date 04 A3...08:增加一个列INC,计算”当日收盘价”-“前一日收盘价”。R不支持行间运算,所以这里巧妙的将收盘价整体下移一行,再和原来的收盘价相减。

1.6K90
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    链家面试题:如何分析留存率?

    启动时长:某一天中使用某应用多长时间(分钟)。 启动次数:某一天中启动了某应用多少次。 登陆时间:使用手机的日期。例如2018-05-01。...该业务分析要求查询结果中包括:日期(说明是按每天来汇总数据)、用户活跃数、N日留存数、N日留存率。 1.每天的活跃用户数 先来看活跃用户数这一列如何分析出?...当有“每个”出现的时候,要想到《猴子 从零学会SQL》中讲过的用分组汇总来实现该业务问题。 按每天(登陆时间)分组(group by ),统计应用(相机)每天的活跃用户数(计数函数count)。...c中查找出时间间隔(明天登陆时间-今天登陆时间)=1的数据呢?...3.遇到只有一个表,但是需要计数时间间隔的问题,就要想到用自联结来求时间间隔,类似的有找出连续出现N次的内容、滴滴2020求职真题。

    3.1K10

    视频这么火,你会这么分析吗?

    image.png 那么,如何统计当天访客数以及平均操作次数呢?...短视频平台上线第一天,也就是2020年1月2日,当天的访客数和平均操作次数我们可以很轻而易举的看出来:当天访客数是2(小明和小红两人),当天的平均操作次数是2.5次(当天一共有5次点击行为,2个人操作,...题目中想要知道每天的访客数和平均操作次数,遇到这类“每个”的问题,要想到《猴子 从零学会SQL》里讲过的用“分组汇总”。...按日期分组(group by日期),汇总(人数用count用户名,操作数用count操作时间)。这里因为表中代表日期的字段“操作时间”是精确到分秒的,所以需要利用date函数将操作时间转为日期形式。...具体表达含义如下: lead()表示找出XXX的下一次相邻行为。 partition表示分组 order by表示排序; 比如说,想找出每天用户相邻两次的点击。 按照什么分组呢?

    45700

    一个有趣的时间段重叠问题

    求每天每个活跃房间的峰值人数和总时长。活跃房间的定义是:以每秒为时间刻度,如果在某一时刻同时有两个及其以上的用户在房间内,该房间当天即为活跃房间。峰值人数是指一天内同时在一个活跃房间的最大人数。...拆分起止时间段跨天的时段;3. 取得活跃的时段;4. 按天计算每个房间活跃时段内的不同用户数及其活跃时段的长度;4. 选取活跃时段内的最大人数,并汇总活跃时长。 1....起止时段跨天的问题 由于是按天进行统计,对于进出时间点跨天的情况,要进行拆分。...03 00:00:00 | 0 2 | 2018-01-03 00:00:00 | 1 | 2018-01-03 01:11:01 | 1 (19 rows) (5)按天统计每个房间活跃时长...(重叠度大于1的时段汇总),并求出活跃时段的峰值人数(最大重叠度)。

    4.4K20

    matlab数据可视化交通流量分析天气条件、共享单车时间序列数据

    此示例展示了如何执行各种数据清理、调整和预处理任务,例如删除缺失值和同步具有不同时间步长的时间戳数据。...mean(cots,'omitn') 按日期和时间选择数据 要确定假期期间有多少人骑自行车,请检查 7 月 4 日假期的数据。按 7 月 4 日的行时间索引时间表。...晚上晚些时候的峰值可归因于在晚上的庆祝活动。为了更仔细地检查这些趋势,应将数据与典型日子的数据进行比较。 将 7 月 4 日的数据与 7 月其他时间的数据进行比较。...按星期几和一天中的时间分析 根据不同的时间区间(例如星期几和一天中的时间)检查数据。使用varfun 对变量执行分组计算来确定每天的总计数 。...另一种可能是,有些人一天进去,另一天回来。 确定一天中的小时 varfun 用于按组计算。

    10810

    时间序列预测:探索性数据分析和特征工程的实用指南

    它代表了一天中消费的变化。数据首先按星期进行分组,然后按平均值进行汇总。...有时这种模式是清晰的 这些图通常在一天的中间(从上午10点到下午2点)显示一个相对峰值,然后是一个相对最小值(从下午2点到下午6点)和另一个峰值(从下午6点到晚上8点)。...它类似于日消费季节性图,因为它提供了一天中消费的分布情况。...我们看到趋势有几个局部峰值,夏季的值更高。...一个广泛使用的特征工程技术是对数据集进行按小时划分。将数据分成24个子集,每个子集对应一天中的一个小时。这样做可以规范和平滑信号,使预测变得更简单。 然后应对每个子集进行特征工程、训练和微调。

    21510

    金融行业实战项目:如何理解业务?

    (比如家庭成员,情侣等) (3)请找出数据表中的异常值,并以此阐述你如何控制数据质量并以本数据为例设计数据质量报表。...涉及到“每个”到业务问题,要想到《猴子 从零学会SQL》里讲过的用“分组汇总”来实现。 这里分组按用户id,汇总使用count函数进行计数。...(3)请找出数据表中的异常值,并以此阐述你如何控制数据质量并以本数据为例设计数据质量报表。 根据《描述统计分析》里讲过的异常值方法,我们可以使用Tukey's test方法找出宜昌至的范围。...image.png 我们以该案例中的“年龄”为例,展示如何找出异常值。...“每个问题”要想到用分组汇总来实现。 3.查找出重复数据。对数据项进行分组,找出数量大于2的数据即为重复值。 4.利用sql计算四分位数,找出异常值。

    1.1K50

    手把手教你用Excel分析网站流量(实例讲解)

    前言:随着运营精细化发展,如何通过品牌沉淀的数据挖掘出更多优化可能,是每个运营、产品甚至技术的必修课。...这篇文章将主要阐述我是如何通过发现问题、提出猜测、验证猜想和事件归类这四个方面,分析官网流量数据并找出问题的。...(文中出现的工具有CNZZ后台和Excel2013) 零丨数据背景 这次以某个朋友的网站作为演示数据,选取了2016年7月25日到2016年8月7日,分别是2016年第31周和32周两周的数据,选择这两周数据是因为第...怎么找出是哪一天或者哪个栏目哪个小时的原因? 2.为什么独立访客(UV)和新独立访客(NUV)差值都是4.5倍左右,而浏览次数(PV)差值却只有1.5倍?...3.为什么两周的UV走势(橙线)类似,但PV走势(蓝线)却在7-26和7-29两天出现谷值和峰值?

    2K160

    电商用户行为数据分析系统的设计与实现_基于大数据的用户行为分析

    前言 本文针对淘宝app的运营数据,以行业常见指标对用户行为进行分析,包括UV、PV、新增用户分析、漏斗流失分析、留存分析、用户价值分析、复购分析等内容; 本文使用的分析工具以MySQL为主,涉及分组汇总...,以及用户在研究时段内的复购次数和复购率 1)获客:每日新增用户情况 此处选取2017年11月25日为APP启用的首天,并定义新增用户为出现第一次购买行为的用户。...此处觉得再研究单周意义不大),日为单位,分析用户购买行为,找出活跃用户规律。...1)分析2017年11月25日至12月3日 9天中每天的用户行为 由图可见在研究日期范围内用户活跃度较为平稳,仅在12月2日、3日有明显增长,该日期和11月25日、26日同为周末,故除特别营销活动外,周末能为提升用户活跃度带来的影响较小...,早晨购买,说明收藏和购买是异步的用户行为,收藏的峰值通常发生在购买行为的前一段时间,加购则是购买的前置动作,其峰值也会发生在购买行为前。

    4.7K11

    看腾讯运维应对“18岁照片全民怀旧”事件的方案,你一定不后悔!

    2017年12月30日,元旦假期的第一天,你的朋友圈被18岁照片刷屏了吗?据说“晒18岁照片”的根源是2017年年未,最后一批90后将度过他们的18岁生日。...下面这篇文章让我们回顾12月30日,空间相册面对突发四倍流量,七成访问落在后端冷存储的极端压力下,相册运维、开发团队如何凭借平时基础功底,从告警、容量、扩容、柔性、调度等全方面运维能力,扛过“18岁照片...3) 带图说说峰值达到平日晚高峰的12倍。 [1.jpg] 业务架构剖析 面对突然涌入的用户请求,相册开发与和运维是如何坚守阵地,度过这次难关的呢?...通过全链路数据汇总出相关的链路。 2)压测: 定期对整条链路做压测,压测手段有异地调度压测,或单机压测,通过压测找出链路内存在瓶颈的模块,及时修正链路模型。...(如下图) [3.jpg] 柔性业务架构 前面我们说过,相册在当天的峰值下载量涨了4倍,且多是访问冷数据,但在短时间内无法筹集到4倍的资源,业务是如何应对的呢,在保证用户核心体验不受影响的前提下,我们采用了一些柔性手段

    1.3K110

    抖音面试题:送你一个万能模板,要吗?

    连续问题的万能模板 在《拼多多面试题:如何找出连续出现N次的内容?》里讲过遇到“连续问题”如何解决,并送出了一个万能模板,模板使用的是窗口函数解决连续问题。 image.png 2....而这道题描述的“用户连续登陆”中的“连续”可以理解为用户当前的登陆日期与本月下一次登陆日期相差一天。...从结果看,我们可以获得以下信息: 1)当“日期”与“用户当月下一个登陆日期”只相差一天,即用户本次登陆为连续登陆; 2)当“日期”与“用户当月下一个登陆日期”相差大于一天,即用户本次登陆为连续登陆的最后一天...(也有可能仅登陆一天); 3)当“用户当月下一个登陆日期”等于“当月最后登陆日期”,即用户本次登陆为本月最后一天登陆。...汇总分析 最后获取“每个月,每个用户连续登陆的最多天数”,使用group by函数。

    1K00

    【干货】小白学数据分析:怎么做一份数据日报?

    每日登录过游戏的玩家) 新增用户(每日注册的玩家) 新增有效用户(每日注册的玩家并保证登录过游戏的玩家):建立时间序列的数据源,分宣传期与非宣传期数据,可结合ACU,PCU等数据,观察游戏对用户的黏着度 PCU(峰值...7天都未登录的账号数 日流失率:统计日内有登录但统计日后7天都未登录的账号数 / 统计日的活跃帐号数 日流失充值帐号数:统计日前30天有充值行为,但统计日内无登录,且无充值行为 重点事件及活动回顾 重点活动及事件的介绍...,便于在报告的阅读者容易找到前一天数据出现问题的原因,定位问题,找到相关负责人进行解决。...,比如开始时间,结束时间,活动链接地址进行简要汇总,便于阅读数据的一些人员能够针对数据评估活动效果。...DAU:绘制DAU曲线,并包括具体数值汇总(可以列出表格),同时要把当日数据进行环比和同比分析。 详细数据表格(蓝色为上周同期,红色为日报当日数据) ?

    3.1K71

    如何分析商品订单?

    、付费金额、付费单量 1.题中提到查询“每天”的数据,涉及到“每个”这类问题要想到《猴子 从零学会SQL》里讲过的“分组汇总”来解决这里类问题 按“付费时间”分组,每天的付费人数用汇总函数(count对用户...ID这一列统计有多少行),每天的付费金额用汇总函数(sum对付费金额这一列求和),每天的付费单量要用汇总函数(count对订单号这一列有多少行) 2.上面涉及到的列用户ID、付费金额、订单号都在“订单明细表...2.考察了SQL对数据的分组应用,本题是在分组前对数据按条件筛选,使用的是where子句。...14日注册用户的付费人数、付费金额 首先我们用多维度拆解分析方法对问题拆解 1.先找出“2013年6月14日注册用户”,这个数据可以从“注册表”里查找到 image.png 2.再统计“2013年6...以及如何判断使用哪种联结。 image.png 推荐:如何从零学会SQL? image.png

    87920

    敖丙我把线上CPU打到100%,三歪吓尿了

    你们没发现我最近的原创原创少了很多嘛,一是最近花了很多时间做视频,本来我写文章就是利用周末的两天时间,但是现在基本上两天都要拍摄剪辑了,尽管请了小伙伴做字幕,还是得耗费大量时间在拍摄和剪辑上。...所以我只能利用工作日熬一下才能写出来了,这周因为要发布,本来是没排期写文章的,你们也看到了我发了两个视频嘛。 但是今天我一发布就吓尿了…. 事情是这样的….....先进服务器,用top -c 命令找出当前进程的运行列表 按一下 P 可以按照CPU使用率进行排序 显示Java进程 PID 为 2609 的java进程消耗最高 ?...然后我们需要根据PID 查出CPU里面消耗最高的进程 使用命令 top -Hp 2609 找出这个进程下面的线程,继续按P排序 可以看到 2854 CPU消耗最高 ?...如果真出问题,第一时间找个三歪这样的背锅侠,排查过程自己去电脑上操作一下,最近有点忙,准备写个分布式锁的文章,如何? 我是敖丙,一个在互联网苟且偷生的工具人。

    65330

    QQ 红包技术方案全解密 (一)

    其整体架构如何?重要的系统是如何设计的?为了保证用户的体验,手Q终端做了哪些优化?今年的QQ红包又做了哪些新的尝试,遇到的问题是如何解决的呢?...抽奖逻辑层会定期的把本地的流水文件同步到远程流水系统进行汇总和备份,同时,流水系统会对领用失败的流水进行重做,发送请求到抽奖逻辑层,抽奖逻辑层会调用发货系统的接口完成发货操作。...为保证红包活动持续进行,抽奖系统必须严格按业务控制派发峰值。派发峰值支持实时可调,避免由于业务方评估不足引起过载。...因为同时访问红包页面的人数比较多,按83万/秒的峰值,一个页面按200K评估,约需要158.3G的CDN带宽,会给CDN带来瞬间很大的压力。...目前手Q离线包有两种预加载方式: 将静态资源放入预加载列表,用户重新登录手Q时监测离线包是否有更新并按需加载(1天能覆盖60%,2天能覆盖80%,适合预热放量情况)。

    6.3K99

    京东Star和阿里星,揭示互联网企业对算法&机器学习岗的要求

    本文分为三个部分,笔试&面试、经验心得、题目汇总。...题目汇总 1.笔试题 - 在互联网分析中,通常会关注用户的【第N日激活率】来衡量用户质量。用户的第N日激活指的是用户在注册的第N天登录网站或App,即算为该用户的第N日激活。...第N日激活率指的是某日注册用户在第N天激活的数量除以该日所有注册用户数量。 - “赤兔”是领英中国针对中国职场人士推出的一款本土化的社交应用。...去除字符串S1中的字符使得最终的字符串S2不包含’ab’和’c’,写code - 长度为N的序列Sequence=abc….Z,问有多少不同的二叉树形态中序遍历是这个,写递推公式 - 给定整数n和m,问能不能找出整数...- 如何预测双十一支付宝的负载峰值。 读到最后,希望能对你有所帮助:) (via:http://datartist.cn/)

    3.2K70

    Power Pivot入门前奏——数据透视:组合,数据合并统计你莫愁!

    大海:自动组合主要是针对日期类型的字段,因为一般情况下,对日期进行汇总时很少只是汇总到每一日,反而更多的是按月汇总,或者也经常需要按季度、年度进行汇总,所以数据透视表里干脆对日期直接生成各类组合维度,你试试按日期汇总毛利看看...我按日期汇总毛利数据看一下——咦!我只是拖了日期字段进去的哦,怎么都变成月份了? 大海:对的,这就是数据透视表默认的日期组合方式。当然,你可以把按月汇总那个直接扔掉,变成真正是按日期的汇总。...或者你还可以按季度汇总: 结果如下: 小勤:嗯。知道了,实际上就是形成了一个【年/季/月/日/时/分/秒】的嵌套关系。 大海:对的。这就是数据透视里对日期/时间的自动组合方式。...小勤:那能不能按半个月进行组合啊? 大海:怎么样叫半个月啊?31天的怎么算?29天的怎么算?这是没标准的嘛,每标准的东西就只能人肉了。呵呵。 小勤:也对,那每10天呢? 大海:这还有点儿靠谱。...那数字按规律的呢? 大海:数字按规律实际上就是对数字按照设定的固定区间(步长)进行组合,跟每10天进行组合类似: 结果如下: 小勤:嗯。这个看起来也很好理解。

    1.4K30

    诺奖得主关于疫情数据的七个问题

    作者 | 罗晓妍,罗潇澧 单位 | 湖南大学 ---- 编者按:自中国爆发新型冠状病毒疫情以来,世界顶尖科学家协会(WLA)副主席、2013年诺贝尔化学奖得主,斯坦福大学结构生物学教授、数据分析专家迈克尔...这些平滑后的曲线表明,湖北每日新增病例数在第69天(2月6日)达到峰值,湖北每日新增死亡人数在第78天(2月15日)达到峰值。...图中显示出非湖北地区新增确诊人数在第67天或68天(2月4日或2月5日)达到峰值,从而作者预计,非湖北地区的总确诊人数的最大估计值为7037(2月4日确诊数)或7745(2月5日确诊数)的两倍,即14000...新增确诊病例拟合曲线在第70.4天达到峰值,新增死亡病例拟合曲线在第78.6天达到峰值。 ?...透过该图,可以明显发现,非湖北地区的病例确诊数量提前湖北地区三天达到峰值,死亡数也早于湖北地区两天到达峰值。

    46240

    【性能测试】性能需求挖掘、性能方案制定及压测场景设计之疑惑与思考(一)

    测试系统的限制和故障恢复能力,找系统瓶颈 1、需加集合点,模拟用户瞬间并发,对服务器冲击力大 2、只执行一次,不需设置持续运行时间 3、每3秒进5个人,用户达到30 50 80集合后分别压测,然后利用二分法不断取中间值,找出最大吞吐量...获取系统在没有压力的情况下响应时间,为下一步测试性能拐点做比对 2、负载测试,单个交易多个用户并发10,测试验证系统并发情况下是否有并发性的错误 应用锁 数据库锁 3、容量测试,多个交易按一定比例去配比...这个场景测的是平均压力,也就是一个系统最平常一天的使用压力 6、【高峰期压力】比如“平均每天总的发帖量……”,那么就要查过去最高一 日的业务量。...7、按照时间,使用递增的线程并发数来测试,比如每5分钟加5或10个线程,一直测试1小时,查看系统性能是如何波动的,这样就能基本找到产品的最大极限值即峰值、性能拐点 8、比如:一个系统日均1万人访问,一天平均...2、再确定系统20%时间,大多数系统是24小时对外提供服务的(比如政府类项目,在一天某个时间段提供服务)。 一般系统0点-6点之间访问量很少,从一天总访问量来看,可忽略不计。

    3.4K51
    领券