首页
学习
活动
专区
圈层
工具
发布

Python3对多股票的投资组合进行分析「建议收藏」

'date' # 日期为索引列 # 输出数据的前5行 print(StockPrices.head()) 3、计算股票的日收益率 计算股票每天的收益率,将数据存储在数据框 StockReturns...三、投资组合的相关性分析 1、投资组合的相关矩阵 相关矩阵用于估算多支股票收益之间的线性关系,可使用pandas数据框内建的 .corr()方法来计算。...我们观察到矩阵的对角线永远是1,因为自己和自己当然是完全相关的。另外相关矩阵也是对称的,即上三角和下三角呈镜像对称。 为了便于观察,可以将数值的相关矩阵用热图的形式展现出来。...相关系数只反应了股票之间的线性关系,但并不能告诉我们股票的波动情况,而协方差矩阵则包含这一信息。...random_volatility #将Numpy数组转化为DataF数据框 RandomPortfolios=pd.DataFrame(random_p) #设置数据框RandomPortfolios每一列的名称

2.9K31

新年Flag:搞定Python中的“功夫熊猫”,做最高效的数据科学家

一起来瞧瞧吧~ Python是一门开源编程语言,使用起来非常方便,但同时也存在一些开源语言固有的问题:实现一个功能有很多库可以用。...查看数据 data.head(3) 打印数据的前3行。和.head()函数类似,也可以通过.tail()函数查看数据最后几行。 data.loc[8] 打印行索引为8的行。...(注意下标默认从0开始) data.loc[8,'column_1'] 打印行索引为8,列名为’column_1’所指向的数据。...基本的绘图函数 能实现这个功能主要还是得益于matplotlib库。像我们在介绍中说的,这个库的大部分功能都可以直接通过pandas使用。...相关矩阵和散布矩阵(scatter matrices) data.corr() data. corr(). applymap(lambda x: int(x*100)/100) 通过.corr()可以得到所有列的相关矩阵

1.4K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    amos中路径p值_输出无向图的路径

    外生变量即为不受任何其他变量影响,但影响他人的变量。其在路径图中就是没有被任何一个箭头指到的变量。   ...第六个“Condition number”表示相关矩阵的“条件编号”,样本相关矩阵的条件编号是其最大特征值除以其最小特征值。   第七个“Eigenvalues”为相关矩阵的“特征值”。...如有必要,Amos会为我们尚未命名的任何参数命名,且这一名称将与我们提供的名称一起出现在标签列中。   ...修改索引大于指定阈值的每个参数将显示在此处,并在标记为的列中显示:   “M.I”:修改索引   “Par Change”:估计参数变化 2.11 Minimization History   “...2.13 Model Fit   这一部分为模型整体的拟合情况衡量参数。关于这一部分参数更为细致的介绍请看这篇博客。 2.14 Execution Time   这一模块展示了模型的运行时间。

    2.5K20

    基于Amos路径分析的输出结果参数详解

    外生变量即为不受任何其他变量影响,但影响他人的变量。其在路径图中就是没有被任何一个箭头指到的变量。   ...第六个“Condition number”表示相关矩阵的“条件编号”,样本相关矩阵的条件编号是其最大特征值除以其最小特征值。   第七个“Eigenvalues”为相关矩阵的“特征值”。 ?...如有必要,Amos会为我们尚未命名的任何参数命名,且这一名称将与我们提供的名称一起出现在标签列中。   随后,“Standardized Regression Weights”为“标准化回归系数”。...修改索引大于指定阈值的每个参数将显示在此处,并在标记为的列中显示:   “M.I”:修改索引。   “Par Change”:估计参数变化。 ?...2.13 Model Fit   这一部分为模型整体的拟合情况衡量参数。关于这一部分参数更为细致的介绍请看这篇博客[7]。 ?

    4.4K30

    特征选择怎么做?这篇文章告诉你

    有许多不同的原因导致需要进行预处理分析,例如: 收集的数据格式不对(如 SQL 数据库、JSON、CSV 等) 缺失值和异常值 标准化 减少数据集中存在的固有噪声(部分存储数据可能已损坏) 数据集中的某些功能可能无法收集任何信息以供分析...其中最重要的是: 1)过滤方法=过滤我们的数据集,只取包含所有相关特征的子集(例如,使用 Pearson 相关的相关矩阵)。...在下面的每个示例中,每个模型的训练时间都将打印在每个片段的第一行,供你参考。 一旦我们的随机森林分类器得到训练,我们就可以创建一个特征重要性图,看看哪些特征对我们的模型预测来说是最重要的(图 4)。...使用 RFE 支持方法,我们可以找出被评估为最重要的特征的名称(rfe.support 返回一个布尔列表,其中 true 表示一个特征被视为重要,false 表示一个特征不重要)。...使用 selectkbest 方法,我们可以决定使用哪些指标来评估我们的特征,以及我们希望保留的 k 个最佳特征的数量。

    54030

    特征选择怎么做?这篇文章告诉你

    在下面的每个示例中,每个模型的训练时间都将打印在每个片段的第一行,供你参考。 ?...使用 RFE 支持方法,我们可以找出被评估为最重要的特征的名称(rfe.support 返回一个布尔列表,其中 true 表示一个特征被视为重要,false 表示一个特征不重要)。...相关矩阵分析 为了减少数据集中的特征数量,另一种可能的方法是检查特征与标签的相关性。...我们现在可以通过创建一个相关矩阵来更仔细地研究不同相关特征之间的关系。...图 6:最高相关特征的相关矩阵 在这项分析中,另一个可能要控制的方面是检查所选变量是否彼此高度相关。如果是的话,我们就只需要保留其中一个相关的,去掉其他的。

    92400

    C:图案打印

    对于主对角线(从左上角到右下角),行索引 i 和列索引 j 是相等的,即 i == j 。...对于副对角线(从右上角到左下角),行索引 i 与列索引 j 的和等于矩阵的边长减 1,即 i + j == size - 1 。...} printf("\n");//换行 } for (int i = a - 1; i >= 1; i--) { // 外层循环控制下半部分沙漏的行数,...同时,星号的数量通过 2 * (a - i + 1) - 1 计算得到,随着 i 的增加而减少。 对于下半部分:(对称) 随着 i 的减小,每行前面的空格数量减少。...内层循环控制每行的输出内容,比如空格数量、特定字符的数量等。 2 利用对称性 对于对称的图形,常常可以利用上半部分和下半部分的对称关系,通过修改循环的条件和范围来减少重复的代码。

    51010

    机器学习中特征选择的通俗讲解!

    有许多不同的原因导致需要进行预处理分析,例如: 收集的数据格式不对(如 SQL 数据库、JSON、CSV 等) 缺失值和异常值 标准化 减少数据集中存在的固有噪声(部分存储数据可能已损坏) 数据集中的某些功能可能无法收集任何信息以供分析...其中最重要的是: 1.过滤方法=过滤我们的数据集,只取包含所有相关特征的子集(例如,使用 Pearson 相关的相关矩阵)。...在下面的每个示例中,每个模型的训练时间都将打印在每个片段的第一行,供你参考。 一旦我们的随机森林分类器得到训练,我们就可以创建一个特征重要性图,看看哪些特征对我们的模型预测来说是最重要的(图 4)。...使用 RFE 支持方法,我们可以找出被评估为最重要的特征的名称(rfe.support 返回一个布尔列表,其中 true 表示一个特征被视为重要,false 表示一个特征不重要)。...使用 selectkbest 方法,我们可以决定使用哪些指标来评估我们的特征,以及我们希望保留的 k 个最佳特征的数量。

    95130

    收藏 | 机器学习特征选择方法总结(附代码)

    有许多不同的原因导致需要进行预处理分析,例如: 收集的数据格式不对(如 SQL 数据库、JSON、CSV 等) 缺失值和异常值 标准化 减少数据集中存在的固有噪声(部分存储数据可能已损坏) 数据集中的某些功能可能无法收集任何信息以供分析...其中最重要的是: 1.过滤方法即过滤我们的数据集,只取包含所有相关特征的子集(例如,使用 Pearson 相关的相关矩阵)。...在下面的每个示例中,每个模型的训练时间都将打印在每个片段的第一行,供你参考。 一旦我们的随机森林分类器得到训练,我们就可以创建一个特征重要性图,看看哪些特征对我们的模型预测来说是最重要的(图 4)。...使用 RFE 支持方法,我们可以找出被评估为最重要的特征的名称(rfe.support 返回一个布尔列表,其中 true 表示一个特征被视为重要,false 表示一个特征不重要)。...使用 selectkbest 方法,我们可以决定使用哪些指标来评估我们的特征,以及我们希望保留的 k 个最佳特征的数量。

    84320

    【干货】特征选择的通俗讲解!

    有许多不同的原因导致需要进行预处理分析,例如: 收集的数据格式不对(如 SQL 数据库、JSON、CSV 等) 缺失值和异常值 标准化 减少数据集中存在的固有噪声(部分存储数据可能已损坏) 数据集中的某些功能可能无法收集任何信息以供分析...其中最重要的是: 1.过滤方法=过滤我们的数据集,只取包含所有相关特征的子集(例如,使用 Pearson 相关的相关矩阵)。...在下面的每个示例中,每个模型的训练时间都将打印在每个片段的第一行,供你参考。 一旦我们的随机森林分类器得到训练,我们就可以创建一个特征重要性图,看看哪些特征对我们的模型预测来说是最重要的(图 4)。...使用 RFE 支持方法,我们可以找出被评估为最重要的特征的名称(rfe.support 返回一个布尔列表,其中 true 表示一个特征被视为重要,false 表示一个特征不重要)。...使用 selectkbest 方法,我们可以决定使用哪些指标来评估我们的特征,以及我们希望保留的 k 个最佳特征的数量。

    74420

    机器学习中特征选择怎么做?这篇文章告诉你

    有许多不同的原因导致需要进行预处理分析,例如: 收集的数据格式不对(如 SQL 数据库、JSON、CSV 等) 缺失值和异常值 标准化 减少数据集中存在的固有噪声(部分存储数据可能已损坏) 数据集中的某些功能可能无法收集任何信息以供分析...在下面的每个示例中,每个模型的训练时间都将打印在每个片段的第一行,供你参考。 ?...使用 RFE 支持方法,我们可以找出被评估为最重要的特征的名称(rfe.support 返回一个布尔列表,其中 true 表示一个特征被视为重要,false 表示一个特征不重要)。...相关矩阵分析 为了减少数据集中的特征数量,另一种可能的方法是检查特征与标签的相关性。...图 6:最高相关特征的相关矩阵 在这项分析中,另一个可能要控制的方面是检查所选变量是否彼此高度相关。如果是的话,我们就只需要保留其中一个相关的,去掉其他的。

    85720

    这26款好看的可视化R包助你一臂之力

    参数设置包括:1)连续型9种颜色;极端型11种颜色等2)配色高大上,基本满足大部分的使用场景3)可以生成多种自己喜欢的颜色库。...7.名称:Plotly 简介:Plotly更多是因为其在线绘图工具的属性为人所知,比如GEPIA网站中一个热图的可视化就用到了plotly的外接,但其实他也是一个可视化R包。...8.名称:ggstatsplot 简介:ggstatsplot能够提供更为丰富信息的包,其实就是画出高质量的图,不需要我们花费过多的精力去调整绘图细节,举个例子,一般的探索性数据分过程析包括数据可视化与数据统计两个部分...14.名称:Lattic包 简介:基于grid包开发的Lattic包含了grid包大部分的功能,尤其对于多变量数据进行可视化,简直是第一杀器,能够直接生成画板,并且比较变量的不同分组或者不同子集,不用循环也能批量出图...,最重要不需要提前计算好相关矩阵,输入数据即可自动计算,新手易上手的同时还能让画出来的图片有老司机的感觉。

    4.4K20

    维度规约(降维)算法在WEKA中应用

    简而言之,主要组成部分,ÿ,是我们数据集中变量的线性组合, X,那里的权重, ËĴŤ是从我们的数据集的协方差或相关矩阵 的特征向量导出的。 第一个主要成分是使数据点距离的平方和最小的直线。...它是单行数据集的最小二乘逼近。因此,第一个主要组成部分解释了数据集的最高变异量。然后从数据集中提取残差并计算下一个主成分。...SOM是一种多维缩放技术,它构建了一些底层数据集的概率密度函数的近似值,X,这也保留了该数据集的拓扑结构。...保留拓扑结构简单地意味着如果两个输入向量靠近在一起X,那些输入向量映射到的神经元 w ^也将紧密结合在一起。这是SOM的特点。 ?...然而,SOM和聚类的区别在于数据集的聚类将(一般来说)保留数据集的概率密度函数,而不是数据集的拓扑结构。这使SOM特别有用于可视化。

    1.7K20

    逻辑运算和字符串索引

    字符索引 字符串中的每个字符都有一个编号,在python中,这些字符的 编号叫做索引。 使用索引可以得到字符串中的某一个字符。 字符串名称[索引] 字符串索引是从0开始的。...保留某索引后面的字符 冒号前面填写索引,表示切割的起始位置,会保留大于等于该索引的字符。...保留某索引前面的字符 冒号后面填写索引,表示切割的结束位置,会保留小于该索引的字符。...保留两个索引之间的字符 冒号前后分别填入起始索引和结束索引,起始索引对应的字符会被保留下来;而结束索引对应的字符,不会被保留下来。...2.内循环是外循环的一部分,内循环中的所有代码也都是外循环的下级代码。 3.因为前没有缩进,所以不是任何循环结构的下级代码。

    1.2K10

    R语言 主成分分析PCA(绘图+原理)

    PCA 操作流程 去均值,即每一位特征减去各自的平均值(当然,为避免量纲以及数据数量级差异带来的影响,先标准化是必要的) 计算协方差矩阵 计算协方差矩阵的特征值与特征向量 对特征值从大到小排序 保留最大的...如果我们的变量中有噪音的话,我们就在无形中把噪音和信息的权重变得相同,但PCA本身无法区分信号和噪音。在这样的情形下,我们就不必做定标。...(2)特征值 (eigen value) 特征值与特征向量均为矩阵分解的结果。特征值表示标量部分,一般为某个主成分的方差,其相对比例可理解为方差解释度或贡献度 ;特征值从第一主成分会逐渐减小。...特征向量主要起转换作用,其数值不能说明什么问题,解释力更强的是载荷loadings,但很多R输出中经常混用,engen vector与loadings。...以计算相关矩阵或者协方差矩阵的特征值为主要手段。

    14.5K31

    用Pandas在Python中可视化机器学习数据

    Python中的机器学习数据的可视化随着熊猫 摄影通过Alex Cheek,保留一些权利。 关于方法 本文中的每个部分都是完整且独立的,因此您可以将其复制并粘贴到您自己的项目中并立即使用。...这是一个很好的演示数据集,因为所有的输入属性都是数字的,要预测的输出变量是二进制的(0或1)。 这些数据可以从UCI机器学习库中免费获得,并作为每个配方的一部分直接下载。...一些像年龄,测试和皮肤似乎相当倾向于较小的值。 多变量图 本部分显示多个变量之间交互的图表示例。 相关矩阵图 相关性表明两个变量之间的变化是如何相关的。...如果两个变量在同一个方向上变化,它们是正相关的。如果相反方向的变化(一个上升,一个下降),那么它们是负相关的。 您可以计算每对属性之间的相关性。这被称为相关矩阵。...然后,您可以绘制相关矩阵,并了解哪些变量具有高度相关性。 这是有用的,因为如果有高度相关的输入变量在您的数据中,一些机器学习算法如线性和逻辑回归性能可能较差。

    3.4K60

    Excel数据分析案例:用Excel做因子分析

    因此,进行了因素分析以确定较少的潜在因素。 通过使用Excel做因子因素分析后,可以得到如下结果: 下表显示的是所选变量的摘要统计量以及变量之间的相关矩阵。...为整个输入表计算标准化的Cronbach的alpha。α为0.914意味着所选变量之间存在一定的冗余。 再看和残差相关矩阵可以验证因子分析模型是否正确,以及在哪里无法再现相关性。...下表显示了因子分析得出的特征值。我们可以看到,使用4个因子,保留了初始数据变异性的75.5%。 ? 注意:以上显示的特征值是通过主因子提取方法获得的。...接下来,我们可以看到varimax旋转改变了每个因子解释部分方差的方式。 方差最大旋转通过按列最大化平方因子加载的方差,使解释更容易。...对于给定的因素,高负载变得更高,低负载变得更低,中间负载变得更低或更高。 ? 要查看的下一个结果是varimax旋转后的因子加载。这些结果用于解释(旋转)因子的含义。 ?

    4.5K20
    领券