首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【开源公告】腾讯第三代高性能计算平台Angel 正式全面开源

Angel 项目简介 Angel是一个基于参数服务器(Parameter Server)理念开发的高性能分布式机器学习框架,在其之上,用户能轻松开发适用于高维度模型的机器学习算法,并使用基于PS Service...操作,可以自定义复杂的psFunc 提供多种同步控制机制(BSP/SSP/ASP) 2、开发运行 语言支持:系统基于ScalaJava开发,用户也可以自由选择 部署方便:可以直接在Yarn社区版本中运行...,为其他分布式计算平台提供PS服务 基于PS-Service,不需要修改Spark核心代码,直接开发Spark-on-Angel算法,该模式无缝支持Breeze数值运算库 4、算法库 集成Logistic...Regression,SVM,KMeans,LDA,MF,GBDT等机器学习算法 多种优化方法,包括ADMM,OWLQN, LBFGSGD 支持多种损失函数、评估指标,包含L1、L2正则项 5、算法优化...LDA采用了F+LDA算法用于加速采样的速度,同时利用流式参数获取的方法减少网络参数获取的延迟 GBDT使用两阶段树分裂算法,将部分计算转移到PS,减少网络传输,提升速度 官方开源地址: https

1K70
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    “轻易强快”的Spark on Angel,大数据处理爽到爆!

    强 --- 功能强大,支持breezebreeze库(GitHub地址:https://github.com/scalanlp/breeze)是scala实现的面向机器学习的数值运算库。...Spark MLlib的大部分数值优化算法都是通过调用breeze来完成的。如下所示,SparkSpark on Angel两种实现都是通过调用 breeze.optimize.LBFGS 实现的。...BreezePSVector是指Angel PS上的Vector,该Vector实现了breeze NumericOps下的方法,如常用的 dot,scale,axpy,add等运算,因此在LBFGS[...如下代码所示,LBFGS在SparkSpark on Angel上的实现,二者代码的整体思路是一样的,主要的区别是梯度向量的Aggregate模型 $w$ 的pull/push。...快 --- 性能强劲 我们分别实现了SGD、LBFGS、OWLQN三种优化方法的LR,并在SparkSpark on Angel上做了实验对比。

    1.2K70

    Logistic回归实战篇之预测病马死亡率(三)

    作 者:崔家华 编 辑:李文臣 四、使用Sklearn构建Logistic回归分类器 开始新一轮的征程,让我们看下Sklearn的Logistic回归分类器!...,比如Logistic回归、Lasso回归、贝叶斯脊回归等,可见需要学习的东西还有很多很多。...参数说明如下: penalty:惩罚项,str类型,可选参数为l1l2,默认为l2。用于指定惩罚项中使用的规范。newton-cg、saglbfgs求解算法只支持L2规范。...五、总结 1、Logistic回归的优缺点 优点: 实现简单,易于理解实现;计算代价不高,速度很快,存储资源低。 缺点: 容易欠拟合,分类精度可能不高。...本系列篇章: Logistic回归实战篇之预测病马死亡率(一) Logistic回归实战篇之预测病马死亡率(二) Logistic回归实战篇之预测病马死亡率(三)

    2K90

    sklearn 实现 logistic 算法

    引言 前面两篇文章中,我们介绍了 logistic 回归的原理实现: Logistic 回归数学公式推导 梯度上升算法与随机梯度上升算法 本文,我们来看看如何使用 sklearn 来进行 logistic...回归呢。...Sklearn 的 logistic 回归 sklearn 通过 sklearn.linear_model.LogisticRegression 实现了逻辑斯蒂回归算法。...newton-cg、sag lbfgs 算法只能使用 l2 正则化。 ‘elasticnet’ 只适用于 saga 算法。 具体算法由 solver 参数指定。...’, ’sag’, ’saga’ liblinear — 开源的liblinear库实现,内部使用了坐标轴下降法来迭代优化损失函数,适用于小数据集 lbfgs — 拟牛顿法,利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数

    69020

    Python3《机器学习实战》学习笔记(七):Logistic回归实战篇之预测病马死亡率

    三 从疝气病症状预测病马的死亡率 实战背景 准备数据 使用Python构建Logistic回归分类器 四 使用Sklearn构建Logistic回归分类器 LogisticRegression 编写代码...下面将首先介绍如何处理数据集中的数据缺失问题,然后再利用Logistic回归随机梯度上升算法来预测病马的生死。 2 准备数据 数据中的缺失值是一个非常棘手的问题,很多文献都致力于解决这个问题。...3 使用Python构建Logistic回归分类器 在使用Sklearn构建Logistic回归分类器之前,我们先用自己写的改进的随机梯度上升算法进行预测,先热热身。...---- 四 使用Sklearn构建Logistic回归分类器 开始新一轮的征程,让我们看下Sklearn的Logistic回归分类器!...参数说明如下: penalty:惩罚项,str类型,可选参数为l1l2,默认为l2。用于指定惩罚项中使用的规范。newton-cg、saglbfgs求解算法只支持L2规范。

    84720

    腾讯Angel 1.0正式版发布:基于Java与Scala的机器学习高性能计算平台

    Java Scala 语言开发的面向机器学习的高性能分布式计算框架。...Angel 基于 Java Scala 开发,能在社区的 Yarn 上直接调度运行,并基于 PS Service,支持 Spark on Angel,未来将会支持图计算深度学习框架集成。...算法库 集成 Logistic Regression,SVM,KMeans,LDA,MF,GBDT 等机器学习算法 多种优化方法,包括 ADMM,OWLQN,LBFGS GD 支持多种损失函数...Angel-PS 架构上的程序,开始之前,你最好掌握以下能力: 会编写简单的 Scala 或者 Java 代码 掌握向量、矩阵张量的基础知识,了解其定义基础计算。...回归Logistic Regression) 矩阵分解(Matrix Factorization) 支持向量机(SVM) K-均值(KMeans) GBDT LDA Spark on Angel Optimizer

    96350

    如何使用Vim编写调试Python代码

    如何使用Vim编写调试Python代码 1.部署环境 要想在Ubuntu下使用VIM编写调试Python代码,请下安装如下的链接进行配置: https://segmentfault.com/a/1190000003962806...使用set更改shell特性时,符号"+""-"的作用分别是打开关闭指定的模式。set命令不能够定义新的shell变量。...许多命令的输出是以空格分隔的值,如果要使用其中的某个数据域,使用 set 非常有效。 #!...call调用函数 vim的配置信息 Vim把它所有的配置存在两个相当简单的地方:一个简明的~/.vimrc文件全是纯文本文件的~/.vim目录。...这样可以在不同模式下使用同一个按键产生不同的效果。 noremap map 的区别是,被映射的序列不会再被递归映射。 nnoremap是什么意思?

    4K10

    【机器学习笔记】:逻辑回归实战练习(二)

    使用sklearn构建逻辑回归模型 可视化逻辑回归分类效果 评估逻辑回归模型 ▍两个变量的简单数据集 上一篇,我们已经推导出了逻辑回归参数求解的迭代公式,自己通过numpyscipy的使用就可以很容易地实现一个逻辑回归模型...下面将对逻辑回归参数进行总结分类和解释。 ▍Logistic模型参数解释 正则化参数:属于该分类的参数有 C penalty。...penalty:提供我们正则化的类型,L1范数正则化L2范数正则化(在线性回归中相当于lasso回归回归),默认情况下使用L2正则化,但此参数也需要与solver类型配合使用,因为一些solver...▍Logistic模型参数调试 下面我们手动调节几个参数,来感受一下这些参数是如何影响最终结果的。...那么如何找到这样的搭配呢?除了凭借经验手动调参以外,还可以使用sklearn的一个工具。

    89920

    详解如何使用SparkScala分析Apache访问日志

    安装 首先需要安装好JavaScala,然后下载Spark安装,确保PATH JAVA_HOME 已经设置,然后需要使用Scala的SBT 构建Spark如下: $ sbt/sbt assembly.../bin/spark-shell scala> val textFile = sc.textFile("README.md") // 创建一个指向 README.md 引用 scala> textFile.count...// 对这个文件内容行数进行计数 scala> textFile.first // 打印出第一行 Apache访问日志分析器 首先我们需要使用Scala编写一个对Apache访问日志的分析器,所幸已经有人编写完成...使用SBT进行编译打包: sbt compile sbt test sbt package 打包名称假设为AlsApacheLogParser.jar。...然后在Spark命令行使用如下: log.filter(line => getStatusCode(p.parseRecord(line)) == "404").count 这个统计将返回httpStatusCode

    70920

    scikit-learn 逻辑回归类库使用小结

    之前在逻辑回归原理小结这篇文章中,对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。重点讲述调参中要注意的事项。 1....LogisticRegression, LogisticRegressionCV logistic_regression_path。...logistic_regression_path类则比较特殊,它拟合数据后,不能直接来做预测,只能为拟合数据选择合适逻辑回归的系数正则化系数。主要是用在模型选择的时候。...也意味着如果我们需要相对精确的多元逻辑回归不能使用L1正则化了。     具体OvRMvM有什么不同我们下一节讲。 4....但是如果选择了multinomial,则只能选择newton-cg, lbfgssag了。 5.

    1.1K50

    【机器学习笔记】:逻辑回归实战练习(二)

    使用sklearn构建逻辑回归模型 可视化逻辑回归分类效果 评估逻辑回归模型 ▍两个变量的简单数据集 上一篇,我们已经推导出了逻辑回归参数求解的迭代公式,自己通过numpyscipy的使用就可以很容易地实现一个逻辑回归模型...下面将对逻辑回归参数进行总结分类和解释。 ▍Logistic模型参数解释 正则化参数:属于该分类的参数有 C penalty。...penalty:提供我们正则化的类型,L1范数正则化L2范数正则化(在线性回归中相当于lasso回归回归),默认情况下使用L2正则化,但此参数也需要与solver类型配合使用,因为一些solver...▍Logistic模型参数调试 下面我们手动调节几个参数,来感受一下这些参数是如何影响最终结果的。...那么如何找到这样的搭配呢?除了凭借经验手动调参以外,还可以使用sklearn的一个工具。

    75620

    快速入门Python机器学习(33)

    文末有惊喜 12.6 神经网络回归算法 12.6.1类、参数、属性方法 类 class sklearn.neural_network.MLPRegressor(hidden_layer_sizes=...activation {'identity', 'logistic', 'tanh', 'relu'}, default='relu'隐藏层的激活功能。...'identity',无操作激活,用于实现线性瓶颈,返回f(x) = x'logistic',即logistic sigmoid函数,返回f(x) = 1 / (1 + exp(-x))。'...'adam'指的是由金马、迪德里克吉米巴提出的基于梯度的随机优化器注意:就训练时间验证分数而言,默认解算器'adam'在相对较大的数据集(有数千个或更多的训练样本)上工作得相当好。...t_ int 数学上等于n iters*X.shape[0],表示时间步长,由优化器的学习率调度器使用。 方法 fit(X, y) 将模型拟合到数据矩阵X目标y。

    33010

    SoftMax回归详解

    深度学习 deep learning logistic回归 logistic regression 截距项 intercept term 二元分类...引言 本篇文章,我们介绍Softmax回归模型,该模型是logistic回归模型在多分类问题上的推广,在多分类问题中,类标签 y 可以取两个以上的值。...此时的 Hessian矩阵变为可逆矩阵,并且因为是凸函数,梯度下降法 LBFGS等算法可以保证收敛到全局最优解。为了使用优化算法,我们需要求得这个新函数 J(θ) 的导数,如下: ?...6. softmax回归与logistics回归的关系 当类别数 k=2 时,softmax 回归退化为 logistic 回归。这表明 softmax 回归logistic回归的一般形式。...此时的 Hessian矩阵变为可逆矩阵,并且因为是凸函数,梯度下降法 LBFGS等算法可以保证收敛到全局最优解。为了使用优化算法,我们需要求得这个新函数 J(θ) 的导数,如下: ? ?

    1.6K80

    资料推荐:Spark-mllib 源码分析之逻辑回归

    Spark-mllib 源码分析之逻辑回归(Logistic Regression) 这篇博客详细的列出了逻辑回归用Spark计算时的原理: https://blog.csdn.net/u011724402.../article/details/79089257 Spark能够对Logistic Regression进行并行化,因此通过对Spark1.6.1源码的分析,文章解决下述问题: 问 Spark在哪里对...问 如何并行化? 我们可以先猜测一下可能的并行化的部分是在哪里?...我们知道,如果使用一阶方法,通常使用SGD方法进行求解,涉及到梯度的计算,如果使用二阶方法,通常使用Newton方法进行求解,涉及到梯度Hessian矩阵的计算,二阶的计算量较大,如果使用近似二阶的方法...,通常是LBFGS,也涉及到梯度的计算。

    82130
    领券