目前,Python 拥有众多科学计算库, 最为著名的如 NumPy 和 SciPy。但从代数运算以及使用语法来看, 这些库往往会带来不必要的繁琐,没办法直观地管理其中的数据类型。因此将 Armadillo 作为底层的 PyArmadillo 库基于这一点,重新塑造了类似 Matlab 和 Octave 等简单易用的语法。此外,由于 pybind11 的用法相对简单,PyArmadillo 将 pybind11 用来连接 C++ 与 Python。该库已于近日正式发布。
作为 C++ 中与 Eigen 并驾齐驱的一大科学计算库, Armadillo 因其简单易用的特性深受广大程序员和科学家的喜爱,也获得了 Facebook、NASA、Boeing、Siemens、Deutsche Bank、MIT、 CMU、Stanford 等公司和高校的广泛使用。此外, Armadillo 的主作者和 Rcpp 的主作者联合开发了 RcppArmadillo,作为 R 语言中的主要科学计算库,在 Github 每月下载量高达 97.2 万次。除此以外,Armadillo 还在著名开源机器学习库 mlpack 中被用作主要的依赖库之一, 获得了极高的知名度。
此次 PyArmadillo 库的开发耗时 2 个月,在 Armadillo 主作者 Conrad Sanderson 的指导建议下,由 Data61 的实习生并在读于昆士兰科技大学(QUT)本科的 Jason Rumengan 和在读于新南威尔士大学(UNSW)本科的 Terry Yue Zhuo 开发完成。其中,Terry 受 Conrad 邀请参与到 PyArmadillo 中与 Jason 共同开发两大类型 mat 与 cube,也是唯一一位华人。Jason 主要负责 mat 部分以及编译方面而 Terry 则负责 cube 部分以及文档和测试。
项目地址:https://github.com/terryyz/PyArmadillo
具体而言,PyArmadillo 是一个 Python 语言的线性代数库,强调易用性。该库旨在提供类似于 Matlab 或者 Octave 的高级语法和功能,使得用户以熟悉且自然的方式表达数学运算。
PyArmadillo 还提供了用于矩阵和多维数据集(cube)的对象,以及 200 多个用于处理对象中存储数据的相关函数。所有功能都可以在一个平面结构中访问,并且支持整数、浮点数和复数。通过集成 LAPACK 或者 Intel MKL、OpenBLAS 等高性能替代产品,该库可以提供各种矩阵分解。
安装指南
PyArmadillo 库的具体用例如下图所示:
目前支持的操作系统:
当前 PyArmadillo 仅为 MVP(minimum viable product),更多的功能还在开发当中。如果使用途中遇到问题,可以通过官网作者的联系方式与他们交流或者在 GitLab 的仓库内汇报。
作者简介
Jason Rumengan,昆士兰科技大学信息技术本科生。研究兴趣在于软件开发、信息安全、网络连接、数据分析等。
Jason Rumengan 个人主页:https://www.jasonrumengan.my.id
Conrad Sanderson 为 Armadillo 的主要作者,曾受 Yoshua Bengio 弟弟 Samy Bengio 指导进入博士后(PostDoc)研究。在 Samy Bengio 为数不多的学生之中,Conrad 是唯一一个他指导过的 PostDoc。后来,Conrad 来到早期为 NICTA 而现今为 CSIRO 一部分的 Data61 担任研究科学进行研究,并且从计算机视觉研究过渡到开源科学计算库的开发工作。在 Armadillo 大获成功之后,Conrad 开始与 Debian 和 R 的主要开发人之一以及 Rcpp 的主作者 Dirk Eddelbuettel 合作进行 RcppArmadillo 的开发。主要研究兴趣在于机器学习、AI、模式识别、计算机视觉、高性能数值计算等。
Conrad Sanderson 个人主页:https://conradsanderson.id.au
华人作者 Terry Yue Zhuo 现为新南威尔士大学(UNSW)计算机科学本科生,主要研究兴趣在于自然语言处理(NLP)、AI 和图像处理等。
Terry Yue Zhuo 个人主页:https://terryyz.github.io
领取专属 10元无门槛券
私享最新 技术干货