简读分享 | 崔雅轩 编辑 | 王宇哲
论文题目
Deep learning of protein sequence design of protein–protein interactions
论文摘要
无监督聚类是机器学习中最重要的挑战之一。当前比较流行的假说是,数据是在低维的情况下符合非线性的聚集;因此,聚类的一种方法是识别和分离这些聚集的数据。在本文中,作者提出了一种新的方法来解决这个问题,使用混合自编码器。作者的模型由两部分组成:1)自动编码器的集合,其中每个自动编码器学习一组相似的低维聚集的数据;2)一种混合赋值神经网络,它将自编码器中连接的潜在向量作为输入,并推断出其在簇上的分布。通过联合优化这两个部分,可以同时将数据分配给簇,并了解每个簇的低维形态。

论文链接
https://arxiv.org/pdf/1712.07788v2.pdf