看一篇发表在NC上的使用DL来预测糖类结合位点(DeepGlycanSite)的文章。
其文章思路比较清晰,为
这里着重查看复合物数据集构建,以及神经网络构建阶段。
作者整理了一个大型的糖类-蛋白质复合物数据集,涉及约8100种蛋白质和超过1700种碳水化合物。
数据集下载地址:https://github.com/xichengeva/DeepGlycanSite/tree/main/datasets
作者利用无向图 [G = (V, E)] 来表示蛋白质和糖类。
模型:https://github.com/xichengeva/DeepGlycanSite
数据集:https://github.com/xichengeva/DeepGlycanSite/tree/main/datasets
DeepGlycanSite是一个强大的结合位点预测器,在不同糖类化合物结合位点类别中都表现出良好的性能。