首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于图卷积神经网络的分子距离矩阵预测

近年来,一些研究通过预测距离矩阵来重构原子坐标,得到分子的几何结构[12-17]。这些研究大多采用概率生成模型,目的是生成多个低能量的构象,但仍存在一定的局限性。...此外,为了提高模型的预测精度,我们在节点特征中加入全局信息(分子组成),边特征采用五维特征,原子之间没有键的边特征是两个原子之间最短路径上的边特征之和。...3.4 性质预测对比 为了表明所提方法的有效性,我们使用文献[25]中的方法,分别根据QM9数据集[20]计算出的分子距离矩阵和我们的方法预测的分子距离矩阵来预测分子的性质。...可以看出,基于我们模型预测的分子距离矩阵得到的性质预测结果(Predicted)与基于QM9数据集计算的分子距离矩阵得到的性质预测结果比较接近。...表6 使用QM9中的原子距离矩阵和预测的原子距离矩阵进行性质预测的误差对比 4 结论 本章提出了一种基于图卷积网络的双分支DMGCN模型,以解决传统计算方法在确定分子结构时实验成本高、计算成本高的问题

1.4K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    基于Transformer预训练的蛋白语言模型是无监督的蛋白质结构学习器

    过去的方法通常是通过对相关和对齐的序列的分析来利用蛋白质序列的进化信息。 目前的方法是使用类似于NLP中的语言模型来捕捉序列中的内在隐含性质。...潜在的误差来源包括 预滤波的启发式方法失效 相关序列未被检测到 未能找到最佳对齐 替代矩阵和间隙惩罚的次优性,即找不到全局最优解 2.3 评估指标 对于长度为 的蛋白质,我们评估了长度为前 、...作者在具有15051个蛋白质的trRosetta训练数据集中评估的预训练的蛋白质语言模型,其中在trRosetta数据集中去除了43个序列长度大于1024的蛋白质,因为ESM-1b的训练上下文大小设置为...作者发现,虽然ESM-1b模型只用了20个蛋白质序列进行训练,但其在短、中、远距离范围的接触预测方面均比Gremlin具有更高的精度。...作者发现,即便只有一个单一的训练例子,ESM-1b在长度为L的序列的远距离范围预测中,平均精度已经达到39.2,接近SOTA,相同的情况下,这与Gremlin在统计学上已经是无法区分孰优孰劣了(假设检验

    2.8K10

    3. JanusGraph快速开始

    Graph of the Gods 标示 含义 加粗的key 图中的索引键 加粗带星的key 图中的索引键值必须是唯一的 带下划线的key 以顶点为中心的索引键 空心箭头的边 特定的边(不能重复) 尾部十字的边...Groovy构建在Java语言之上,具有很多简洁的语法,使交互式编程变得更加容易。同样的,Gremlin-Groovy也是构建在Groovy之上,具有简洁的语法,使得图的遍历变得容易。...该起始点是一个元素(或一组元素) - 即顶点或边。从起始点,Gremlin路径描述描述了如何通过显示的图结构来遍历图中的其他点。...JanusGraph会自动使用索引来检索满足一个或多个约束条件的所有顶点(g.V)或边(g.E)。JanusGraph中另外一种索引是以顶点为中心的索引。以顶点为中心的索引可以加快图的遍历。...这也可以使用循环的方式来查询,实际上Hercules是从Saturn在in('father') 路径上循环两次到达的点。

    3.3K20

    图(graph) 原

    3.ADT定义 如下是图的抽象数据类型定义: ADT Graph{ 数据对象D:D是具有相同性质的数据元素的集合。...2>性质 邻接矩阵有如下特性: (1)图中各顶点序号确定后,图的邻接矩阵是唯一确定的。 (2)无向图和无向网的琳姐矩阵是一个对称矩阵。...4>邻接表的性质 邻接表的性质如下: (1)图的邻接表表示不是惟一的,它与表结点的链入次序有关。 (2)无向图的邻接表中第i个边表的结点个数即为第i个顶点的度。...如果(u,v)是G中所有的一个端点在U(即u∈U)里,另一个端点不在U(即v∈V-U)里的边中,具有最小权值的一条边,则一定存在G的一棵最小生成树包括此边(u,v)。这个性质称为MST性质。...把v1放在vi到vj的路径上,vi到vj之间可能会产生新的路径,其距离为D(0)[i][1] + D(0)[1][j],当然v1的引入可能反而会加大vi到vj的距离,因此需要比较D(0)[i][1] +

    1.8K20

    JanusGraph图数据库的应用以及知识图谱技术介绍

    支持地理、数值范围和全文搜索对于非常大的图中的顶点和边。 原生支持 Apache TinkerPop 提供的流行的属性图数据模型。 原生支持 Gremlin 图遍历语言。...JanusGraph是一种典型的图数据库,具有以下特点: 1. 数据模型: 图数据库的数据模型主要以节点和关系(边)为基础,同时可以处理键值对。...JanusGraph借助图领域的路径寻找和优化算法,支持高效的关系挖掘。 5. 属性图存储模型: 图数据库采用属性图的基础数据存储模型,将数据描述为点和边及它们的属性。...总体而言,JanusGraph 的数据存储具有以下特点: 以实体为中心。 使用邻接表的方式存储。 通过分布式数据分块技术和冗余技术保证可扩展性。 知识存储技术 1....它还支持查询两点间的最短路径或完全路径,以及使用多种查询语言(包括Gremlin、Cypher、SQL)进行查询、删除、更新等操作。 8.

    44210

    知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg)

    ) RPQ 超集 (增加通过表达式比较属性值) RPQ 超集 (增加比较路径上的顶点和边) RPQ 超集 (增加复杂路径表达式) 语义 任意路径、集合 4 无重复边 5、包 2 任意路径 6、包 2 最短路径...Cypher 可通过 shortestPath 函数支持最短路径语义. 6. Gremlin 中其他语义可以被模拟出来. 7. PGQL 路径查询可通过用户定义函数实现其他语义. 8....(2) 对于一行来说,仅在极 少数列上具有值, 表中存在大量空值, 空值过多会影响表的存储、索引和查询性能 (3) 在知识图谱中,同一主语 和谓语可能具有多个不同宾语,即一对多联系或多值属性,而水平表的一行一列上只能存储一个值...Cayley 使用 Go 语言开发,可以作为 Go 类库使用;对外提供 REST API,具有内置的查询编辑器和可视化界面;支持多种查询语言,包括:基于 Gremlin 的 Gizmo、GraphQL...它是世界上能够托管具有数百亿个顶点(节点)和数万亿条边(关系)的图形的最佳解决方案,具有毫秒级延迟。

    5.2K11

    eLife | 利用进化信息预测蛋白质界面间残基-残基相互作用

    两个或多个蛋白质可以结合在一起,形成复合体来执行各种任务;研究这些复合物的结构是一项挑战,即使是在已知蛋白质亚基结构的情况下也是如此。...作者限制使用具有小的,保守的基因间距离的基因对来创建配对序列,以此规避旁系同源基因。相似的方法被用于构建原核基因组中融合蛋白的数据库。...(5)用Gremlin评分排序残基对 为了将W ij矩阵简化为反映位置i和j之间耦合强度的单个值,作者首先计算S ij,即它们的向量2范数。...(6)将Gremlin评分转化成距离约束 作者将耦合强度转换为特定于残基对的距离约束,并将其包括在Rosetta结构预测程序中。作者使用以下形式的距离约束: ?...为了简化直系同源鉴定,关注基因组中具有保守染色体位置的基因对,该基因对在基因组中被少于20个其他带注释的基因隔开。然后,作者为配对蛋白质家族中的序列建立Gremlin全局统计模型。

    1.2K70

    CS224w图机器学习(一):Graph介绍、特性和随机图模型

    图的表征(Representing Graph) Adjacency Matrix 图 的邻接矩阵 是一个维度为 的矩阵,矩阵元素 代表节点 和节点 之间是否存在边...现实中,图的邻接矩阵非常稀疏,通常需要其他方法来表征。 Edge List 边的list,存储图中的所有边。如: 。...: 个节点组成的无向图,一共存在 条随机分布的边 随机图的性质 Degree Distribution 对于图中的任意节点,它与其他所有节点之间存在边的概率为 图中所有节点的...此时网络具有很高的聚类系数,类似于每个人有100个朋友。 此时需要再对网络进行随机的剪切和重组。 2)Rewire:随机给两个距离较远的节点添加或删除边。...image.png 小世界模型的性质 如下图,横轴为rewire的概率p,实线的纵轴为平均最短路径长度,虚线的纵轴为聚类系数。 随着rewire的概率越大,聚类系数和平均路径长度越小。

    1.8K30

    一文了解各大图数据库查询语言(Gremlin vs Cypher vs nGQL)| 操作入门篇

    虽然 Gremlin 是基于 Groovy 的,但具有许多语言变体,允许开发人员以 Java、JavaScript、Python、Scala、Clojure 和 Groovy 等许多现代编程语言原生编写...下面进入到边相关的语法内容边类型 和点一样,边也可以有对应的类型# Gremlin 创建边类型g.edgeLabel()# nGQL 创建边类型CREATE EDGE edgeTypeName(propNameList...)边的 CRUD说完边类型应该进入到边的常规操作部分了插入指定边类型的边可以看到和点的使用语法类似,只不过在 Cypher 和 nGQL 中分别使用 -[]-> 和 -> 来表示关系,而 Gremlin...图片# Gremlin 插入指定边类型的边g.addE(String edgeLabel).from(v1).to(v2).property()# Cypher 插入指定边类型的边CREATE (()WHERE conditionRETURN r# nGQL 沿指定点查询指定边 N 跳GO N STEPS FROM OVER 返回指定两点路径# Gremlin

    12K21

    单源最短路径问题(Java)

    另外,还给定V中的一个顶点, 称为源。现在要计算从源到所有其他各顶点的最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。 其中,V表示顶点集合,E表示各个节点之间的边。...此为矛盾,因为如果(3)成立,此时应该选择 x进入S集合,即选择具有最短特殊路径的顶点是x,而不是u。...(因为根据最短路径算法,总是选取最短路径的顶点进入S) 4.2 最优子结构性质 该性质描述为:如果S(i,j)={Vi....Vk..Vs...Vj}是从顶点i到j的最短路径,k和s是这条路径上的一个中间顶点...则与S(i,j)是从i到j的最短路径相矛盾。因此该性质得证。...4.3 计算复杂性 对于具有n个顶点和e条边的带权有向图, 如果用带权邻接矩阵表示这个图,那么Dijkstra算法的主循环体需要O(n) 时间。

    54810

    【地铁上的面试题】--基础部分--数据结构与算法--树和图

    1.2 树的特点和性质 树(Tree)作为一种常见的数据结构,具有以下特点和性质: 特点与性质 解释 非线性结构 树是一种非线性的数据结构,与线性结构(如数组和链表)相对。...Tip:树的特点和性质使其具有良好的层级结构,适用于许多实际应用场景,如文件系统、数据库索引、组织结构等。...Trie树的特点是每个节点代表一个字符,从根节点到叶节点的路径表示一个字符串。 这些常见的树结构在不同场景下具有不同的应用和特点。...对于包含 N 个节点的图,邻接矩阵是一个 N×N 的矩阵。矩阵中的元素表示节点之间的连接关系,如果两个节点之间存在边,则对应位置的元素为 1 或边的权重值,否则为 0 或者其他特定的表示。...矩阵中的元素表示节点与边之间的关联关系,通常使用 1 或 -1 来表示节点是边的起点或终点。关联矩阵适用于多重图(允许多个相同节点之间的边)或带有边属性的图。

    51190

    Apache新的顶级项目 TinkerPop

    Apache软件基金会最近宣布:TinkerPop 升级为顶级项目 TinkerPop 是一个图计算框架,用来进行实时的事务型处理,和批量的图分析,包含了一系列以 Gremlin 引擎为核心的子项目和模块...图是一种描述数据存储结构的方式,比如键值对结构,也是存储数据的一种方式,只是图结构更为复杂 图是由顶点和边组成的,点和边各自都可以包含任意多个键值对形式的属性 点是用来描述离散的对象,例如 人、地点、...事件 边是对点之间关系的描述,例如,一个人可以认识另一个人、一个人参与了某件事、一个人在某个地方 属性描述了点和边的信息,例如,一个点包含属性:名称、年龄,一个边包含属性:时间戳 点、边、属性 就构成了一个图...图计算已经有了丰富的历史,他有查询语言,和复杂的算法,例如 路径分析、点的类聚、排序、子图识别 …… 正是因为图具有灵活的数据结构,并包含了丰富的复杂算法,所以图结构被广泛应用于数据挖掘、数据分析 TinkerPop...TinkerPop 的图处理引擎 Gremlin 非常强大,并支持非常多的开发语言,例如 Python, JavaScript, Scala, Go,选择自己熟悉的语言,即可运行图的遍历处理 TinkerPop

    1.6K50

    弗洛伊德(Floyd)算法(CC++)

    矩阵B表示i->j路径由i到j的中转点,也就是路径上除去起点的第一个点,初始化为-1。 初始: 按照图中的点距离给其赋值,A矩阵i->i距离都为0,inf为无法到达。B矩阵初始为-1。...在更新距离的时候我们可以不看图就能更新矩阵,例如下图中2号点到3号点本来为10,我们可以连一个矩阵,以1号点画的两条蓝线为两条边,红色线为剩余2边,我们既然把1号点当作中转点,路径必然为2-1-3,此时距离就是副对角线的顶点值相加...时间复杂度: 迪杰斯特拉算法:具有较高的效率,时间复杂度为O(V^2)(使用朴素实现)或O((V+E) log V)(使用优先队列优化)。...对负权边的处理: 迪杰斯特拉算法:不能处理负权边,因为负权边会破坏算法的贪心选择性质。 弗洛伊德算法:可以处理负权边,但图中不能有负权环,否则最短路径问题没有解。...弗洛伊德算法:所有顶点到自身的距离初始化为0,其他顶点间的距离初始化为边的权重或无穷大(如果无直接连接)。

    27810

    图论入门——从基础概念到NetworkX

    同样,还有对称归一化拉普拉斯矩阵和随机游走拉普拉斯矩阵等不同定义方式。 路径和距离 在图论中,路径和距离是描述图中节点之间连接关系和位置关系的重要概念。...距离(Distance):在图中,两个节点之间的距离是指连接这两个节点的最短路径的长度。如果两个节点之间没有路径相连,则它们之间的距离通常被定义为无穷大。...= \frac{n \times (n-1)}{2} 图的连通性 连通性描述的是图中节点之间是否存在路径相连的性质。一个图是连通的,意味着从图中的任意一个节点到另一个节点都存在路径。...,其应该具有更高的高Fiedler值,表明要将图分割成孤立的子图,需要切断更多的边。...这通常发生在图中存在一个或多个"瓶颈"区域,这些区域的边相对较少,是连接大的图区域的桥梁。

    1.3K10

    数学建模--图论与最短路径

    在数学建模中,图论及其算法在解决最短路径问题上具有重要应用。图论是研究图及其性质的学科,而图中的节点和边代表了现实世界中的各种元素及其相互关系。...它通过动态规划的方法逐步更新各顶点对之间的最短路径。 基本步骤: 初始化一个矩阵,其中包含图中所有顶点对的初始距离。...Floyd算法在处理多源最短路径问题时的具体实现步骤如下: 初始化邻接矩阵:首先,需要一个n×n的邻接矩阵D来存储所有顶点对之间的最短距离。...这样,最终的D矩阵将包含所有顶点对之间的最短路径长度。 输出结果:最后,根据D矩阵和指针数组P,可以输出任意两点之间的最短路径及其长度。...具体步骤如下: 初始化距离数组:首先,初始化所有顶点的距离值。源点到自身的距离设为0,其他所有顶点到源点的距离设为无穷大。 执行n-1次松弛操作:对每条边进行松弛操作,以更新最小距离。

    12810

    Nat Commun|知识引导的分子表示学习预训练框架

    此外,为了精确建模分子的结构信息,在多头注意模块中引入了两个位置编码模块,即距离编码模块和路径编码模块。...如图1b所示,由于直接应用经典的Transformer架构会导致分子结构信息的严重丢失,作者采用路径编码和距离编码模块将结构信息引入多头自注意层。...在分子线形图中,路径编码模块首先找到节点之间的最短路径,然后将路径特征编码为一个注意力尺度。距离编码模块则利用节点对之间的距离来进一步编码分子线形图的空间特征。...最终注意力矩阵为原始注意力编码矩阵、路径编码矩阵与距离编码矩阵的和。 如图1c所示,在本研究中,知识定义为表征分子特征的任何可量化信息。...采用三折交叉验证(n=3),对于KNN中不同的K值,KPGT在分类任务上具有最高的AUROC和准确度(图3a),在对MolLogP等多个指标的回归预测中具有最高的斯皮尔曼相关系数(图3b)。

    19910

    数据结构–图

    以顶点x为弧头的弧的数目,称为x的入度,记作ID(x)。 6.图的连通性质 对无向图G: ● 若从顶点vi到vj有路径,则称vi和vj是连通的。 ● 若图G中任意两顶点是连通的,则称G是连通图。...2.图的存储形式 1.数组表示法/邻接矩阵 顶点数组—用一维数组存储顶点(元素) 邻接矩阵—用二维数组存储顶点(元素)之间的关系(边或弧) 无向图的邻接矩阵是对称的由0-1构成 列和和行和都是i的度...如果边(u,v)是G中所有一端在U中(即u∈U)而另一端在V-U中(即v∈V-U)具有最小值的一条边,则必存在一棵包含边(u,v)的最小生成树。...这是B进入结点,遍历一遍B到每个结点的距离,发现5的邻接结点为B /* 邻接矩阵存储 - Prim最小生成树算法 */ Vertex FindMinDist( MGraph...如果结点只有一个前驱结点:那就是前驱结点ve+到这个结点的边 有多个前驱结点:前驱结点ve+到这的边求最大值 2.活动最早开始时间ee(e)=所连接的弧尾的标记值 3.

    64940
    领券