我在开发一个无监督异常检测模型。我有一个代表用户之间通信的数据集(每个示例代表一个通信):有许多特性(时间、持续时间、.)以及发送者和接收者的身份证。我的问题是:如何表示这两个用户之间的链接?我有几个想法,但每个想法似乎都有严重的缺点:
你认为代表这些关系的更好的方式是什么?
整合腾讯在社交娱乐及游戏体验方面的技术能力,满足玩家对游戏内即时通信和语音互动的社交刚性需求,提升游戏黏性
发布于 2018-05-03 16:06:28
根据数据的性质,您可以采取几种方法。听起来你在试图检测数据中的社会异常,所以你需要对它们之间的通信边界进行建模,这会导致某种图形的表示。
如果系统中没有太多的用户(比如$n$),那么您可以在一段时间内创建一个表示用户之间通信的$n\times n$矩阵,$M$。组件$M_{ij}$既可以是$1美元,也可以是$0$,如果用户$i$和$j$通信了,或者通信次数。
如果您有更多的数据,那么您将希望用节点和边来表示数据。节点将是用户,边缘将是通信的存在。这可以手动完成,也可以通过使用库(如NetworkX )来完成。
下面是一个Python教程,介绍如何开始进行图形网络分析。
如果您正在大规模地这样做,那么您可能需要使用图形数据库(如Neo4J )。
https://datascience.stackexchange.com/questions/31166
相似问题
领取专属 10元无门槛券
AI混元助手 在线答疑
洞察 腾讯核心技术
剖析业界实践案例