背景介绍:
这篇文章的作者通过对当前的在线新闻和社交媒体平台新闻的观察,基于:“社交媒体用户经常通过学习朋友分享的观点来更新自己对某一特定话题的看法” , 提出了一个构想:"我们能否学习一个数据驱动的意见动态模型,能够准确地预测用户的意见?",本文就是作者围绕这个问题,来搭建了一个网络模型———— 一种舆论动力学的概率建模框架-斜率模型(SLANT 3),该框架通过标记跳跃扩散随机微分方程表示用户的意见,并允许根据历史细粒度事件数据进行有效的模型模拟和参数估计。然后,我们利用我们的框架,推导出一套有效的预测公式,用于意见预测,并确定意见在何种情况下收敛到稳定状态。从Twitter收集的数据的实验表明,我们的模型对数据提供了一个很好的拟合,我们的公式实现了比替代方案更精确的预测。
模型的详细思路:
这个模型将用户的潜在意见,用一组一组标记跳跃随机微分方程(SDES)驱动的连续时间随机过程[14]来表示。这种结构允许每个用户的潜在意见随着时间的推移被邻居异步表达的意见作为情感信息加以调整。在这里,每当用户通过发布情感信息来表达自己的观点时,她都会对自己当前潜在的观点做出一种杂乱无章的估计。然后,利用模型的一个关键属性-马尔可夫性质-来开发:
1.通过凸规划找到最大可能产生一组(数百万)情感信息的参数的有效估计过程。
2.一个可扩展的模拟过程,可以在几分钟内从模型中抽取数百万条情感信息。
3.一套新的预测公式,用于有效和准确的舆论预测,也可用于确定意见在何种情况下收敛到稳定的共识或两极分化状态。
先关工作:
在这部分,作者描述了一些以前模型的惯用套路,应该是想做突出一下自己的创新点吧.
以前的模型通常有以下限制:
1. 不区分潜在意见和情绪(或表示意见),这是对意见的一种嘈杂的观察(例如,大拇指向上/向下,文本情感);
2. 认为用户的意见是在离散时间内同步更新的,但是,意见可以按照复杂的时间模式异步更新。
3. 模型参数很难从真正的细粒度数据中学习,而是任意设置,因此,它们提供了不准确的细粒度预测。
4. 只分析用户意见的稳态,而忽略了真实舆论动态的瞬态行为,这使得舆论预测方法成为可能。最近,在设计模型方面做出了一些努力,克服了上述一些限制,并提供了更准确的预测[7,8]。然而,他们没有区分意见和感情,仍然认为意见是在离散时间内同步更新的。我们的建模框架解决了上述局限性,并通过这样做,实现了比替代方案更准确的意见预测。
Proposed model :
在这部分,讲述了作者模型的着陆点.
在这一部分中,作者首先从设计的数据出发,建立了他们的意见动力学模型,然后介绍了模型参数估计和模型仿真的有效方法。
作者所用数据介绍:(Opinions data 评论数据)
给出一个定向的社交网络: G = (V, E) , 并将每条消息(评论)记录为e:=(u,m,t) ,这个表示着,u属于V,在时间t上发布了带有情感的消息m。
给定消息集合 {e1=(u1,m1,t1),.,en=(un,mn,tn)},历史Hu(T)收集用户u发送到但不包括时间t的所有消息,即,
H u (t) = {ei = (ui, mi , ti ) | ui = u && ti < t};H(T):=∪u∈V Hu(T)表示消息的全部历史,但不包括时间t。
。。。记录中.