首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

The Quora Topic Network(上)

--想知道quora的网络是怎么连接的吗? By Don van der Drift Introduction 主题在Quora的知识生态系统中扮演着几个关键角色。...主题形成了Quora的知识语料库的重要组织骨干。 这个骨干将只会变得更加重要,因为语料库会继续增长。早期,Quora的硅谷根基允许它迅速成为关于创业和关于创业的问题的一个伟大的平台。...A schematicrepresentation of "following" relationships on Quora....Quora's Diversification 作为我们调查的第一步,我们想要获得Quora扩展到新的知识领域的定量意义。换句话说,目前有多少主题有着大量的内容,这个数字会如何随时间变化?...这些主题之间的关系不能仅仅通过查看这一个问题来推导,但我们有动机询问是否他们可以从Quora的整个问题语料库推断。换句话说,通过用主题标记问题,Quora社区是否有机地创建主题层次结构?

72610
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Machine learning at Quora(下)

    例如,流行的Quora电子邮件摘要包括已选择并为您推荐的故事集合。 这是一个不同的learning-to-rank模型,针对不同的目标函数进行了优化。...这是Quora的一个问题,因为我们要确保来自回答特定问题的用户的所有力量都是共享的,并且集中在正确的地方。 将具有问题并希望将其添加到站点的用户指向预先存在的答案也很重要。...在Quora,我们使用ML技术来推断用户专业知识。为了训练这些模型,我们有几个重要的特征。...在Quora,我们有几个模型可以检测与内容质量相关的不同问题。 这些分类器的输出在大多数情况下不直接用于对内容做出决定,而是用作将这些问题/答案反馈到审核队列中的方式,然后手动审查。...Models Quora已经尝试了许多不同的模型来解决上述不同的用例。 有些时候,我们使用开源的实现,但是许多其他实现,我们最终用了更高效或灵活的内部版本。

    64220

    Upvote Dynamics on the Quora Network(上)

    By Shankar Iyer Introduction 当一个答案被添加到Quora时,存在着将它分发给跟随作者的人的各种机制。...然而,通过用户网络跟踪upvote的传播为我们提供了一个有价值的观点,Quora如何作为一个产品,连接人们想要的知识。...换句话说,我们希望知识能够在Quora网络最远的地方为好奇的人们带来价值,并且理想情况下,我们希望这种情况尽可能高效地发生。...下面,我们将讨论关于如何在Quora网络中分发和发现答案的几个问题。在实践中,答案如何通过Quora网络传播?它从作者得到有多远,它多快到达那里?这些动态如何依赖于回答者及其上升者的特征?...数据团队注意到,在Quora社区中也有这些问题的兴趣(例如,一个upvote是如何在Quora上的主题和关注者之间传播的),所以我们决定探索我们的第二个(和过期的)博客文章。

    92410

    Machine Learning at Quora(简要版)

    自从我一年前加入Quora,我一直在谈论在这里的所有的非常有趣的关于机器学习的挑战。然而,当我上周参加并在MLConf发言时,我很惊讶,许多和我谈过的人仍然没有听说我们在做什么。...在Quora我们在关心什么? Quora的使命是“分享和增长世界的知识”。 我们相信,有很多知识仍然在人们的头脑,我们想把它带到互联网中,然后提供一种方式,一种不仅有效率,而且有吸引力的方式。...使Quora独特的事情之一是我们关心三个正交维度:相关性,需求和质量。 我们关心相关性,因为我们想确保每个人都能获得他们最感兴趣的知识。我们关心需求,因为我们想确保许多人的问题都能得到好答案。...数据 您可以将Quora视为知识库,有主题的兴趣网络和社交网络之间的混合。这创建了一个非常丰富的数据和数据之间关系的生态系统,我们可以在我们的机器学习方法中使用。 看看下面的图表。

    34220

    Upvote Dynamics on the Quora Network(下)

    Quora,随着时间的推移,人们识别回答者谁生产了高品质的内容,并跟随他们。每当这种情况发生时,从读者到作者的网络距离缩短,这是生态系统应该具有的行为标志。...这只是Quora生态系统的机体功能的又一个信号。 即使在小世界网络中,典型的路径长度随着网络的增长而上升;它只是很慢。...这可能有很多原因,从2013年初反馈如何运作到人们加入Quora那段时间的趋势。我们没有深入挖掘这一点,因为2013年的队列在一天后永久超过了2012年,因为2014年的队列表现相当出色。...特别是,我们已经了解了答案如何通过Quora用户网络。...这部分是由于Quora的整体增长;平均来说,只有就平均而言,有更多的用户途径导致几年前的答案更远离回答者。然而,这也可能部分是由于用于向潜在感兴趣的读者分发内容的机制的持续改进。

    31110

    Machine learning at Quora(详细版上)

    Quora,我们已经使用机器学习方法一段时间了。我们不断提出新的方法,并对现有方法进行大的改进。...我们实际上首先需要确定在Quora中“好”的答案的定义。想出这个定义的一个好方法是看看Quora认为“有用的答案”。您将阅读有关“真实”,“可重用”,“提供解释”或“格式良好”的答案。...一个这样非常重要的情况是Quora Feed。 Quora Feed基本上是任何登录用户在登录产品时将看到的主页。...另一方面,Quora在用户之间也有明确的连接。 您在“社交网络”上的操作也应影响排名。 最后,Quora的故事有时可能涉及正在进行的趋势事件。...正因为如此,在Quora创建这样的个性化排名有着许多不同的特征。

    32220

    顶级大厂Quora如何优化数据库性能?

    Quora 的流量涉及大量阅读而非写入,一直致力于优化读和数据量而非写。...1.3 一维数据集中的稀疏数据 Quora 在缓存方面经常遇到的另一个问题是:稀疏一维数据集。如可能需要查询数据库,看某问题是否需重定向到另一问题(如同一个问题被重新发布,就可能发生这种情况)。...绝大多问题不需要重定向,所以 Quora 只会获取几个“重定向”,而大量“不重定向”。 当他们只是缓存了 question_id ,缓存中就会填满不用,只有几个重定向。...作为分片项目的一部分,已对 MySQL 中最大的表进行分片,这是在 MySQL 在 Quora 的分片中记录 此表是基于自增列范围进行分片的,与基于时间的分片接近,因为自增列值随时间增加 大多数查询访问最近的分片

    21910

    Quora 的陨落:AI 时代知识社区的困境

    难怪 Quora 在 2010 年代会有如此迅猛的增长。 然而,今天的 Quora 几乎与那些乌托邦的理想无关。...Quora 的“合作伙伴”并不是唯一被招募来完成这项任务的人——Quora 还吸引到从 Reddit 提取问题并发布到 Quora 页面的机器人。这些都不是 Quora 社区想要的问题。...忠诚的 Quora 用户试图举报有偏见的、恐同的和淫秽的内容,但却没有得到 Quora 足够的支持。 然后,AI 来了。...Quora 的帮助中心声明:“到目前为止,我们不使用 Quora 上的答案、帖子或评论来训练用于在 Quora 上生成内容的 LLM,但这在未来可能会发生变化。”...我想知道,如果有人愿意问的话,那么 Quora 将如何回答“为什么 Quora 会走向衰落”这个问题。

    13110

    Quora 做机器学习「炼丹」是怎样的体验?

    AI 科技评论按:实际上,号称「美版知乎」的 Quora 也已经大量引入了机器学习技术,而 Quora 的工程师们则喜欢把自己研究机器学习、产出技术方案的过程戏称为「炼丹」,如今他们也想对外分享他们的经验和成果...日前,他们发出了该系列博客的第一篇——《使用 Alchemy 做特征工程》(「Feature Engineering at Quora with Alchemy」),作者为 Quora 的两位工程师 Kornél...现在,Quora 的重点便是通过问答来实现这些目标:读者在网站上寻找相关的内容,提问者寻找有用的答案,而我们就是从他们的提问中提取出正确问题的答复者。...随着 Quora 网站上机器学习工程师数量日益增多,用来支持产品中各类应用程序的独一无二的特征工程框架的数量也在增多。...via: https://engineering.quora.com/Feature-Engineering-at-Quora-with-Alchemy

    86720

    为什么Quora选择Python作为它的开发环境?

    自从Facebook的创始人Adam D'Angelo开始效力于这个大量使用了PHP的网站,我就一直在想他要用Python而不是PHP来创造Quora所遇到的技术挑战。...Adam D'Angelo,Quora创始人: 我们非常确定我们不会用PHP。Facebook因为历史遗留原因而使用PHP,并不是因为它是最好的选择。...Charlie Cheever,Quora的一个创建者 给Adam的答案补充几件事情: Python有一堆相当好的提供了良好的调试器和重载的框架(Django,Pylons和其他一些),这些大部分都被很好的支持并且也变得越来越好...这真是太好了,因为Quora中涉及到大量的客户端和服务端之间的不加载页面的交互。 Python代码往往可读性很强,因为我们希望能在网站上和一帮人工作,这变得非常重要。...英文原文: https://www.quora.com/Why-did-Quora-choose-Python-for-its-development 译者: cmsl *声明:推送内容及图片来源于网络

    45600
    领券