也从原来基于“简单规则+DB”,发展到目前能够支撑10X交易增长的智能化风控系统,基于规则引擎、实时模型计算、流式处理、M/R、大数据、数据挖掘、机器学习等的风控系统,拥有实时、准实时的风险决策、数据分析能力...主要分三大模块:风控引擎、数据服务、数据运算、辅助系统。 风控引擎:主要处理风控请求,有预处理、规则引擎和模型执行服务,风控引擎所需要的数据是由数据服务模块提供的。...数据运算所需的数据来源主要是:风控Event数据(订单数据、支付数据),各个系统采集来的 UBT、设备指纹、日志数据等等。 除了这些,风控平台还有非常完善的监控预警系统,人工审核平台以及报表系统。...由于携程的业务种类非常多,而且每种业务都有其特性,在进入风控系统(Aegis)后,为了便于整个风控系统对数据进行处理,风控前端有一个适配器模块,把各个业务的数据都按照风控内部标准化配置进行转换,以适合风控系统使用...在完成数据适配后。风控系统要进行数据的合并。举个例子,当有一笔支付风控校验,支付BU只抛过来支付信息(支付金额、支付方式、订单号等)。
摘要:本文作者彭明德,介绍了钱大妈与阿里云 Flink 实时计算团队共建实时风控规则引擎,精确识别羊毛党以防营销预算流失。...钱大妈与阿里云 Flink 实时计算团队共建实时风控规则引擎,精确识别羊毛党以防营销预算流失。...图一:钱大妈实时风控流程示意图 二、业务架构 钱大妈风控业务架构如图二所示总共分为四个部分:事件接入、风险感知、风险应对、风险回溯。...图四:实时风控规则配置业务逻辑简图 四、难点攻坚 针对规则模型的流式序列型数据,我们选择 Flink CEP 处理事件序列匹配,由于我们整个风控作业使用 Flink 实现,并且 Flink CEP 作为...图六:社区Flink动态CEP规则表 五、回顾展望 基于 Flink 的实时风控解决方案已接应用于钱大妈集团内部生产环境,在此解决方案里未引入新的技术组件和编程语言,最大化复用 Flink 资源实现实时风控场景需求
性能和复杂度可以兼得 携程的风控系统,和大部分第三方支付平台一样,也是以实时风控系统为主: 支付环节一般留给风控校验的时间不会超过1s,业务风控点上更是希望风控能在100ms内就能通过;对性能的追求,也是对极致用户体验的追求...在实时风控场景里大量部署复杂模型,使模型也能和规则一样能直接拒绝交易;平均来看、执行一个模型以及相关的变量计算所需的资源可能与200条普通规则相当,对系统的架构和性能都是很高的挑战。...每天风控收集上来的数据超过50亿条,其中超过1亿左右的请求需要风控实时校验风险并返回给业务系统当前操作是否可以继续。...用户从登录开始风控就已经开始在介入,在用户浏览、下单的过程中,对这个用户的风险评估和计算一直在持续,等到用户发起支付请求时,风控的热数据里已经有了完整的关于这个用户画像数据,风控引擎可以在这些数据的基础上实时计算和衍生出规则和模型需要的变量...基于此目标,研发了CDNA服务,通过对所有流经风控的数据进行多维度的无限极收敛关联,把同一个人的数据聚合在了一起;CDNA服务每天处理超过100TB的数据。
「13章」Flink 从0到1实战实时风控系统Flink 核心技能实操环境搭建在进行 Flink 开发之前,需要先搭建好开发环境。...,对数据进行处理(分割单词、计数),最后打印结果并执行任务。...数据分区策略优化选择合适的分区策略:Flink 提供了多种数据分区策略,如随机分区、轮询分区、哈希分区等。根据数据的特点和业务需求选择合适的分区策略可以避免数据倾斜问题。...:数据倾斜会导致部分任务处理的数据量过大,从而影响整个任务的性能。...可以通过预处理数据、使用两阶段聚合等方法来解决数据倾斜问题。内存管理优化合理配置堆内存和堆外内存:Flink 使用堆内存和堆外内存来存储数据和执行计算。
也从原来基于“简单规则+DB”,发展到目前能够支撑10X交易增长的智能化风控系统,基于规则引擎、实时模型计算、流式处理、M/R、大数据、数据挖掘、机器学习等的风控系统,拥有实时、准实时的风险决策、数据分析能力...图1 主要分三大模块:风控引擎、数据服务、数据运算、辅助系统。 风控引擎:主要处理风控请求,有预处理、规则引擎和模型执行服务,风控引擎所需要的数据是由数据服务模块提供的。...数据运算所需的数据来源主要是:风控Event数据(订单数据、支付数据),各个系统采集来的UBT、设备指纹、日志数据等等。 除了这些,风控平台还有非常完善的监控预警系统,人工审核平台以及 报表系统。...由于携程的业务种类非常多,而且每种业务都有其特性,在进入风控系统(Aegis)后,为了便于整个风控系统对数据进行处理,风控前端有一个适配器模块,把各个业务的数据都按照风控内部标准化配置进行转换,以适合风控系统使用...在完成数据适配后。风控系统要进行数据的合并。 举个例子,当有一笔支付风控校验,支付BU只抛过来支付信息(支付金额、支付方式、订单号等)。
摘要:本文整理自阿里云开发工程师耿飙&阿里云开发工程师胡俊涛,在 FFA 实时风控专场的分享。...我们这里展示三个典型场景: 第一个场景,实时风控。...我们假设客户的行为日志会被存放入消息队列 Kafka 中,Fink CEP 作业会消费 Kafka 数据,同时会去轮询 RDS 数据库中的规则表,拉取策略人员添加到数据库的最新规则,并用最新规则去做事件匹配...针对匹配到的事件,Flink CEP 作业会发出告警或将相关信息写入其他数据存储中,整体数据链路如上图所示。...然后准备好数据库相关内容,在 RDS 控制台创建 database。 注意在配置好之后,我们要在数据库连接中设置白名单,来保证我们的 Flink 全托管实例能访问 RDS 数据库。
这要求风控系统一定要有实时性。本文就介绍一种实时风控解决方案。 1.总体架构 风控是业务场景的产物,风控系统直接服务于业务系统,与之相关的还有惩罚系统和分析系统,各系统关系与角色如下: ?...该系统有三条数据流向: 实时风控数据流,由红线标识,同步调用,为风控调用的核心链路; 准实时指标数据流,由蓝线标识,异步写入,为实时风控部分准备指标数据; 准实时/离线分析数据流,由绿线标识,异步写入,...2.1 实时风控 实时风控是整个系统的核心,被业务系统同步调用,完成对应的风控判断。 前面提到规则往往由人编写并且需要动态调整,所以我们会把风控判断部分与规则管理部分拆开。...前边提到,做规则判断需要事实的相关指标,比如最近一小时登陆次数,最近一小时注册账号数等等,这些指标通常有一段时间跨度,是某种状态或聚合,很难在实时风控过程中根据原始数据进行计算,因为风控的规则引擎往往是无状态的...Flink 把汇总的指标结果写入 Redis 或 Hbase,供实时风控系统查询。两者问题都不大,根据场景选择即可。
导语 随着部门在业务安全领域的不断拓展,围绕着验证码、金融广告等服务场景,腾讯水滴作为支撑业务安全对抗的实时风控系统,上线的任务实时性要求越来越高,需要支撑的业务请求量也随之增加。...对于业务快速上线和资源快速扩缩容的需求,且公司自研上云项目往全面容器化上云方向推进,水滴风控平台开始进行自研上云的改造。...水滴后台架构 水滴平台主要是用于业务安全对抗的高可用、高性能、低延时的实时风控策略平台,提供一系列的基础组件给策略人员进行构建策略模型,能够帮忙策略人员快速地完成策略模型的构建和测试验证。...水滴系统架构如下图所示: 水滴实时风控平台系统主要由配置处理模块和数据处理模块两部分组成。 配置处理模块主要由前端 web 页面、cgi 、mc_srv 和 Zookeeper 等组成。...维度: 是指标数据的属性,通常用例过滤指标数据的不同属性。 维度属性采用指标数据中能够进行统一抽象的特性,如实例 IP、任务号、组件 ID、指标状态等维度,无法抽象成维度的属性则作为指标属性。
12月1日晚间,卓翼科技(002369.SZ)发布公告称,公司控股股东、实控人夏传武因涉嫌内幕交易、操纵证券市场罪,经深圳市中级人民法院批准,于12月1日被深圳市公安局执行逮捕。...资料显示,夏传武生于1973年,2004年起任职卓翼科技,2014年初成为卓翼科技实控人。而夏传武被抓主要以与2018年公司重组期间内幕交易有关。
本篇更新策略篇的规则集性能测算及Python实操,内容选自《100天风控专家》第57期。 首先介绍规则集的完整分析流程,包括五个步骤。 一、规则集分析流程 1....三、案例分析Python代码实操 通过配置决策树参数以及入模变量数量,自动化生成规则100多条,通过规则评估指标如命中率、精准率、召回率、lift进行初步筛选,组成为规则集进行初步的性能测试。...-end- 以上内容节选自《100天风控专家》从0到1的信贷风控训练营
陈建平,后台开发工程师,现就职于TEG安全平台部-业务安全中心,主要负责中心实时策略风控平台开发。...导语 随着部门在业务安全领域的不断拓展,围绕着验证码、金融广告等服务场景,腾讯水滴作为支撑业务安全对抗的实时风控系统,上线的任务实时性要求越来越高,需要支撑的业务请求量也随之增加。...对于业务快速上线和资源快速扩缩容的需求,且公司自研上云项目往全面容器化上云方向推进,水滴风控平台开始进行自研上云的改造。...水滴后台架构 腾讯水滴平台主要是用于业务安全对抗的高可用、高性能、低延时的实时风控策略平台,提供一系列的基础组件给策略人员进行构建策略模型,能够帮忙策略人员快速地完成策略模型的构建和测试验证。...水滴系统架构如下图所示: 水滴实时风控平台系统主要由配置处理模块和数据处理模块两部分组成。 配置处理模块:主要由前端 web 页面、cgi 、mc_srv 和 Zookeeper 等组成。
万达网络科技集团的技术团队,建设和维护着一套实时风控平台。这套实时风控平台,承担着各种关键交易的在线风控数据的写入和查询服务。...实时风控平台后端的数据库系统在高性能,可靠性,可扩展性上有很高的要求,并且需要满足如下核心功能和业务要求: 风控相关业务数据实时入库 实时风控规则计算 通过 BI 工具分析风控历史数据 ETL 入库到...Hadoop 数据仓库 应用开发侧需要兼容 MySQL,降低应用改造门槛为实现上述业务目标,万达网络科技集团的技术团队在实时风控数据库选型的早期阶段,首先选择了 MySQL Galera Cluster...这些问题集中反映在以下几个方面:最终万达的技术团队,通过评估验证,选择了 TiDB 帮助他们实现一个高性能,高可靠性和高扩展能力的实时风控平台后台数据库系统。...在实时风控平台的高并发高性能的对外服务过程中,在线灵活扩容的相关工作在 MySQL Proxy 中间件架构中无法高效和可靠的实施。
早期传统金融的风控主要利用了信用属性强大的金融数据,一般采用20个维度左右的数据,利用评分来识别客户的还款能力和还款意愿。...结合中国互联网发展,以及目前的征信监管要求,对可用数据及可用风控类数据做一个全面的梳理。...2.风控数据来源 2.1 数据应用逻辑 常见风控流程中,客户准入时提供的资信材料有限,业务机构风控数据体量不足,仅仅根据内部风险数据进行风险评估会非常片面,无法全面的把控某位客户的风险情况,所以通常需要依赖于第三方供应商提供数据作风控支撑...2.3.2.3 订单信息 名单编号;借款金额;服务费;实放金额;放款状态;放款失败原因等。...4.2 明确需求 建议:回顾第二节数据应用逻辑关于业务类型、风险类型、风控流程、风险画像等的介绍。
一、什么是数据权限? 数据权限是指对系统用户进行数据资源可见性的控制,通俗的解释就是:`符合某条件的用户只能看到该条件下对应的数据资源`。那么最简单的数据权限大概就是:用户只能看到自己的数据。...如: 领导需要看到所有下属员工的客户数据,员工只能看自己的客户数据; 角色A能看到全国的产品数据,角色B只能看到上海的产品数据; 二、数据权限控制的背后机理? ? 三、如何实现数据权限控制?...数据行级权限 当我们希望东北大区的销售人员只能看到“东北”地区的数据,我们可以建立一个“数据行级权限”,然后设置数据访问权限,只允许该角色成员访问“东北”地区的数据,然后将该“数据行级权限”赋予东北大区的销售人员即可...根据用户的属性来进行数据行级权限管控 试想这样一种场景,我们的公司在“东北、华北、华东、华南”四个大区都有销售人员,我们希望不同大区的销售访问同一张报告时候只能看到自己所属大区的数据,用“数据行级权限”...可以实现这样的需求,我们可以创建4个“数据行级权限”,每个“数据行级权限”只能访问一个大区的数据,然后给不同大区的销售人员分配对应的“数据行级权限”。
最近接触到数据管理、数据治理、数据管控,三个数据相关的专业词汇,对于他们的理解,也是不断加深中。...在当下,政府的数据治理能力就是指政府机构对影响各类政府决策、管理社会各项事务的过程中产生的数据以及在遇到突发性事件时利用数据分析事件原因、预知事件发展方向和趋势,并对事件进行有效管控的能力。...政府对数据的掌控能力、运用能力,是处理好公共事务的前提,也是预防和应对突发事件,尤其是对突发事件进行前端物理控制和后端舆论防控的基础。...在数据生命周期的各个阶段(产生、处理、存储、应用、归档直至删除),企业必须完全按照组织的业务需要进行处理、管控、保护和共享, 我们在工作中常见的几个名词,数据管理、数据治理、数据管控,这三者概念有重合...3、数据管控 范围更大一些,数据管控可能会根据企业实际情况,进行数据质量管控、元数据管控等某些方面的管控,感觉更多是偏向技术和执行层面。既管理,又控制,就像理论和实践的结合。
精是指这类借款、还款、违约的历史数据,对于风控建模来说,会是最有用的一块数据,因为历史借贷信息实打实地反映了一个人的信用情况。 f:如果有了非常新鲜的鱼,简单地蒸一下就会非常美味。...◆◆◆ 4.风控机构在大数据领域的探索 我们所说的"大数据"并非指绝对的样本量的巨大,而是把常规的信贷征信数据以外的信息统一称为"大数据"。...◆◆◆ 5.大数据风控在中国的机遇 最近10年,以个人信用卡为代表的个人贷款业务在中国有了蓬勃的发展。我国的信用卡交易和风控系统在初期大量借鉴了国外的经验。银联的第一代系统是与VISA合作完成的。...没有征信数据,那套国外搬过来的基于征信数据的方式方法就不管用了。 聪明的人马上意识到,相比国外,由于中国的征信体系的不完善,基于大数据的风控的土壤实际上更成熟,更有的做。...大数据风控的挑战 伴随着机遇同样也有挑战。就像要有美味的菜肴,我们既需要好的材料,也需要好的厨师,当前大数据在风控中运用的挑战主要还是在数据和人才这两方面。
数据结构实训作业(I) 于2020年10月8日2020年10月8日由Sukuna发布 第一关 本关任务:已知顺序表L中的数据元素递增有序,数据元素类型为int。...= L) { /*L中奇数个数据插入Lnew*/ q = p->next;//保留 L 链表...= L) { /*L中偶数个数据插入Lnew*/ q = p->next;//保留 L 链表
数据结构实训作业(III) 于2020年10月13日2020年10月13日由Sukuna发布 第一关 本关任务:编写一个算法,将数组A中的n个元素A[0]至A[n-1]循环右移k位。...****************/ } 第二关 矩阵加法,矩阵的形式是三元组顺序表 我先写个函数,表示矩阵的插入(往后插),接着就对A和B进行遍历,如果行列值不一样,就插入行列值较少的数,i和j是两个数据指针
数据采集是指识别数据源、收集原始数据并将其传输或存储到可以处理的地方的过程。它是整个数据价值链的起点。...数据分析是指对采集到的数据进行清理、转换、建模、探索和解释,以发现有用的信息、得出结论并支持决策的过程。它是将原始数据转化为洞察力的关键步骤。...“数据采集”和“数据分析”是现代数据驱动决策的核心环节,它们紧密相连,共同构成了从原始信息到有价值见解的完整链条。...下面我将通过实际代码示例,展示数据采集(API获取、网页抓取)和数据分析(数据清洗、探索性分析、可视化)的全流程操作。...理解这两个环节及其紧密联系,对于任何希望利用数据驱动发展的个人或组织都至关重要。数据采集为你铺好道路,数据分析则为你点亮明灯,共同引领你走向更明智的决策。大家想了解数据采集或数据分析的某个具体方面吗?