浅谈大数据风控系统架构 - 潍坊市 - Powered by Discuz!NT Archiver

TUhjnbcbe - 2020/11/9 2:12:00

北京白癜风治疗的专科医院 http://m.39.net/pf/bdfyy/bjzkbdfyy/

前言

笔者公司的风控系统经过超过6年的发展和积累，在大数据实时计算和实时决策方面已经非常成熟，是整个业务稳定高效运行的基础。是基于大数据的一体化数据建模及智能决策平台，通过数据挖掘工具化、业务决策自动化来为多业务线提供便捷高效的数据应用平台。

本篇文章将从背景描述、风控架构变迁史、核心服务、总结四个部分对笔者公司的风控决策系统进行简述。

—

背景描述

作为一家互联网金融公司，与客户直接进行着货币的交易，通过率和坏账率是首要考虑的问题。通过率高能增加交易人数，坏账率的高低能直接影响公司的收益，两者都极为重要。然而随着互联网金融的大潮兴起，申请的人数越来越多，申请人因各种原因逾期不还的的现象多次发生，有组织、有规模的团伙欺诈行为屡见不鲜，给公司造成不可估量的损失。大数据下的互联网金融行业所面临的挑战：大数据风控系统在时代的大背景下应运而生。增加通过率，降低坏账率是风控系统创建之初的使命。金融风控也在与其博弈的过程中不断优化、强大。

—

风控架构变迁史

最初架构

在公司创建之初，为了快速支持线上业务运行，并没有采用大数据相关技术来参与到风控系统的架构中，而是采用了大家更为熟悉的web架构，随着业务量的不断增加，该系统的弊端也不断显现出来，甚至于到后期已经不能正常支撑业务的正常运行。风控1.0系统架构图：

通过风控1.0的系统架构图可以看出：

使用sqlserver存储，前期快速支持业务确实非常方便，但是到后期海量数据存储时，显得力不从心。

决策使用到的大量用户行为特征变量都是通过存储过程计算，涉及到复杂的逻辑，计算效率非常低下。

风控策略与业务强耦合在一起，经常会出现一些由于代码混乱而引起的线上故障。新参与的员工学习成本大。策略是风控的核心，必然存在风控安全的风险。特别对于金融行业，这是不可容忍的。

由于风控1.0系统存在种种弊端，已经不能正常支撑线上业务，风控系统迎来了一次完全的重构。

新系统的机构、设计复杂度、预处理能力也充分考虑了公司的业务发展预期。经过新的重构，以及后面不断的迭代更新，到目前为止，系统已经稳定支撑千万级用户流量的运行、海量数据的存储及分析。

潍坊市论坛