- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 视频嵌入链接 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
基于人工智能和复杂网络的实时反欺诈风控解决方案
错过5月15日星环科技2020春季新品发布会的你,又有上船的机会啦,5月19日起,开启新品深度解读系列直播!还等什么?
第六讲 基于人工智能和复杂网络的实时反欺诈解决方案深度解析
分享时间:7月3日 15:00-16:00(线上直播)
分享嘉宾:张晓明 星环科技金融架构总监
分享内容:想要更好地做反欺诈?基于人工智能和复杂网络的实时解决方案来一套。
当前金融业的欺诈风险正在发生变化,欺诈风险的表现形式也越来越复杂多样,套现、伪卡、薅羊毛等层出不穷。
为了更好地识别、量化、预测和防范欺诈风险,星环科技结合自己的产品技术优势和在金融业多年的落地经验积累,推出了一款全栈式的智能反欺诈系统解决方案——“基于人工智能和复杂网络的实时反欺诈风控平台”。
本方案经过多家银行、消费金融和保险机构的落地后,形成了事中可实时、量化可解释、智能可预测、图谱可洞察四大特色。
7月3日15点,不见不散!
更多新产品及解决方案深度解析敬请期待!
往期回看方式:关注“星环社区”公众号,点击菜单栏“直播回看——深度解读回看”即可无广告回看以往所有分享
展开查看详情
1 .基于人工智能和复杂网络的 实时反欺诈解决方案 星环科技 星 环 科 技
2 . 星 环 科 技 1 业务背景 目录 2 解决方案 CONTENTS 3 特色优势 4 典型案例
3 . 1 chapter 业务背景
4 .信贷风险演变 单人/单场 团伙/复杂 产业化/分 规模化/智 景欺诈 场景 工化 能化 社工库即暗网里的信息
5 .常见的欺诈场景 • 电信诈骗, 伪卡盗刷、 信 用卡套现、 撞库登录、 注 银 互 • 虚假身份, 薅羊毛, 多头 借贷等 册欺诈、 洗钱欺诈等 行 金 • 碰瓷诈骗、 虚假事故骗保、 保 电 • 刷单, 虚假商户, 薅羊毛, 内外串通、 带病投保、 虚 险 商 异常退单等 假身份等 星 环 科 技
6 .欺诈风险分类 风险分类 商户欺诈 大额交易 多笔交易 账户盗用 异常转账 电信欺诈 黑灰名单 媷羊毛 异常登录 交易次数 单笔或累计 同人交易 改信息后 首次非同名转账、 多次注册账号 异常 金额超常 笔数异常 大额转账 限额取现 交易时间 交易金额 同卡同商户笔 连续网银 转账笔数、 注册失败 异常 大于平均值 数异常 限额转让 金额超常 次数较多 非营业时间 连续输错 连续网银 相同IP 疑似套现 大额交易 卡密码 限额转账 多次注册 单笔或累计金 非习惯位置、 额异常 时间交易 ©Transwarp Confidential 6
7 . 2 chapter 平台解决方案
8 .业务系统架构 三方 规则 二、实时事中分析 &模 流程 业务 1. 业务系统通过 Kafka供数 数据 Kafka 服务 型 三、风险处置与管理 系统 2. 特征化,补齐衍生特征 3. Slipstream流式计算 1. 管理员按照流程定义处理 4. 决策引擎规则利用 2. 风险标记后记录数据库 • 画像、外部黑名单等 3. 展现平台产生大屏和报表 • 关联分析、预测结果 决策引擎 历史 流引擎 TDT/Sqoop 特征化 风险管理 报警 数据 Slipstream 规则+预测+ 关联分析 反馈 一、离线机器学习 1. 数据接入工具获取数据 交易 画像 2. 特征化,补齐衍生特征 数据 系统 3. 数据存储到数据仓库中 报表 4. 画像系统对个人行为画像 离线分析 5. 利用Sophon进行离线分析 6. 根据分析的结果包括 风险 • 异常数据的特征 基线+异常 大屏 数据 • 规则参数的建议值 +聚类+决 • 用于预测的模型 策树 星 环 科 技
9 .风控模型架构 人工审核 无label的交易 带label的交易 无监督 知识图谱推 有监督 专家规则 理 异常识别 树推理规则 业务标记 关系 团伙 异常频繁规则 分类预测 规则触发 异常 发现 规则推理 梯度提升树模型 频繁模式挖掘 输出异常评分 RF、GBDT、 知识图谱及推理 专家规则提取组合 Xgboost 异常检测算法(LOF + Isolation Forest) 模型算法 特征工程 特征工程(横向变换,纵向压塑,横向组合) 各类关系图谱整合 专家规则指标梳理 数据清洗、统计、整合 数据处理 多系统数据源 申请数据 交易数据 行为数据 外部数据
10 . 2.1 chapter 平台解决方案基础—— 数据
11 .数据是开展风控的基础 静态数据 关注名单&公共信用数据 性别、年龄 高、中、低风险关注名单 籍贯、户口 法院名单数据 资产情况 欠税数据 设备指纹 公安犯罪通缉名单 交易数据 行为数据 交易笔数 APP登录行为 交易金额 APP操作行为 交易时间 交易类型 2020/7/6 © 2019 Transwarp. All rights reserved. Transwarp Confidential. 星 环 科 11 技
12 .风控多维度数据 风险号码识别 征信&信贷数据 虚假号码 人行征信数据 通信小号 网贷平台信息查询 中介号码 互金协会信息查询 信贷逾期 IP地址画像 多头申请 代理IP VPN识别 IP地址类型 地址真实性 电商快递地址 位置解析服务 大数据整合 家庭住址 手机号归属地 单位地址 IP归属地 身份证归属地 数据采集服务 智能定位 运营商信息 GPS位置信息 黑名单服务 社交信息 基站定位 网购交易数据 支付黑名单 经纬度解析地址 社保公积金数据 欺诈黑名单 水电煤 公检法失信人 ©Transwarp Confidential 12
13 .数据探索与分析 数据探索 结构化信息异常 宽度 关系网络信息异常 深度 { } 交易 交易 团伙 交易 X 静态 X 窗口 X X 链路 网络 挖掘 异常 正常 • 多维度、多粒度特征 • 黑灰团伙发现能力,高可泛化性 • 高拓展性 • 不易被探知、攻击 • 快速发现和处置 • 高可解释性,易于新模式发现
14 . 2.2 chapter 平台解决方案核心—— 算法
15 .人工智能产品Transwarp Sophon 应用场景和模板 Usage Scenarios, Templates and Example Models Classification Maintenance Object Track IoT Realtime Recognition Monitoring 预 Marketing Sentiment Intelligent Extraction Predictive Detection Sequence Semantic Profiling 测 时 实 异 精 用 流 智 以 目 视 图 文 智 主 语 情 Analysis Analysis Analysis Analysis Analysis Moving Search Target 性 序 时 常 准 户 失 能 图 标 频 像 字 能 题 义 感 Image Image Churn Video Fraud Topic Q&A User OCR 维 分 监 识 营 画 预 风 搜 追 识 分 识 问 分 搜 分 Risk 护 析 控 别 销 像 警 控 图 踪 别 类 别 答 析 索 析 Sophon Web – 交互式建模工具 Interactive Modeling Environment 数据探索 数据预处理 特征工程 智能建模 模型训练 模型部署 Data Exploration Data Preprocessing Feature Engineering Auto Modeling Model Training Model Publish/Manage Sophon Modules – 功能子模块 Functionality Modules as Plugins Sophon CV Sophon DL Sophon ST Sophon TM Sophon GA Sophon KG Sophon IoT Sophon VI 视频图像模块 深度学习模块 智能标签模块 智能营销模块 图分析模块 知识图谱模块 物联网模块 可视化模块 Computer Vision Deep Learning Smart Tagging Target Marketing Graph Analysis Knowledge Graph IoT Suite Visualization Sophon Base - 核心基础模块 Core Methodology, Frameworks & Algorithm Libraries 统计算法库 机器学习算法库 深度学习算法库 Statistics Algorithms Library Machine Learning Algorithms Library Deep Learning Algorithms Library 远程SQL访问接口 分布式计算引擎 深度学习计算框架 图分析接口 SQL Access Distributed Computation Engine Deep Learning Framework Graph Analytics API Transwarp Operating System (Embedded Edition) – Container Execution and Management Framework
16 .建模流程图形化拖拽 参数面板 算子面板 数据集 预处理与特征提取 模型训练和验证 预测 数据导入 数据探索 数据预处理 特征工程 模型训练 性能验证 模型部署
17 .分布式并行计算框架——集合百余种金融数据处理算子 HDFS(ORC、Parquet等数据格式)、HBase、ES、本地文件(csv、json等数 基础能力:支持多种优化算法包括Parallel SGD以及FTRL。算法参数可配置。 数据接入 据格式)、MySQL、DB2、Oracle等。 特征权重:WOE、GINI、INFO、PCA等。 一元变量特征统计(均值、方差、类型数等)、二元变量特征统计(皮尔森 数据探索 预处理:PCA、SVD、DCT离散余弦变换、乔列斯基矩阵分解、LOF异常点检测 卡方、自由度等) 等。 数据清洗:缺失值填充(平均值、最大值、最小值、中位数等) 分类算法:逻辑回归、支持向量机SVM、朴素贝叶斯、决策树分类、随机森林 数据集成:支持包括数据库,文本,大数据平台在内各个数据源的数据集成, 分类、梯度提升树分类、KNN分类、多层感知机分类、Boost分类、基于 通过数据实体、属性对齐等方式构造统一的数据视图。 XGBoost的分类 数据变换:数据属性转换、新属性生成。 回归算法:线性回归、广义线性回归、决策树回归、随机森林回归、梯度提升 预处理 数据规约:数据属性的归一化工具(min-max归一化、标准归一化、max- 树回归、基于XGBoost的回归、保序回归、生存回归 abs归一化等 聚类算法:支持Kmeans,Dbscan,二分Kmeans、GMM等 自动化预处:自动填充数据、自动清理数据、自动数据转换以及自动数据归 关联规则:支持FP-Growth、PrefixSpan和Aprioi等 建模算法 一等。 推荐算法:支持ALS、FM因子分解机、ItemCF、UserCF等 基本特征转化:特征变换、特征重要性评估、特征选择、特征生成等,包括 时序分析:支持自回归AR、差分自回归移动平均过程ARIMA等 特征工程 且不限于归一化、标准化、离散化、one-hot编码等 深度学习:支持GPU可配置,包含多种神经层:Dense层、池化层、输入层、 自动化特征工程:自动特征变换、自动特征生成以及自动特征选择等。 输出层、卷积层、RNN层、LSTM层等 数据分割:按比例随机分配训练与测试集,交叉检验 自然语言处理:支持新词发现、分词、词频TF、逆文档词频IDF、命名实体识别、 分类评估:对于二分类,输出包括TP/TN/FP/FN的数目表格。对于多分类, Word2Vec、词库构建、LDA、词性标注、关键词抽取、自动摘要、情感分析、 模型评估 输出混淆矩阵 句子相似度、文档相似度、PSLA等 评估指标:KS、Lift、AUC、ROC、Precision、Weighted Recall、Recall、 图像处理:支持图片读取、图像展示、图像训练和图片存储等 FMeasure 强化学习:支持值迭代、策略迭代、DQN、Q-Learning、蒙特卡洛算法、 模型导入导出:支持4种以上模型的object以及PMML/JSON格式导出,导出 模型管理 SARSA、DDPG、A3C、A2C、PPO等 位置位于数据库、HDFS等
18 . 2.3 chapter 平台解决方案落地—— 决策引擎FIDE
19 .实时智能决策流程 离线训练 在线预测 离线数据 (正样本&负样本) 实时数据 Transwarp FIDE (决策) 触发决策事件 指标平台 决策引擎 Transwarp Sophon(AI) PMML模型导入 智能决策 机器学习 深度学习 WebAPI进行模型调用 数据挖掘平台 在线预测结果 分类 聚类 回归 2020/7/6 星环机密 19
20 .实现专家经验+人工智能的双规决策模式 业务反馈,优化模型质量 模型构建 智能模型 借助人工智能发现数据中的隐藏关联关系 模型导入 业务指标定义&计算 统一智能决策 业务输入 业务应用 借助大数据技术实现 指标调用 依托数据,借助决策引擎 风险识别 实时指标计算能力 实现规则+模型自动化流程决策 辅助决策 策略定义 专家经验 业务策略 借助规则策略的积累完成业务中专家经验的沉淀 业务反馈,丰富业务规则
21 .实时处理 三方数据 社交数据 External data Social data 基础数据 交易数据 Basic data transaction data 实时性计算 行为数据 资产数据 增强实时信息的数据价值,满足. Behavior data 【动态化】 Asset data 数据采集加工 突破数据T+1壁垒,风险/交易/体验的升级 …… 结合历史数据和当前变更及新产生的相关数据,有效提升对风险行为、交易行为等的时效性, 优化用户体验 星 环 科 技
22 .围绕业务属性的规则与流程配置 实时规则执行 图形化配置 ▪ 多线程并行执行规则 ▪ 页面托拉拽创建决策流程 ▪ 毫秒级响应 ▪ 图形化追溯决策执行轨迹 多种决策模式 灵活线上维护 ▪ 多种模型组合应对复杂场景 ▪ 线上修改决策流程,条件阈值 ▪ 决策逻辑多粒度复用 ▪ 修改后实时生效 星 环 科 技
23 .界面化规则配置 ◼ 界面化配置方式: • 选取指标 • 定义阈值 • 判定逻辑 • 判定后的执行动作 ©Transwarp Confidential 23
24 .复杂决策流程配置 ◼ 流程 • 处理复杂决策过程 • 精准控制决策执行,提高效率、降 低成本 • 支持挑战者模式与灰度模式 ©Transwarp Confidential 24
25 .模型管理实现智能决策 AI模型生成智能指标 • AI模型导入 • 模型特征映射到统计指标, 创建智能指标 • 使用智能指标进行决策, 辅助专家规则 ©Transwarp Confidential 25
26 .决策流程可追溯 决策详情可以展现出决策运行的细节,包括执行的步骤顺序,节点的上下文,便于对决策进行回溯。 ©Transwarp Confidential 26
27 . 3 chapter 方案特色优势
28 .方案特色 实时 精准刻画风险程度 智能 深度洞察欺诈团伙 风险特征可解释 风险样本可扩展 有效支持线上业务 有效预测风险概率并预警 实现事中风控 风险模型可泛化 量化 图谱 ©Transwarp Confidential 28
29 .事中可实时 流式计算 秒批秒贷 日审单量 最低延时<20ms 最快3s/笔 峰值可达50万笔 实时 ©Transwarp Confidential 29