- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
AliGraph:大规模图神经网络平台
AliGraph:大规模图神经网络平台
PAI机器学习平台介绍
深度神经网络面临的两个问题
常见的图计算
GNN的应用 – 分类
……
展开查看详情
1 .AliGraph:大规模图神经网络平台 李永(九丰) 阿里巴巴资深技术专家 计算平台事业部
2 .PAI机器学习平台介绍 https://data.aliyun.com/product/learn 简单易用 功能强大
3 .PAI机器学习平台介绍
4 .PAI机器学习平台特性 一站式 STOA 精心优化的 弹性 机器学习平台 机器学习算法 深度学习引擎 模型预测服务 数据处理,特征加工 经典机器学习 简化模型部署负担 阿里内部大规模任务打磨, 模型训练,在线预测 阿里自研算法 支持扩缩容,降低成本 PAI-Tensorflow引擎 兼顾离线&实时
5 .深度神经网络面临的两个问题 模型可解释性 难以理解模型特征以及决策逻辑 缺少数学工具来评测网络的表达能力 因果关系推理 美国增加关税会影响中国GDP吗 博士毕业的薪水会比硕士要高吗?
6 .图 G = (V, E) V = Vertex E = Edge 同构图 异构图 有向图 无向图
7 .常见的图计算 图数据库 Neo4J,Titan 实时图分析查询 Aliyun GraphCompute, Amazon Neptune 离线图处理 Pregel, PowerGraph, Spark GraphX
8 .图+深度学习 = 图神经网络 非规则化的数据 Graph Embedding
9 .图神经网络的应用领域 社交领域 推荐领域 知识图谱 生命科学 反作弊 线上支付
10 .GNN的应用 – 分类
11 .GNN的应用 – 关系预测
12 .GNN大规模应用的四大挑战 规模庞大 点边异构 属性丰富 动态变化 数百亿甚至数千亿点, 同构、异构、 点属性,边属性 节点、边的增删更新 数千亿甚至数万亿的 多边、多属性 边
13 .AliGraph:大规模GNN平台 采样&建模&训练一体化 的GNN平台
14 .AliGraph系统架构
15 .AliGraph编程范式
16 .AliGraph编程范式 sample aggregate combine
17 .AliGraph五大特点 大规模 分布式 稀疏内 自创 线性 图存储 采样 核优化 SGCN 扩展
18 .基于内存的图存储 • 分布式的图存储 • 支持百亿点的规模,可伸缩 • 基于Vertex Cut的分片 • Worker基于出入度的缓存优化
19 .缓存效果 比随机方法快40%-50%, 缓存加速: 比LRU方法快50%-60% 缓存加速:比随机方法快40%-50%,比LRU方法快50%-60%
20 .分布式采样 • 支持丰富的采样策略 • 支持多跳的采样功能 • 毫秒级的采样性能 • 模块化的采样设计 • 本地/全局的负采样
21 .稀疏内核优化 加速原始版本GCN达 3x!
22 .自创SGCN
23 .分布式扩展 去中心化 Distribute Negative Sampling 多机异步训练
24 .AliGraph API 以点为中心 边表混合 采样&建模&训练一体
25 .如何使用
26 . 扫码加入社群 与志同道合的码友一起 粘贴二维码 Code Up 阿里云开发者社区
27 .谢谢!