申请试用
HOT
登录
注册
 
BlazingDB: Data Lake to AI on GPUs
BlazingDB: Data Lake to AI on GPUs

BlazingDB: Data Lake to AI on GPUs

献良
/
发布于
/
4819
人观看

BlazingSQL是基于GPU加速的SQL引擎,它运行在RAPIDS生态之上,RAPIDS是一个基于Apache Arrow的列式内存格式,cuDF是GPU DataFrame库,利用来加载,连接,聚合,过滤以及其它的数据操作。BlazingSQL是cuDF对外的SQL接口,包含大量的特性,来支持大规模的数据科学工作流和企业级的数据集操作:

  • 查询数据存储在外部:一行简单的代码就可以把远程比如Amazon S3的数据注册进来,类似与Spark的数据源API;
  • 简单的SQL:非常简单的SQL,可以基于GPU DataFrames(GDFs)来运行SQL查询和存访结果;
  • 协同性:GDFs对RAPIDS库完全开放,可以很简单的基于GDFs来完成数据科学分析业务;
3点赞
0收藏
26下载
确认
3秒后跳转登录页面
去登陆