会议详情
背景
数据创造价值!大数据,机器学习与人工智能等技术蓬勃发展的今天,深刻改变了许多传统行业的盈利和营销模式。
由示说网发起的上海“大数据技术汇”线下交流活动,致力于为工程师和研发人员提供公益、公平、和谐、友好的线下技术交流平台,让技术小伙伴以最直接的方式,了解大数据技术栈内各种理论、代码、产品、技术、案例和最佳实践等,在分享、探讨中学习并推动大数据技术发展,更好的服务于产业领域,挖掘数据价值。
本次活动由创略科技赞助,邀请来自英特尔,Juicedata,eBay以及创略科技的资深工程师同行,一起来探讨大数据存储、计算、存储计算分离,大数据计算架构实践和企业级客户大数据技术解决方案话题。
议程安排
13:00 - 13:30 ········· 活动签到
13:30 - 13:40 ········· 活动开场白
13:40 - 14:20 ········· CDP智能客户数据平台实践经验分享
14:20 - 15:00 ········· 存储变迁与趋势,Optane SSD引领数据存储革新
15:00 - 15:30 ········· 茶歇&自由交流
15:30 - 16:10 ········· JuiceFS - 打造下一代云原生大数据存储方案
16:10 - 16:50 ········· eBay的大规模数仓优化
主讲嘉宾
议题及嘉宾介绍
议题一:CDP智能客户数据平台实践经验分享
王军:创略科技CTO,之前历任阿里巴巴集团大数据营销部阿里妈妈研发总监,优酷土豆研发主管,专注于机器学习,微软中国带头微软下载中心的平台项目,并在美国微软总部参与核心在线产品研发,因卓越的研发和管理能力而获得Future Star Award和IT Pro Award。
内容简介:创略科技是一家数据及AI技术公司,旗舰产品是智能客户数据平台(CDP),主要是通过客户数据采集、打通、分析和激活,基于AI及机器学习算法模型,运用于个性化营销、精细化客户运营、沉睡客户唤醒、交叉销售、客户体验提升、智能分析等场景。本次分享会介绍我们的CDP平台的技术架构及部分典型品牌客户的一些实践经验。
议题二:存储变迁与趋势,Optane SSD引领数据存储革新
陈宸仲:英特尔存储解决方案组高级方案架构师,中国区行业客户BDM,曾担任英特尔IT私有云全球产品经理,7年的数据中心从业经验。
内容简介:随着数据大爆发时代的到来,基于CPU/GPU为计算核心的企业级数据中心,面临数据需要更靠近计算的急迫需求。存储在过去几十年始终被认为是一种低速,远离计算的组件,但在SSD的面世和加速推广的过程中,这一切慢慢在发生着改变。本次分享将介绍存储器的历史及其发展趋势,基于英特尔傲腾技术的SSD如何改变着数据中心存储架构,以及针对大数据计算框架部署和设计的最佳实践参考。
议题三:JuiceFS - 打造下一代云原生大数据存储方案
刘洪清:Juicedata 创始人和 CEO,JuiceFS 的作者,前 Databricks 和 Facebook 员工,Apache Spark 的核心贡献者(Committer)。前豆瓣早期员工,Beansdb 和 DPark 的作者。热衷于分布式存储和计算系统,十年的分布式存储设计和研发经验。
内容简介:公有云的弹性和服务化是它最吸引人的地方,在云上构建的大数据平台的基本还是照搬了传统机房的架构,因为公有云提供的对象存储不能有效满足大数据平台对存储的需求。本次分享会介绍下目前公有云中的大数据存储方案的优缺点,以及我们是如何打造 JuiceFS 来解决这些问题的。
议题四:eBay的大规模数仓优化
俞育才,eBay大数据架构师,负责Spark数据平台的设计与优化。12年软件开发经验,Apache Spark的活跃开发者,熟悉系统软件的性能分析与调优。在加入eBay之前,俞育才在英特尔工作了9年,领导团队研究各种前沿的硬件技术加速云和大数据计算。
内容简介:eBay的数仓系统拥有60PB的数据,上万张的核心表,他们支撑着eBay最核心的商务逻辑和站点功能。从2017年开始,我们将这个庞大的数仓向Spark做迁移。在这个过程中,我们面临着很大的内存,性能方面的压力,这次分享会介绍我们使用的两个关键优化技术:Adaptive Execution和Indexed Bucket,他们帮助我们节省了一半的内存。
合作伙伴
确认
3秒后跳转登录页面
去登陆