- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
国内大模型概览
展开查看详情
1 . 2023年3月7日 证券研究报告|行业专题 AIGC专题三:国内大模型概览 证券分析师 姓名:马笑 资格编号:S0120522100002 邮箱:maxiao@tebon.com.cn 0
2 .投资要点:国产大模型有望将迎来爆发式成长 自ChatGPT推出以来,国内学术界和科技企业相继宣布或将推出类似机器人对话模型,有望推动大模型发展。2月7日,百度官宣 “文心一言”。2 月 20 日,复旦大学发布了类 ChatGPT 模型 “MOSS”,并面向大众公开邀请内测,国产大模型有望迎来爆发式增长。 需求和政策两方面,合力推动AI产业增长。国内应用层面的需求推动AI产业的加速发展。根据IDC数据预测,2021年中国人工智能软件 及应用市场规模为51亿美元,预计2026年将会达到211亿美元。数据、算法、算力是AI发展的驱动力,其中数据是AI发展的基石,中国数据 规模增速有望排名全球第一。政策方面,“十四五”规划中提到“瞄准人工智能”,“聚焦人工智能关键算法”,加快推进“基础算法” 的“突破与迭代应用”;北京、上海、广州等城市发布相关规划。 头部企业采取“模型+工具平台+生态” 三层共建模式,有助于业务的良性循环,也更容易借助长期积累形成竞争壁垒。大模型 厂商主要包括百度(文心大模型)、腾讯(HunYuan大模型)、阿里(通义大模型)、商汤、华为(盘古大模型)等企业,也有智源研究 院、中科院自动化所等研究机构,同时英伟达等芯片厂商也纷纷入局。大模型增强了AI技术的通用性,助力普惠AI的实现。未来,大模型有 望于场景深度融合,配合专业工具和平台支持应用落地,开放的生态来激发创新,形成良性循环。 技术发展有望促进生产效率提升,并进一步创造新的消费和需求,有利于文娱内容和互联网行业。在AIGC和ChatGPT方面,我们 建议持续关注技术发展和应用情况,把握技术催化和商业化落地带来的投资机会:1)具备AIGC和ChatGPT的技术探索和应用的公司:百 度集团-SW、商汤-W、万兴科技、拓尔思等;2)具有海量内容素材且具有AIGC探索布局的,图片/文字/音乐/视频内容及平台公司腾讯控 股,阅文集团、美图公司、昆仑万维、汤姆猫、神州泰岳、视觉中国、中文在线、汉仪股份、天娱数科、风语筑等。 风险提示:技术发展不及预期、监管政策变化、知识产权等相关问题。 请务必阅读正文之后的信息披露及法律声明。 1
3 . 目录 CONTENTS 01 国内大模型发展 02 百度:文心大模型 03 腾讯:混元大模型 04 阿里:通义大模型 05 华为:盘古大模型 06 投资建议&风险提示 请务必阅读正文之后的信息披露及法律声明。 2 bVjVhVwWfYcWoOrNbRaObRmOrRnPpMkPoOsRjMrRrO8OnMpRxNoMtRvPqRrQ
4 .01 国内大模型发展 3
5 . 1.1 国内AI市场迅速发展,数据量增速或将全球第一 国内应用层面的需求推动AI产业的加速发展,或将带来市场的爆发性增长。 根据IDC数据预测,2021年中国人工智能软件及应用市场规模为51亿美元,预计2026年将会达到211亿美元。 数据、算法、算力是AI发展的驱动力,其中数据是AI发展的基石,中国数据规模增速或排名全球第 一。 据IDC统计,中国数据规模将从2021年的18.51ZB增长至2026年的56.16ZB,年均增长速度CAGR为24.9%,增速位居 全球第一。 图1:2021年-2026年,中国人工智能软件及应用市场规模预测 图2:2021-2026全球数据圈(单位:ZB) 25,000 50% 250 26% 30% 42% 25% 26% 25% 40% 23% 25% 20,000 40% 200 21% 22% 22% 21% 31% 20% 27% 100.84 20% 15,000 25% 30% 150 84.56 15% 21077.0 70.63 10,000 20% 100 59.28 58.99 10% 16801.1 49.72 42.19 48.58 12840.6 50 39.26 5,000 9160.4 10% 32.29 5% 21.77 26.52 56.16 5082.6 6467.8 35.64 44.46 18.51 22.73 28.37 0 0% 0 0% 2021 2022 2023 2024 2025 2026 2021 2022 2023 2024 2025 2026 中国 北美 其他地区 市场规模(百万美元) 同比(%) 中国同比增速(%) 全球同比增速(%) 资料来源:《2022中国大模型发展白皮书》,德邦研究所 资料来源:《2022中国大模型发展白皮书》,德邦研究所 请务必阅读正文之后的信息披露及法律声明。 4
6 . 1.2 国家政策的关注与引导有望推动AI产业发展 表1:部分人工智能相关政策梳理 发布时间 发布方 政策名称 相关内容 北京市经济和信息 《2022年北京人工智能产业发展 2023年2月 白皮书显示,北京持续保持人工智能领先优势。同时,北京将支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。 化局 白皮书》 坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,充分发挥人工智能赋能经济社会发展的作用,围绕构建全链条、 《关于支持建设新一代人工智能 2022年8月 科技部 全过程的人工智能行业应用生态,支持一批基础较好的人工智能应用场景,加强研发上下游配合与新技术集成,打造形成一批可复制、可推广的标杆 示范应用场景的通知》 型示范应用场景。首批支持建设十个示范应用场景。 《关于加快场景创新以人工智能 场景创新成为人工智能技术升级、产业增长的新路径,场景创新成果持续涌现,推动新一代人工智能发展上水平。鼓励在制造、农业、物流、金融、 2022年7月 科技部等六部门 高水平应用促进经济高质量发展 商务、家居等重点行业深入挖掘人工智能技术应用场景,促进智能经济高端高效发展。 的指导意见》 1)基本建成具有国际影响力的人工智能产业创新发展高地。加快培育人工智能龙头企业,形成10个以上百亿级细分领域产业集群,到2025年,上海 人工智能规上产业规模年均增长12%以上,达到4000亿元。2)基本形成与国际数字之都相适应的广泛深度赋能格局。到2025年,形成10大类100个人 工智能深度应用案例,培育500家智能化示范企业。3)基本建成创新活跃、开放协同的人工智能发展生态软环境。持续提升世界人工智能大会影响力, 上海市经济和信息 《上海市人工智能产业发展“十 2021年12月 完善人才链、资金链,集聚20个以上国际顶尖人工智能团队,建成20个左右人才培养与实训基地,完善人工智能产业人才梯队建设,力争到2025年上 化委员会 四五”规划》 海人工智能人才规模达到30万人。4)基本形成可复制推广的人工智能敏捷治理的制度供给。加快建立人工智能技术标准、知识产权、风险评估、测试 认证、安全监管体系,参与10个国家或国际标准编制,年均申请发明专利1000件,探索建立人工智能赋能产业发展和城市管理指标体系,打造上海人 工智能“融合生态”标志性品牌。 构建广州市人工智能产业“链长制”,通过开展“十百千”战略发展计划,建设 10 个人工智能产业园,开展 100 个人工智能典型场景应用示范,培 《广州市人工智能产业链高质量 育 1000 家左右人工智能企业。实施“2+4+N”产业培育工程,将人工智能与数字经济广东省实验室、粤港澳大湾区国家技术创新中心作为产业链原始 2021年10月 广州市科学技术局 发展三年行动计划(2021—2023 创新、产业孵化主阵地,遴选我市“造车健城”4 条人工智能优势赛道(“造”—AI+先进制造、“车”—AI+车辆交通、“健”—AI+健康医疗、 年)》 “城”—AI+城市治理),每条赛道遴选一批重点培育企业,包括产业龙头企业、高成长性企业、顶尖团队创业企业等,形成百花齐放、相互使能的人 工智能产业新生态。 《北京市“十四五”时期高精尖 《规划》重点关注:全面突破智能芯片、开源框架等核心技术,构建自主可控的产业链体系;建设国家级人工智能前沿研究中心、超大规模人工智能 2021年8月 北京市人民政府 产业发展规划》 模型训练平台;融合人工智能和产业应用。 《中华人民共和国国民经济和社 瞄准人工智能、量子信息、集成电路、生命健康、脑科学、生物育种、空天科技、深地深海等前沿领域,实施一批具有前瞻性、战略性的国家重大科 2021年3月 全国人大 会发展第十四个五年规划和2035 技项目。聚焦高端芯片、操作系统、人工智能关键算法、传感器等关键领域,加快推进基础理论、基础算法、装备材料等研发突破与选代应用。 年远景目标纲要》 资料来源:Wind,全国人大,科技部、教育部、工信部,中国政府网等,德邦研究所 5
7 .1.3 国内各大科技企业纷纷入局AI大模型 大模型增强了AI技术的通用性,助力普惠AI的实现。未来,大模型有望于场景深度融合,配合专业工 具和平台支持应用落地,开放的生态来激发创新,形成良性循环。 头部企业均采取“模型+工具平台+生态” 三层共建模式,有助于业务的良性循环,也更容易借助长 期积累形成竞争壁垒。 大模型厂商主要包括百度、腾讯、阿里、商汤、华为等企业,也有智源研究院、中科院自动化所等研究机构,同时英伟达等芯片 厂商也纷纷入局。 图3:中国大模型生态 表2:部分大模型厂商梳理 公司 大模型 模型底座 NLP大模型 CV大模型 多模态大模型 特色 构建了文心 飞桨 文心跨模态大 大模型层、 文心NLP大模型 文心CV大模型 文心大模型 PaddlePaddle 模型(ERNIE 工具平台层、 (ERNIE3.0) (VIMER系列) 深度学习平台 变体) 产品与社区 三层体系 太极机器学习 HunYuan_tvr、 广告类应用 混元大模型 HunYuan-NLP HunYuan-vcr 平台 太极文生图 表现出色 构建了AI 统 通义大模型 M6-OFA 通义 – AliceMind 通义 - 视觉 通义 - M6 一底座 发挥Model- 盘古大模型 ModelArts 盘古NLP大模型 盘古CV大模型 暂未上线 as-a-service 商业价值 资料来源:各公司官网,德邦研究所 资料来源:《2022中国大模型发展白皮书》,德邦研究所 6
8 . 1.4 围绕大模型,国内外科技龙头展开竞争 图4:中美之间围绕大模型的研发和落地展开竞争 表3:部分国内外大模型参数量对比 NLP CV 多模态 公司 模型 参数量 模型 参数量 模型 参数量 国产模型 百度 ERNIE 3.0-Titan 260B VIMER-UFO 2.0 17B ERNIE-ViLG 2.0 24B 腾讯 HunYuan-NLP 1T HunYuan-vcr - HunYuan_tvr - 阿里 AliceMind-Plug 27B 通义 - 视觉 - M6 10T 华为 盘古语义大模型 200B 盘古视觉大模型 3B 盘古多模态大模型 - 海外模型 OpenAI GPT-3 175B Image GPT 6.8B DALL·E 2 3.5B V-MoE 15B 谷歌 PaLM 540B PaLI 17B ViT-22B 22B 微软 Turing ULR v6 5.4B Swin Transformer V2 3B BEiT-3 1.9B 资料来源:各公司官网,CLUE,GLUE,Shuohuan Wang et al.《ERNIE 3.0 TITAN: EXPLORING LARGER-SCALE KNOWLEDGE ENHANCED PRE-TRAINING FOR LANGUAGE UNDERSTANDING AND GENERATION》,Zhida Feng et al.《ERNIE-ViLG 2.0: Improving Text-to-Image Diffusion Model with Knowledge-Enhanced Mixture-of-Denoising-Experts》等模型相关论文,德邦研究所 资料来源:《预训练大模型白皮书》,德邦研究所 7
9 .02 百度:文心大模型 8
10 .2.1 百度文心大模型:模型+平台+产品构成全套体系 百度文心构建了文心大模型层、工具平台层、产品与社区三层体系。 产品能力:文心大模型+飞桨PaddlePaddle深度学习平台,满足市场大规模落地需求。 应用能力:百度已在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例。 生态能力:在社区用户的基础上,可以实现与开发者、行业用户、上下游产业的正向互动。 图5:百度文心大模型全景图 资料来源:文心大模型官网,德邦研究所 9
11 .2.2 百度飞桨:深度学习平台为大模型研发基石 飞桨(Paddle-Paddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和 推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是国内功能丰富、开源开放的产 业级深度学习平台。截止2022年底,共服务企事业单位20万家,创建模型67万个。 飞桨深度学习平台解决大模型研发和部署的各类问题,文心大模型是飞桨模型库的重要组成部分,与飞桨共享生态, 包含产业级知识增强大模型体系,以及工具平台、API和创意社区助力大模型的高效应用。 图6:飞桨部分重点产品 图7:飞桨在深度学习开源框架中的份额较高 资料来源:飞桨PaddlePaddle官网,德邦研究所 资料来源:IDC,德邦研究所 10
12 .2.3 文心大模型在市场格局中处于第一梯队 百度率先在2019年3月发布预训练模型ERNIE1.0,文心大模型构建了“基础+任务+行业”的三级模型体系,基础大模 型支撑任务与行业大模型的建设,任务和行业大模型结合真实场景与数据反哺基础大模型优化,目前已有36个大模型。 基础大模型:聚焦技术挑战、通用性、泛化性探索,包括含NLP大模型、CV大模型和跨模态大模型。 任务大模型:包含对话、搜索、信息抽取、生物计算等多个典型任务。 行业大模型:包含与来自8个行业的头部企业或机构共建的11个行业大模型。 IDC评估结果显示,百度文心大模型处于第一梯队,产品能力、生态能力达到L4水平,应用能力达到L3水平。 图8:百度大模型发展历史 图9:IDC中国大模型市场2022年百度文心大模型评估结果 资料来源:文心大模型公众号,德邦研究所 资料来源:IDC,德邦研究所 11
13 .2.3.1 基础大模型:聚焦技术挑战、通用性、泛化性探索 文心基础大模型覆盖了NLP、CV、跨模态三大方向。 文心NLP大模型:ERNIE3.0基于知识增强的多范式统一预训练框架,深入融合的千亿级知识,具备强大的语言理解能 力与小说、摘要、文案创意、歌词、诗歌等文学创作能力;与鹏城实验室合作发布了知识增强千亿大模型“鹏城-百 度·文心“。 文心CV大模型:VIMER系列的CV大模型,包括视觉自监督预训练大模型VIMER-CAE,多任务学习模型VIMER- UFO2.0,端到端文档OCR表征学习预训练模型VIMER-StrucTexT2.0等。 文心跨模态大模型:ERNIE-ViLG2.0文生图大模型、ERNIE-ViL视觉-语言大模型、ERNIE-Layout文档智能大模型等。 图10:ERNIE3.0融合了自回归网络和自编码网络 图11:VIMER-UFO2.0是170亿参数视觉多任务模型,支持各类任务 资料来源:Yu Sun et al.《ERNIE 3.0: LARGE-SCALE KNOWLEDGE ENHANCED PRE- TRAINING FOR LANGUAGE UNDERSTANDING AND GENERATION》,德邦研究所 资料来源:文心大模型官网,德邦研究所 12
14 .2.3.2 任务大模型:面向多个经典下游任务推出的模型 任务大模型包括,对话大模型PLATO、搜索大模型ERNIE-Search、信息抽取大模型ERNIE-UIE、代码生成大模型 ERNIE-Code、生物计算大模型等。 PLATO:基于隐变量的生成式开放域对话大模型,具备接近真人水平的多轮流畅对话能力,开放域对话效果达到世界领先水平。 ERNIE-UIE:支持多种类型的开放抽取任务,用户可以使用自然语言自定义抽取目标,无需训练即可抽取输入文本中的对应信息。 ERNIE-Code:基于海量代码和文本数据进行预训练,引入联合学习,具备跨多种自然语言和编程语言的语义理解和生成能力。 文心生物计算大模型构建面向化合物分子、蛋白分子的生物计算领域预训练模型,赋能生物医药行业,包括单序列蛋白质结构预 测模型HelixFold、蛋白质结构预测模型HelixFold-Single、化和表征学习模型HelixGEM-2。 图12:部分任务大模型 资料来源:《2022中国大模型发展白皮书》,德邦研究所 13
15 .2.3.3 行业大模型:深入产业落地的重要举措 行业大模型是百度与行业头部企业、机构联合研发的融合行业数据、知识以及专家经验的大模型,在各行业的技术效 果突破、产品创新、生产流程变革、降本增效等维度产生价值。 与国网合作的NLP大模型:探索研发电力人工智能联合大模型,不仅提升了传统电力专用模型的精度,而且大幅降低了研发门槛, 实现了算力、数据、技术等资源的统筹优化。 与人民网的合作的NLP大模型:引入舆情数据中心积淀的行业知识来更好训练知识增强的传媒行业大模型,实现更少的标注数据 下大幅提升传媒行业自然语言处理任务效果,如新闻内容审核分类、舆情分析、摘要生成等。 与TCL合作的CV大模型:在TCL几个产线检测mAP指标平均提升10%+,训练样本减少到原有训练样本30%~40%,产线指标即 可达到原有产线效果,新产线冷启动效率可提升3倍,产线上线开发周期降低30%。 图13:百度行业大模型 图14:百度文心行业大模型覆盖多个领域 资料来源:《2022中国大模型发展白皮书》,百度,德邦研究所 资料来源:《2022中国大模型发展白皮书》,百度,德邦研究所 14
16 .2.4 应用:平台及产品面向B端C端齐发力 百度文心围绕大模型产业应用的不同研发环节,面向各阶段不同技术、业务背景的开发者或用户,打造系列工具平台 与场景化产品。 面向开发者:拥有面向NLP工程师的大模型套件ERNIEKit,包括数据标注与处理、大模型精调、大模型压缩、高性能部署、场景 化工具五大模块能力;AI开发平台,包括零门槛AI开放平台EasyDL,和面向AI算法开发者提供全功能AI开发平台BML。 面向下游应用:文心开放了API接口,包括NLP大模型ERNIE3.0、跨模态大模型ERNIE-ViLG、对话大模型PLATO。 面向用户:推出了基于大模型驱动的新一代产业级搜索系统文心百中,以及AI艺术与创意辅助平台文心一格。 图15:文心大模型产品矩阵 图16:文心百中覆盖大量搜索场景,轻松助力产业应用 资料来源:《2022中国大模型发展白皮书》,百度,德邦研究所 资料来源:飞桨PaddlePaddle官网,德邦研究所 15
17 . 2.4.1 已官宣加入百度文心一言生态圈的企业超过400家 表4:部分官宣加入“文心一言”生态圈企业梳理 公司 领域 时间 内容 创梦天地 游戏 02/20 将把百度智能对话技术成果应用在精品游戏体验及Fanbook社区用户服务 中手游 游戏 02/21 将把百度的智能对话技术成果应用在开放世界游戏领域。 巨人网络 游戏 02/21 共同打造游戏行业联合解决方案。 百度地图 互联网(在线地图) 02/14 百度地图宣布将全面融合文心一言,发布交通大模型,升级为具备自学习、自进化能力的“下一代 AI 导航” 携程 互联网(旅游服务) 02/15 双方将在旅行智能规划、旅行内容渗透等多个领域展开深化合作,为用户打造在线旅游服务场景人工智能解决方案,引领“AI+旅行”产业应用升级。 风语筑 互联网(元宇宙) 02/14 表示将把文心一言应用在数字化体验和元宇宙相关的业务中,有望在线上元宇宙空间中的数字人导览,线下沉浸式场景中的VR/AR 导览、对话交互等领域持续落地。 爱奇艺 互联网(在线视频) 02/15 双方共同探索将AIGC技术应用于爱奇艺内容搜索、内容宣发、内容创作工具、小说创作等业务。 火狐 互联网(浏览器) 02/15 火狐浏览器、火狐主页的搜索位将陆续接入百度“文心一言” 值得买科技 互联网(消费服务) 02/17 值得买科技会逐步把百度领先的智能对话技术成果应用在消费内容领域。 印象笔记 互联网(笔记app) 02/17 结合印象笔记多年自研的AI能力以及印象笔记对国内外领先大语言模型(LLM)的研究和应用,将形成独具特色的印象AI产品与服务 Moka 互联网(SaaS服务) 02/17 将优先体验并接入“文心一言”,以此来打造更创新、更智能的人力资源数字化服务。 返利科技 互联网(电商) 02/21 开展电商垂直领域人工智能应用的大场景探索。 航天宏图 科技 02/20 将把百度领先的智能对话技术成果应用在卫星遥感领域,标志着对话式语言模型技术在PIE-Engine时空遥感云平台及各行业卫星应用场景中的首次着陆。 掌阅科技 内容创作 02/15 探索提升公司内容创作效率、降低内容创作成本的有效路径,持续创新人工智能与阅读行业相结合的行之有效的产品形态和商业模式。 澎湃新闻 媒体 02/14 对话式语言模型技术在媒体行业内容生态场景的首次着陆。 每日经济新闻 媒体 02/14 通过技术共享、培训赋能、联合营销等方式,强化竞争力,为用户打造全场景、高频次、互动性人工智能解决方案及服务 上游新闻 媒体 02/14 重庆日报报业集团旗下上游新闻将智能对话技术应用在内容生产;集团将联手百度共同打造AI智能编辑中心项目,将Al用于新闻专题、短视频编辑、数字人新闻采访播报等领域。 经济观察报 媒体 02/14 经济观察报将把百度领先的智能对话技术成果应用在全新财经媒体数字化平台——经观APP。 证券之星、格隆汇 媒体 02/14 将把百度领先的智能对话技术成果应用在金融信息服务领域 新潮传媒 媒体 02/14 加速电梯广告媒体的数字化升级。 华尔街见闻 媒体 02/15 华尔街见闻及全天候科技将把百度领先的智能对话技术成果应用在金融和商业信息领域。 中国基金报 媒体 02/16 中国基金报将把百度领先的智能对话技术成果应用在媒体融合领域。 凤凰网 媒体 02/16 凤凰网将全面体验并接入文心一言的能力。 新京报 媒体 02/17 将把百度领先的智能对话技术成果应用在新闻选题、策划、创意展示等领域 豆语星辰 教育 02/15 豆语星辰将把百度领先的智能对话技术成果应用在教育科技化升级领域。 高途 教育 02/17 进一步拓展AI在教学练测评等教学和服务环节落地的深度和广度,大幅提升用户学习体验和学习效率,为学生成长高效助力。 少林寺 文化 02/14 将把百度领先的智能对话技术成果应用在内容生态、智慧寺院、文化保护与传承等领域,为用户打造全场景内容生态人工智能解决方案及服务。 集度汽车 制造业 02/14 集度汽车机器人将融合百度文心一言的全面能力,打造全球首个针对智能汽车场景的大模型人工智能交互体验,支持汽车机器人实现自然交流的能力。 联想 制造业 02/15 联想小新产品将在系统桌面助手中,接入百度“文心一言”,用户在电脑的桌面即可与 AI 对话。 长虹 制造业 02/17 标志着长虹8K电视优先获得领先AI技术的加持,也意味着对话式语言模型技术在国内智能感知交互场景的进一步探索。 红旗汽车 制造业 02/17 红旗汽车将在汽车生态领域全面接入文心一言的能力。 东风日产 制造业 02/17 东风日产将接入文心一言,可优先内测试用该产品。 美的集团 制造业 02/20 携手百度推进智能家居领域人机对话能力的进一步升级;将百度文心一言的智能对话技术成果应用在智能家居、家庭服务机器人等领域。 邮储银行 商业银行 02/16 通过“邮储大脑”接入并应用“文心一言”的能力;百度“文心一言”首次在国有大型商业银行落地。 兴业银行 商业银行 02/22 在智慧网点、智能服务、智能风控、智能运营、智能营销、智能投研等金融场景开展人工智能大模型技术应用 广发证券 券商 02/20 通过探索大语言模型融入金融应用场景,尝试金融需求挖掘和服务支持等,为客户提供更智能的财富管理服务体系。 资料来源:新京报,上海证券报,中国证券网,IT之家,东方财富网等,德邦研究所 16
18 .03 腾讯:混元大模型 17
19 .3.1 腾讯HunYuan大模型:深入产业落地的重要举措 2022年4月,腾讯首次对外披露HunYuan大模型,协同了腾讯预训练研发力量,完整覆盖NLP大模型、 CV大模型、多模态大模型及众多行业/领域任务模型。 HunYuan-NLP:万亿级别中文NLP预训练模型,参数量达1T,排名CLUE1.1总排行榜第一。 HunYuan-vcr:排名VCR(Visual Commonsense Reasoning)榜单第一。 HunYuan_tvr:跨模态文字-视频检索AI大模型 图17:腾讯HunYuan大模型全景图 图18:HunYuan-NLP 1T排名CLUE1.1总排行榜第一 资料来源:量子位公众号,德邦研究所 资料来源:CLUE官网,德邦研究所 18
20 .3.2 太极机器学习平台:HunYuan大模型的底层支持 太极是腾讯自主研发的一站式机器学习生态服务平台,为AI工程师打造从数据预处理、模型训练、模型评估到模型服 务的全流程高效开发工具,为大模型的训练提供了有力保障。 太极AngelPTM:预训练加速组件,单机最大可容纳55B模型,需要192张卡就可以训练万亿模型。 太极-HCF ToolKit:大模型压缩和分布式推理组件,包含了从模型蒸馏、压缩量化到模型加速的完整能力。 太极 - HCF distributed为大模型分布式推理组件,使得HunYuan-NLP 1T大模型推理只需 96张A100(4G) 卡,相比于“威震天”资源设 备占用减少了 40%。 太极 – SNIP为大模型压缩组件,从蒸馏框架和压缩加速算法两方面,实现了迭代更快,效果更好,成本更低的大模型压缩。 图19:太极AngelPTM为预训练加速组件 图20:太极-HCF ToolKit加速大模型落地 资料来源:量子位公众号,德邦研究所 资料来源:量子位公众号,德邦研究所 19
21 .3.3 应用:为腾讯生态降本增效,广告类应用表现出色 HunYuan先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务,降本增效。 依靠HunYuan的多模态理解能力,在广告内容理解、行业特征挖掘、文案创意生成等方面的应用,在为腾讯广告带来 大幅GMV提升的同时,也初步验证了大模型的商业化潜力。 HunYuan大模型和腾讯广告精排大模型基于太极机器学习平台,共同完善优化了广告理解、用户理解、广告和用户匹配的整个流程,提升对广 告理解、匹配效率、精准度和转化效率。 HunYuan大模型的生成能力,可以提升广告制作的效率:“图生视频”功能,可以将静态的图片自动生成不同样式的视频广告;“文案助手” 功能,可以为广告自动生成更恰当的标题,提升广告的效果;“文生视频”功能,未来只需要提供一句广告文案,就可以自动生成与之匹配的 视频广告。 图21:HunYuan大模型对话生成案例 图22:HunYuan大模型广告文案生成案例 资料来源:量子位公众号,德邦研究所 资料来源:量子位公众号,德邦研究所 20
22 .04 阿里:通义大模型 21
23 .4.1 通义大模型:让AI更通用 2022年9月,在阿里巴巴达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上,发布 “通义”大模型系 列,并宣布相关核心模型向全球开发者开源开放。 阿里达摩院基于其 AI 统一底座构建了通用模型与专业模型协同的层次化人工智能体系。 统一底座层:M6-OFA模型作为单一模型,在不引入新增结构的情况下,可处理超过30种跨模态任务。 通用模型层:NLP模型“通义 – AliceMind”;CV模型“通义 - 视觉”;多模态模型“通义 - M6”。 专业模型层:深入电商、医疗、娱乐、设计、金融、工业、制造业等行业。 图23:通义大模型架构 资料来源:机器之心公众号,2022年世界人工智能大会,德邦研究所 22
24 . 4.2.1 底座层:实现模态表示、任务表示、模型结构统一 通义大模型背后的核心技术为统一学习范式OFA,使其具备了多种任务的“大一统”能力。 单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务;升级后更 是可以处理超过包括语音和动作在内的30多种跨模态任务。 架构统一:使用Transformer架构,统一进行预训练和微调,无需在应对不同任务时,增加任何特定的模型层。 模态统一:不管是NLP、CV这种单模态,还是图文等多模态任务,全都采用同一个框架和训练思路。 任务统一:将所有单模态、多模态任务统一表达成序列到序列(Seq2seq)生成的形式,同类任务的输入几乎就是 “一个模子里刻出来的”。 图24:OFA具备多种任务的“大一统”能力 图25:编码器实现模态间的特征匹配;解码器通过自回归的方式输出 资料来源:Peng Wang et al. 《OFA: UNIFYING ARCHITECTURES, TASKS, AND MODALITIES 资料来源:机器之心公众号,德邦研究所 23
25 . 4.2.2 通用模型层:趋向于统一大模型的演化 通义 - M6为多模态大模型, 已经从 2020 年 6 月的 3 亿参数基础模型发展到 2021 年 10 月的 10 万 亿参数全球最大预训练模型到 2022 年 1 月的业界首个通用统一大模型 M6-OFA。 2021年3月,发布通义 – AliceMind,为达摩院开源的深度语言模型体系,CLUE1.1总排行榜第二。 AliceMind生态体系包括:通用语言模型 StructBERT、多模态语言模型 StructVBERT 、多语言模型VECO 、生成式模 型 PALM、文档图像理解模型Structural LM、表格理解模型SDCUP、超大中文理解与生成模型PLUG(24层 StructBERT编码器+“24-6”层的PALM编码器-解码器)、超大图像-文本模型mPLUG等。 图26:通义 - M6发展历史 图27:编码器实现模态间的特征匹配;解码器通过自回归的方式输出 资料来源:机器之心公众号,2022年世界人工智能大会,德邦研究所 资料来源:CLUE官网,德邦研究所 24
26 . 4.2.2 通用模型层:趋向于统一大模型的演化 通义 - 视觉大模型分为了底层统一算法架构、中层通用算法和上层产业应用。 通义 - 视觉大模型可以在电商行业实现图像搜索和万物识别等场景应用,并在文生图以及交通和自动驾驶领域发挥作用。 应用方面,通义大模型依靠其领先的跨模态能力,为下游任务提质增效。 在淘宝服饰类搜索场景中实现了以文搜图的跨模态搜索、在 AI 辅助审判中司法卷宗的事件抽取、文书分类等场景任务中实现 3~ 5% 的应用效果提升、在开放域人机对话领域通过建立初步具备“知识、情感以及个性、记忆”的中文开放域对话大模型实现了 主动对话、广泛话题、紧跟热点等对话体验。 图28:通义 -视觉大模型架构 图29:通义大模型文生图效果 资料来源:机器之心公众号,2022年世界人工智能大会,德邦研究所 资料来源:机器之心公众号,阿里云公众号,德邦研究所 25
27 .05 华为:盘古大模型 26
28 . 5.1 华为盘古大模型:深耕大模型的行业应用 华为云团队于2020 年立项AI 大模型,并且于2021 年4 月发布“盘古大模型”。受益于华为的全栈式AI 解决方案,大 模型与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts 平台深度结合。 盘古大模型已经发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶段的成熟体系。 2022年11月,在华为全联接大会2022中国站上,华为云进一步迭代盘古大模型的技术能力,扩展盘古大模型的服务范围,发布 盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项重磅服务。 图30:盘古大模型架构 图31:盘古NLP大模型参数量达到2000亿,高于GPT-3的1750亿 资料来源:中国信通院“2022可信AI峰会”,德邦研究所 资料来源:华为云官网,德邦研究所 27
29 .5.2 ModelArts:大模型研发的平台支持 ModelArts 是面向开发者的一站式AI平台,为机器学习与深度学习提供海量数据预处理及交互式智能 标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部 署模型,管理全周期 AI 工作流。 ModelArts的主要能力包括数据处理、算法开发、模型训练、AI应用管理和部署;功能模块涵盖了强化学习、天筹(OptVerse)AI求 解器、盘古大模型、AI Gallery(人工智能知识与实训专区)、IDE(云原生 Notebook)等。 图32:ModelArts为开发者提供一站式服务 资料来源:华为云官网,德邦研究所 28