清研紫荆数据架构师高级培训课程 
最新报名:
商学院banner图
首页> 培训课程> 详情 培训课程

清研紫荆数据架构师高级培训课程

发布时间:2025-10-14 11:06:36

数据架构师在企业数据架构方面的潜力并重新定义数据管理。从 ERD 到尖端数据库设计,您将学习塑造数据格局的技能。 


提升您作为数字原生代的技能和资格
我们的未来技能课程与业界最优秀的企业合作,着眼于未来的工作,提供最好的结构化、导师支持的 100% 在线教育。


为什么选择这门课程?
进入数据架构领域。从战略规划和创新设计到无缝实施,您将学习为组织开发尖端的数据管理系统。制作关系数据库,使用 OLAP 模型构建基于云的数据仓库,并设计可扩展的数据湖架构来应对大数据的挑战。 
该数据架构师课程将与 Udacity 合作向您提供,这意味着您将可以通过我们的学习者成功团队获得 Udacity 的学习和职业服务以及 RMIT Online 的课程支持支持。成功完成课程后,您还将收到 RMIT 在线证书,该证书可以上传到 LinkedIn,以验证您对该学科的技能掌握程度。


本课程适合谁?
•  希望通过定义和设计组织数据生态系统结构的技能来提升自己职业生涯的  中高级数据从业者。
• 经验丰富的技术专业人员, 旨在从网络或网络安全角色过渡到数据或业务分析团队的高级职位,例如数据架构师。


你将学到什么?
在本课程结束时,您将能够: 
• 构建概念、逻辑和物理实体关系图 (ERD)
• 在 PostGreSQL 中构建物理数据库
• 将数据从事务系统转换为运营数据存储
• 使用维度数据模型创建数据仓库系统
• 使用适当的存储和处理框架来管理大数据
• 设计端到端的批处理和流处理架构
• 建立数据治理最佳实践,包括元数据管理、主数据管理和数据质量管理


它是如何运作的?
在本课程中,您将有机会通过一系列项目展示您新获得的数据架构师技能。
在您的第一个项目中,您将为视频游戏公司的人力资源部门设计、构建和填充数据库。在第二部分中,您将设计用于报告和 OLAP 的数据仓库。您的第三个项目将让您设计一个企业数据湖系统,最后,您将在一家在线鞋类零售商中实施新的数据治理。


先决条件?
报名之前,您应具备以下知识: 
• 关系数据库管理系统或基础数据库技能 
• 中级Python 
• 中级SQL 
• 批处理和流处理框架 
• 操作系统,包括 UNIX、Linux 和 MS Windows 
• ETL/数据管道基础知识 


课程结构
第 1 单元:数据架构基础
第 1 课:什么是数据架构?
• 定义数据架构特征
• 定义数据治理及其作用
• 定义数据库设计的可扩展性和灵活性


第 2 课:数据库框架
• ERD 简介
• 开发数据库模式
• 了解标准化及其用例 
• 学习将数据标准化为第三范式


第 3 课:关系数据设计
• ERD 简介
• 构建概念 ERD
• 构建逻辑 ERD
• 了解基数和 Crow's Foor 表示法
• 构建物理 ERD


第 4 课:创建物理数据库
• 了解影响数据库性能的因素 
• 了解文件和数据存储解决方案 
• 使用DDL SQL在PostGreSQL中创建数据库项目 
• 了解数据摄取方法,包括:ETL、Piplines、API 和直接馈送
• 使用 DML SQL 用 PostGreSQL 中的数据填充数据库 
• 使用 CRUD SQL 命令演示数据库的正确方向 
项目: 为视频游戏公司的人力资源部门设计、构建和填充数据库。


模块2:设计数据系统
第 1 课:企业数据架构 
• 了解数据架构在任何组织中的重要性 
• 了解执行数据架构的好处 
• 了解所需的业务和技术工件 
• 了解业务和功能需求 
• 了解 OLTP、ODS 和 OLAP 模型的设计方式

 
第 2 课:暂存数据 
• 构建数据摄取的暂存区 
• 学习根据方案组织数据资产 
• 根据需求设计数据处理时间表 
• 学习通过元数据管理暂存区

 
第 3 课:操作数据存储 
• 构建连接分布式数据资产的集成ER模型 
• 学习设计数据字典和主数据 
• 应用标准化规则来消除冗余 
• 了解何时使用 ETL 与 ELT 技术
• 学会清理数据异常 


第 4 课:数据仓库 
• 学习两种 OLAP 建模设计 – 星型和雪花模式 
• 了解各种维度和事实表类型 
• 构建从 ODS 到数据仓库的 ELT 数据处理 
• 出于报告目的编写 SQL 查询
项目: 设计用于报告和 OLAP 的数据仓库


模块 3:大数据系统
第一课:大数据的特征 
• 解释一下什么是“大数据” 
• 阐明大数据的商业价值 
• 描述大数据的特征 
• 区分水平缩放和垂直缩放 
• 描述大数据生态系统的组成部分 


第 2 课:摄取、存储和处理框架 
• 解释分布式存储在 HDFS 中的工作原理 
• 解释分布式处理的工作原理 
• 解释如何在 Hadoop 集群中管理资源 
• 区分不同的分布式处理框架 
• 将框架应用于适当的用例 


第 3 课:NoSQL 数据库 
• 解释 SQL 和 NoSQL 数据库之间的区别 
• 解释分布式处理的工作原理 
• 解释Hadoop集群中如何管理资源 
• 区分不同的分布式处理框架 
• 将框架应用于适当的用例 


第 4 课:可扩展的数据湖架构
• 解释数据湖及其商业价值 
• 区分不同的数据格式及其应用 
• 阐明数据湖设计模式和挑战 
• 解释如何在数据湖中启用事务功能
项目: 设计企业数据湖系统


模块 4:数据治理
第 1 课:数据治理简介 
• 了解数据治理及其重要性 
• 了解数据治理的不同学科 
• 了解参与数据治理项目的不同利益相关者 


第 2 课:元数据管理 
• 了解不同类型的元数据 
• 了解元数据管理系统的组件和功能 
• 创建概念和逻辑企业数据模型 
• 创建企业数据目录


第 3 课:数据质量管理 
• 使用数据质量维度使用各种技术执行数据分析 
• 确定数据质量问题的修复选项
• 使用数据质量分数和阈值衡量数据质量 
• 使用仪表板、异常和趋势报告监控数据质量 


第 4 课:主数据管理 
• 了解主数据和黄金记录的概念 
• 了解不同类型的主数据管理架构 
• 使用各种匹配和合并技术创造黄金记录 
• 了解主数据创作、监控和批准的数据治理流程 
项目: 在在线鞋经销商处实施数据治理

 

上一篇:
下一篇:清研紫荆敏捷项目管理高级培训课程

网站申明:以上课程知识产权归属办学方 紫荆博士网-工商管理博士官网仅提供课程信息展示,而非商业行为
紫荆在职博士研究生网仅提供技术支持 http://www.pxemba.com/ 粤ICP备17004821号
Copyrights © 2007-2025 PXEMBA.COM Inc. All rights reserved 版权声明