跳至内容

桂花公路的笔记

  • 首页
  • 其他

数据治理

数据清洗的步骤

在 2021年11月3日2021年11月12日 上张贴 由 Hydra发表回复

清洗定义 我们知道,数据中台的缘由和底座是数据治理,而数据治理的最主要目的是提高数据质量、充分利用数据。 数据…

浅谈数据治理的难点

在 2021年10月29日 上张贴 由 Hydra发表回复

数据治理对于一个企业来说,有长期的利益提升意义,随着时间的推移、数据的增长,会愈发明显。但是看似稳赚不赔的专项…

【Kerberos+Ranger】大数据权限管理

在 2021年10月19日2021年10月21日 上张贴 由 Hydra发表回复

比较常见的两个大数据权限管理组件,分工有所不同。 Kerberos的权限针对于整个集群,当前用户是否被允许访问…

原子、派生、衍生

在 2021年9月29日2021年9月29日 上张贴 由 Hydra发表回复

1. 原子指标 即事实,与度量含义相同,不可拆分指标,如销售额 sale_amount 2. 派生指标 原子指…

浅谈数仓建模概念

在 2021年9月29日2023年4月4日 上张贴 由 Hydra发表回复

建模是在数据世界里抽象真实世界的过程,使用数据来描述真实对象,在抽象中清晰。 建模是宏观数据治理中重要的一环,…

人人都想做模型而非数据工作,这很危险(转载)

在 2021年9月24日2022年1月28日 上张贴 由 Hydra发表回复

最近有篇谷歌的文章,谈到了数据质量对下游产品(AI)中发挥的巨大影响,尤其是癌症检测、野生动物偷猎和贷款分配等…

文章导航

较新文章 →
2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 12 月    

Api CentOS Clickhouse DAMA Hive IDEA Java Kafka Linux MongoDB MySQL NPS Oracle PostgreSQL Python Scala Spark SQLite StarRocks Svn Teradata UDF VSCode 剪辑 大数据 数据治理 架构 私有云 网络

  • 技术 (54)
  • 理论 (27)
  • 生活 (3)

用户

  • 登录
  • 条目 feed
  • 评论 feed
  • WordPress.org
©2025 桂花公路的笔记 京ICP备2021025120号-1