跳至内容

桂花公路的笔记

  • 首页
  • 其他

浅谈数据治理的难点

在 2021年10月29日 上张贴 由 Hydra发表回复

数据治理对于一个企业来说,有长期的利益提升意义,随着时间的推移、数据的增长,会愈发明显。但是看似稳赚不赔的专项…

【MySQL+PostgreSQL】对比

在 2021年10月21日2021年11月4日 上张贴 由 Hydra发表回复

近期PostgreSQL的增势迅猛,搜索热度指数10月份上升了44.57%,虽远不及Oracle/MySQL,…

【Kerberos+Ranger】大数据权限管理

在 2021年10月19日2021年10月21日 上张贴 由 Hydra发表回复

比较常见的两个大数据权限管理组件,分工有所不同。 Kerberos的权限针对于整个集群,当前用户是否被允许访问…

【Spark】解析MySQL原始日志数据到HDFS

在 2021年10月5日2021年10月5日 上张贴 由 Hydra发表回复

import java.utilimport ch.hsr.geohash.GeoHashimport com…

客户体验——NPS概念

在 2021年10月5日2023年4月4日 上张贴 由 Hydra发表回复

NPS是什么 NPS(Net Promoter Score),中文名为净推荐值,是客户对品牌/产品的忠诚度得分…

【Java】HiveUDF 伪装设备批量拉拽接口

在 2021年10月5日2021年12月15日 上张贴 由 Hydra发表回复

package udf; import org.apache.hadoop.hive.ql.exec.UDF;…

【Java】本地目录遍历搜索文件

在 2021年9月29日2021年12月15日 上张贴 由 Hydra发表回复

package modifyWordText;import java.io.File;import java….

原子、派生、衍生

在 2021年9月29日2021年9月29日 上张贴 由 Hydra发表回复

1. 原子指标 即事实,与度量含义相同,不可拆分指标,如销售额 sale_amount 2. 派生指标 原子指…

浅谈数仓建模概念

在 2021年9月29日2023年4月4日 上张贴 由 Hydra发表回复

建模是在数据世界里抽象真实世界的过程,使用数据来描述真实对象,在抽象中清晰。 建模是宏观数据治理中重要的一环,…

【Hive】高版本下与Spark共享事务

在 2021年9月27日2021年12月19日 上张贴 由 Hydra发表回复

在设定上,Hadoop3高版本的Hive环境会默认开启acid以及表格严格管理模式,而Spark会默认读取自身…

文章导航

← 早期文章
较新文章 →
2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 12 月    

Api CentOS Clickhouse DAMA Hive IDEA Java Kafka Linux MongoDB MySQL NPS Oracle PostgreSQL Python Scala Spark SQLite StarRocks Svn Teradata UDF VSCode 剪辑 大数据 数据治理 架构 私有云 网络

  • 技术 (54)
  • 理论 (27)
  • 生活 (3)

用户

  • 登录
  • 条目 feed
  • 评论 feed
  • WordPress.org
©2025 桂花公路的笔记 京ICP备2021025120号-1