package modifyWordText;import java.io.File;import java….
月份:2021年9月
原子、派生、衍生
1. 原子指标 即事实,与度量含义相同,不可拆分指标,如销售额 sale_amount 2. 派生指标 原子指…
浅谈数仓建模概念
建模是在数据世界里抽象真实世界的过程,使用数据来描述真实对象,在抽象中清晰。 建模是宏观数据治理中重要的一环,…
【Hive】高版本下与Spark共享事务
在设定上,Hadoop3高版本的Hive环境会默认开启acid以及表格严格管理模式,而Spark会默认读取自身…
人人都想做模型而非数据工作,这很危险(转载)
最近有篇谷歌的文章,谈到了数据质量对下游产品(AI)中发挥的巨大影响,尤其是癌症检测、野生动物偷猎和贷款分配等…
【MySQL】常用版本之间的区别
主要是记录下5.6/5.7/8.0之间比较明显的区别 5.6:InnoDB 作为默认存储引擎并支持全文索引,拥…
【Java】程序发送邮件
package email;import java.util.Properties;import javax….
浅谈隐私计算
得益于一场分享会,听到同事关于隐私计算的介绍,在借鉴其资料基础上,由此写下一篇心得。 中国唯一图灵奖获得者姚期…
【VSCode】插件推荐
Auto Close Tag Auto Rename Tag Beautify Chinese (Simpli…
架构设计方法论(更新中)
1. 概述 1.1. 架构设计 软件系统规模越来越大,将会面临的问题也在增加,可靠性、安全性、可伸缩性、可移植…