hive.compute.query.using.stats=true
当hive-site该配置为true时,count(1)会直接到表格meta元数据中拿表格缓存记录数,而不扫描表格,该配置应该是为节省计算时间和计算资源设定,默认值是true。
当表格数据因hdfs dfs -put操作变更时,从元数据无法直接拿到最新的数据量,关掉这个配置或者使用select * 来scan整表更合适,默认的count结果不准确。
hive.compute.query.using.stats=true
当hive-site该配置为true时,count(1)会直接到表格meta元数据中拿表格缓存记录数,而不扫描表格,该配置应该是为节省计算时间和计算资源设定,默认值是true。
当表格数据因hdfs dfs -put操作变更时,从元数据无法直接拿到最新的数据量,关掉这个配置或者使用select * 来scan整表更合适,默认的count结果不准确。