关于数据库和数据仓库的概念
关于数据库和数据仓库的概念还是有些不明白。
比如mysql、Hive、Hbase。
比如原本的业务中是将日志存入Hive,也就是HDFS中,再将分析后的结果写入mysql里。
我的理解就是把原始的数据存入Hive(数仓),通过Spark进行分析将计算结果存入Hbase或者Mysql,方便java那边的业务代码进行调用。数仓本身是不存储计算的结果的,今天听了课感觉并不是这么回事...
还有就是Hbase也是非关系型数据库吧,底层也是依靠hdfs的,那么跟Hive有什么区别,都用一套HDFS怎么跟Hive进行区分的呢。
10
收起
正在回答
1回答
数据仓库里面是要存储数据的,后面有一个数据仓库的项目,还需要对数据分层存储。
数仓主要是为了把多种维度和业务的数据汇聚到一起,便于后期分析使用。
hbase属于非关系型数据库,支持增删改查,擅长实时写入数据和根据rowkey快速查询数据。
hive侧重于数据分析,不支持修改删除,并且也不擅长查询单条数据,比较慢。
hbase在工作中的使用是有限的,目前在电子书中增加了hbase的内容,在11月份课程会迭代一个版本,正式增加hbase的视频内容。
大数据工程师 2024 版
- 参与学习 1151 人
- 提交作业 5960 份
- 解答问题 1144 个
不用Java初级内容充数!不用与大数据岗位无关内容占课时!我们做的就是“精华版”大数据课程
了解课程
恭喜解决一个难题,获得1积分~
来为老师/同学的回答评分吧
0 星