关于数据库和数据仓库的概念

关于数据库和数据仓库的概念

关于数据库和数据仓库的概念还是有些不明白。

比如mysql、Hive、Hbase。

比如原本的业务中是将日志存入Hive,也就是HDFS中,再将分析后的结果写入mysql里。

我的理解就是把原始的数据存入Hive(数仓),通过Spark进行分析将计算结果存入Hbase或者Mysql,方便java那边的业务代码进行调用。数仓本身是不存储计算的结果的,今天听了课感觉并不是这么回事...


还有就是Hbase也是非关系型数据库吧,底层也是依靠hdfs的,那么跟Hive有什么区别,都用一套HDFS怎么跟Hive进行区分的呢。

正在回答

登陆购买课程后可参与讨论,去登陆

1回答

数据仓库里面是要存储数据的,后面有一个数据仓库的项目,还需要对数据分层存储。

数仓主要是为了把多种维度和业务的数据汇聚到一起,便于后期分析使用。



hbase属于非关系型数据库,支持增删改查,擅长实时写入数据和根据rowkey快速查询数据。

hive侧重于数据分析,不支持修改删除,并且也不擅长查询单条数据,比较慢。


hbase在工作中的使用是有限的,目前在电子书中增加了hbase的内容,在11月份课程会迭代一个版本,正式增加hbase的视频内容。

  • 幕布斯5216845 提问者 #1

    那感觉直接把多维度的数据,直接存入Hbase就好啦,查询还更快,还支持增删改查,底层也是HDFS可以支持海量存储。

    2021-09-14 12:43:01
  • 徐老师 回复 提问者 幕布斯5216845 #2
    hbase根据rowkey查询快,根据其他列的组合查询就很慢了,并且不支持sql,针对数据分析不友好
    2021-09-14 12:45:07
问题已解决,确定采纳
还有疑问,暂不采纳

恭喜解决一个难题,获得1积分~

来为老师/同学的回答评分吧

0 星
请稍等 ...
意见反馈 帮助中心 APP下载
官方微信

在线咨询

领取优惠

免费试听

领取大纲

扫描二维码,添加
你的专属老师