网站首页 > 文章精选 正文
大数据技术是近些年来比较热门的一种IT技术,大数据技术的应用给我们生活带来了许多便利,很多人意识到了大数据技术的意义,部分人参与到了大数据的学习当中,既然是对数据的处理,就会用到数据库,那么大数据学习什么数据库呢?
在学习大数据中所要运用到的数据库之前需要先学习MySQL数据库及SQL语言和JDBC。
一、MySQL数据库
1、MySQL数据库
MySQL是一个关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大的仓库中,这提高了速度和灵活性。
学习内容:
① MySQL安装
② 常见命令使用
③ 表与数据库操作
④ 约束
MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言,接下来将介绍SQL语言的概念及学习内容。
2、SQL语言
SQL是一种操作数据库的语言,这种语言具有交互性特点,能为用户提供极大的便利,数据库管理系统应充分利用SQL语言,提高计算机应用系统的质量和效率。SQL语言不仅可以独立应用于终端,而且可以作为一个子语言来为其他程序设计提供有效的帮助,在这个程序应用中,SQL可以与其他程序语言一起优化程序功能,从而为用户提供越来越全面的信息。
优点:
① 非过程化语言
② 统一的语言
③ 是所有关系型数据库的公共语言
SQL包括了所有对数据库的操作,主要是由五个部分组成:
① 数据定义:别称“DDL语言”,定义数据库的逻辑结构(数据库、基本表、视图、索引)。
② 数据操纵:别称“DML语言”,含插入、删除和更新三种操作。
③ 数据查询:别称“DQL语言”,包括数据查询操作。
④ 数据控制:别称“DCL语言”,对用户访问数据的控制有基本表和视图的授权及回收。
⑤ 事务控制:别称“TCL语言”,包括事务的提交与回滚。
SQL学习内容:
① SQL语句基本操作
② 常用函数、分组函数、多表查询
③ 子查询、存储过程、事务、视图、触发器
3、JDBC
JDBC一般指Java数据库链接,是Java语言中用来规范客户端程序如何访问数据库应用程序接口,提供诸如查询和更新数据库数据的方法。
学习内容:
① JDBC连接数据库常用接口使用
② 结果集处理
③ Statement 和PreparedStatement区别
④ 事务处理
学习以上内容后,会让人更容易学习并理解大数据所要使用到的数据库及相关工具框架。
二、HBase
HBase全称为Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。
HBase学习内容:
① HBase模型坐标结构访问场景
② HBase访问Shell接口
③ HBase访问API接口
④ HBaseRowkey设计
⑤ HBase合并分裂数据定位
三、MongoDB
MongoDB是一个基于分布式文件存储的数据库,一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的一种数据库。它支持非常松散的数据结构,类似于JSON的bson格式,因此可以存储更复杂的数据类型。Mongo最重要的特性是它支持的查询语言非常强大。它的语法有点类似于面向对象的查询语言。它几乎可以实现大多数类似关系数据库单表查询的功能,并且支持数据的索引。
学习内容:
① MongoDB 原理概念模型场景
② MongoDB :CRUD操作
③ MongoDB 工具、安全和用户管理
四、Redis
Redis全称为Remote Dictionary Server,即远程字典服务,是NoSQL数据库中使用较为广泛的非关系型内存数据库,一个用ANSIC语言编写的开源日志类型和Key-Value数据库,支持网络化、基于内存和持久化。它还提供多种语言的API。
Redis学习内容:
① Redis安装
② Redis配置
③ Redis持久化RDB与AOF
④ Redis操作
⑤ Redis Sentinel
⑥ Redis Cluster
在上面对于Redis的介绍中,有介绍到Redis是NoSQL数据库中使用较为广泛的非关系型内存数据库,那么NoSQL数据库是什么?下面将会简短的介绍一下NoSQL数据库:
NoSQL仅仅是一个概念,泛指非关系型的数据库,区别于关系型数据库,不保证关系数据的ACID特性。特点是易扩展、大数据量与高性能、灵活的数据模型、高可用。
五、Hive
Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive数据仓库工具可以将结构化数据文件映射到数据库表,并提供SQL查询功能,它可以将SQL语句转换为MapReduce任务执行。Hive具有学习成本低的优点。它可以通过类似的SQL语句实现快速的MapReduce统计,使MapReduce更简单,而不需要开发特殊的MapReduce应用程序。Hive非常适合于数据仓库的统计分析。
Hive学习内容:
① HIve体系结构机制场景
② HiveDDL操作
③ Hive 文件格式和DML操作
④ HiveDQL操作
⑤ Hive客户端
⑥ Hive函数操作
⑦ Hive性能优化
六、ES
ES全称为ElasticSearch,是一个基于Lucene的搜索服务器,也是一种流行的企业级搜索引擎。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。
学习内容:
① ElasticSearch概念
② 倒排索引与分词原理
③ ElasticSearch 分布式搭建
④ Mapping设置
⑤ ElasticSearch 基本索引
⑥ ElasticSearch 高级索引
⑦ ElasticSearch 的运行机制
在大数据技术中,数据库是必不可少的一部分,以上内容就是我们学习大数据技术时所要学习到数据库,现在大家知道了大数据学习什么数据库了吗?
- 上一篇: JAVA数据库编程(java数据库编程实例)
- 下一篇: SQL入门知识篇(sql入门视频)
猜你喜欢
- 2025-03-19 MySQL三大日志:binlog、redolog、undolog全解析
- 2025-03-19 SQL注入——数据库增删改查语句(sql数据库实现增删改查)
- 2025-03-19 数据库系统学习基础篇——(一) 初识MySQL
- 2025-03-19 详解MySQL的逻辑架构和SQL语句执行流程
- 2025-03-19 SQL入门知识篇(sql入门视频)
- 2025-03-19 JAVA数据库编程(java数据库编程实例)
- 2025-03-19 [MySQL] SQL语句分类 DDL语句详解
- 2025-03-19 mysql数据库分析(mysql总结与分析)
- 2025-03-19 salesforce 零基础学习(三十七) DML及Database方法简单描述
- 2025-03-19 什么是SQL(什么是sql server)
- 最近发表
- 标签列表
-
- newcoder (56)
- 字符串的长度是指 (45)
- drawcontours()参数说明 (60)
- unsignedshortint (59)
- postman并发请求 (47)
- python列表删除 (50)
- 左程云什么水平 (56)
- 计算机网络的拓扑结构是指() (45)
- 稳压管的稳压区是工作在什么区 (45)
- 编程题 (64)
- postgresql默认端口 (66)
- 数据库的概念模型独立于 (48)
- 产生系统死锁的原因可能是由于 (51)
- 数据库中只存放视图的 (62)
- 在vi中退出不保存的命令是 (53)
- 哪个命令可以将普通用户转换成超级用户 (49)
- noscript标签的作用 (48)
- 联合利华网申 (49)
- swagger和postman (46)
- 结构化程序设计主要强调 (53)
- 172.1 (57)
- apipostwebsocket (47)
- 唯品会后台 (61)
- 简历助手 (56)
- offshow (61)