大数据作为近年来的热点,受到的关注不可谓是不多,在轰轰烈烈的大数据浪潮下,越来越多的人开始注意到大数据的价值,认可大数据的发展前景,其中不乏很多人即将毕业的学生,想通过大数据培训,来学习大数据,为找工作做准备。今天的暑假大数据培训分享,我们来讲解大数据入门SQL基础。
在大数据当中,SQL无疑是获得再次发展的机遇,大数据相关的职位,对SQL基础的要求都在招聘要求当中明明白白的写着,入行做大数据,对于SQL基础部分的学习,尤其需要重视起来。
SQL是一种表达力非常强的语言,在大数据当中,常用的数据分析方法,绝大部分都可以使用SQL表达出来。
SQL的语法有国际标准,非常简洁统一,书写方便,易学易用。在大数据主流框架当中,HiveQL和SparkSQL的绝大部分语法都是遵循SQL国际标准,因此学会SQL,再学HiveQL和SparkSQL就很轻松了。
并且,SQL的运行非常方便,有各种各样的成熟工具。编写完成后,可以很方便地运行,方便调试。SQL是开发者与数据库管理系统对话的语言,而数据库是大数据系统平台当中提供关键性技术支撑。
SQl入门,先从关键字开始学起。SQL有很多关键字,每个关键字的含义和用法都不相同。下面先例举一些常见的命令:
SELECT:后面跟用户想获取的列或计算公式
FROM:后面跟要读取数据的表
LEFT/RIGHT/INNER JOIN:后面跟要进行关联的表
ON:后面跟关联条件
WHERE:后面跟过滤条件,只有满足条件的行才会保留下来
GROUP BY:后面跟用来分组的列或计算公式
HAVING:后面跟分组后的过滤条件
ORDER BY:后面跟用于排序的列或计算公式
LIMIT:从结果中选取前N行,后面跟具体行数
DISTINCT:对后面跟的列进行去重
COUNT:对指定的一列或多列计数,会忽略掉NULL值
SUM:对指定的列求和,会忽略掉NULL值
AVG:对指定的列求平均值,会忽略掉NULL值
MIN:求指定列的最小值
MAX:求指定列的最大值
ASC/DESC:ASC表示升序排列,DESC表示降序排列,与ORDER BY配合使用
[NOT]IN:多条件搜索
[NOT]LIKE:模糊匹配
REGEXP:正则匹配
AND/OR/NOT:逻辑判断符
[NOT]BETWEEN AND:区间限定
[NOT]EXISTS:判断集合是否为空
IS[NOT]NULL:判断是否为NULL值
UNION/UNION ALL:求两个集合的并集,UNION会剔除结果集中的重复记录,UNION ALL则会保留重复记录
AS:取别名或用于使用查询结果集创建表
*:单独出现或出现在"."后面表示表中的所有列,出现在两个字段间表示乘法
关于暑假大数据培训,大数据入门SQL基础讲解,以上就是今天为大家分享的一些内容了,当然,SQL只是大数据培训当中的一小部分,更多还是大数据专业技术的学习,欢迎大家持续关注。成都加米谷大数据,专业
大数据培训机构,大数据开发、数据分析与挖掘,个人培训&企业内训,课程大纲及学习资料可联系客服领取!