想要高薪职位?先学大数据技术
加米谷
大数据
  • 市面大数据培训占比

    市面上大数据培训鱼龙混杂,有Java、PHP、数据库大数据等,但真正大数据 是hadoop、spark、storm、超大集群调优、机器学习、Docker容器引擎、 ElasticSearch、并发编程等,别人不能讲的我们讲,别人能讲的我们讲得很 深入。

  • 真正大数据市场价值很高

    以北京为例,真正大数据工程师平均年薪达201640-451670

  • 大数据工程师人才缺口大

    数据表明,近几年间大数据人才缺口就已高达百万,目前企业高薪都难以找 到足够的大数据开发人才,大数据从业者的增长量,远远满足不了市场需求 的扩张,大数据人才需求将出现“井喷”现象

  • 大数据工程师发展空间巨大

    大数据行业应用广泛,大数据职业的相关人才匮乏,人才缺口非常大。职业选 择多达几十种,要升职加薪很容易!可以说,未来的大数据工作,就意味着高 薪、稳定、广泛的职业使用度、优越感……

加米谷大数据课程,贴合企业用人需求

学员起薪8K+,丰富项目实战,可考取大数据相关证书 中国科学管理研究院提供证书,全国通用

了解证书详情 >>
大数据培训,我们首先看课程专业度
国家大数据标准组成员+企业大数据总架构师+企业项目经理联合研发课程(万行级代码,企业真实项目实战)
第一阶段
(Java设计与
编程思想)
  • Java基础

    1、Java是什么类型语言,Java语言的编译、解释、执行过程
    2、Java运行环境的安装和配置
    3、标识符与关键字
    4、基本数据类型
    5、方法初识
    6、运算符与表达式
    7、分支语句
    8、循环语句
    9、Math、Date、Random

  • Java面向对象

    1、什么是面向对象
    2、类、对象、数组
    3、介绍面向对象多态
    4、抽象类的概念
    5、抽象类的声明语法
    6、抽象类被继承
    7、接口的声明语法
    8、实现接口的实现类
    9、普通类与抽象类思想上的区别
    10、抽象类与接口思想上的区别

  • Java高级

    1、异常处理
    2、I/O、JavaBean
    3、反射/多线程
    4、网络编程
    5、泛型和集合

  • 数据库与JDBC

    1、安装与介绍
    2、创建数据库与表
    3、表与表之间关系
    4、字段类型/函数/查询语句
    5、存储器/触发器
    6、增删改查
    7、事务并发
    8、操作存储器和触发器

第二阶段
(Web前端开发)
  • HTML基础

    1、Web开发简介
    2、开发环境介绍
    3、html与css编程介绍
    4、JavaScript编程介绍
    5、头部标记/文字格式标记
    6、字体/列表/图像标记
    7、超链接/表格/表单
    8、框架

  • CSS3

    1、web标准
    2、css语法基础与选择器
    3、css继承与优先级
    4、css编写原则
    5、css属性与浮动
    6、css盒子模型
    7、css定位

  • JS脚本编程

    1、JavaScript定义
    2、JavaScript特点与核心
    3、JavaScript开发环境
    4、JavaScript基本使用
    5、DOM介绍与节点相关操作
    6、DOM类型与操作
    7、DOM获取表格元素
    8、DOM获取元素样式

  • 事件与JQuery框架

    1、事件介绍与内联模型
    2、脚本模型与事件对象
    3、键盘事件与鼠标事件
    4、JQuery基本语法
    5、JQuery常用选择器
    6、JQuery事件处理
    7、JQuery文档操作

第三阶段
(JavaEE进阶)
  • Web环境配置

    1、Tomcat服务器

  • JavaWeb开发核心

    1、JSP&Servlet基础
    2、JSP&Servlet高级

  • SSM框架

    1、SpringIOC
    2、SpringAOP
    3、SpringMVC配置文件详解
    4、OGNL详解
    5、控制器的实现
    6、注解方式实现
    7、文件上传与下载
    8、拦截器详解
    9、表单验证流程详解
    10、SSM + Jquery + Ajax整合开发

  • Mysql

    1、数据库基础知识
    2、SQL理论基础和数据类型
    3、DDL、LML、DQL语句
    4、函数和关联查询
    5、子查询、约束、视图
    6、编程存储过程,触发器
    7、Sql查询案例和优化

第四阶段
(大数据基础:Linux
基础、Maven基础)
  • Linux系统管理

    1、Linux安装
    2、用户与用户组管理
    3、文件操作
    4、目录操作
    5、RPM安装与卸载
    6、YUM安装与卸载
    7、打包、压缩与解压缩
    8、网络配置(network)
    9、后台运行程序(nohup & ;)

  • Shell编程设计

    1、Shell是什么
    2、Shell分类
    3、基本语法与环境变量
    4、预定义变量
    5、用户变量
    6、特殊符号使用
    7、逻辑判断与流程控制
    8、正则表达式
    9、模式匹配 10、Grep使用

  • Maven部署/配置/仓库

    1、Maven部署
    2、Maven配置
    3、Maven安装目录解析
    4、Maven本地仓库与中央仓库
    5、Maven远程仓库
    6、Maven 私服
    7、如何从Maven远程仓库下载
    8、Maven添加远程仓库
    9、部署至远程仓库
    10、Maven镜像

  • Maven POM

    1、Maven核心元素
    2、Maven核心插件/坐标/依赖
    3、Maven依赖范围
    4、Maven传递性依赖
    5、Maven依赖调解/可选依赖/排除依赖
    6、Maven快照及发布版本
    7、Maven聚合与继承
    8、Maven依赖管理与插件管理
    9、Maven反应堆与灵活构建

第五阶段
(HDFS分布式文
件系统)
  • HDFS原理剖析

    1、HDFS概念
    2、HDFS内核/读写原理
    3、HDFS数据块
    4、HDFS数据副本的存放策略
    5、HDFS安全模式/负载均衡/机架感应
    6、HDFS名称节点NameNode
    7、HDFS第二名称节点SecondNameNode
    8、HDFS高可用HA/联邦Federation

  • HDFS 编程实践

    1、HDFS分布式文件读取
    2、HDFS写入剖析/读取剖析组
    3、HDFS一致模型/数据完整性
    4、HDFS压缩/序列化
    5、HDFS基于文件的数据结构
    6、HDFS数据备份/网络拓扑
    7、HDFS集群的构建和安装
    8、HDFS配置管理/环境设置/安全性
    9、文件系统操作Hadoop fs与hdfs dfs

第六阶段+第七阶段+
第八阶段
(MapReduce分布
式计算模型+Yarn分
布式资源管理器
+Zookeeper分布式
协调服务
  • MapReduce原理剖析

    1、MapReduce产生背景
    2、MapReduce适用场景
    3、MapReduce基本原理
    4、MapReduce作业执行流程
    5、MapReduce基本组件
    6、MapReduce JobTracker
    7、MapReduce TaskTracker

  • MapReduce实践

    1、MapReduce高级编程应用
    2、MapReduce Combiner
    3、MapReduce Partitioner
    4、MapReduce性能优化技巧
    5、MapReduce案例分析
    6、MapReduce开发实践操作

  • Yarn原理剖析

    1、Yarn架构设计
    2、Yarn核心原理
    3、Yarn主节点ResourceManager
    4、Yarn从节点NodeManager
    5、Yarn从节点Container
    6、Yarn的Application

  • Zookeeper原理+实践

    1、Zookeeper 介绍
    2、Zookeeper核心原理
    3、Zookeeper结构
    4、Zookeeper Server
    5、Zookeeper Client程
    6、Zookeeper访问
    7、Zookeeper常用访问工具

第九阶段+第十阶段
(Hbase分布式数据
库+Hive分布式数据仓库)
  • Hbase原理剖析

    1、Hbase存储原理
    2、Hbase列式存储原理
    3、Hbase稀疏存储设计
    4、Hbase KeyValue存储设计
    5、Hbase数据多版本
    6、Hbase Rowkey设计
    7、Hbase 存储无模式设计

  • Hbase编程实战象

    1、Hbase 访问Shell接口实践
    2、Hbase 访问API接口实践
    3、Hbase 实战训练/p>

  • Hive原理剖析

    1、Hive介绍
    2、Hive应用场景
    3、Hive架构
    4、Hive运行原理
    5、Hive命名空间
    6、Hive库的位置
    7、Hive数据仓库

  • Hive实践

    1、Hive创建库
    2、Hive修改库与删除库
    3、Hive普通表与带分区的表
    4、Hive带Bucket的表/外部表/相似表
    5、Hive分区/Bucket管理/向Hive表中装载与插入数据
    6、创建并加载数据到Hive表与导出数据
    7、Hive SelectFrom/Where/GroupBy/Join

第十一阶段+第十二
阶段
(FlumeNG分布式数据采集系统+Sqoop大数据迁移系统)
  • FlumeNG原理剖析

    1、FlumeNG概述
    2、FlumeNG部署配置
    3、FlumeNG分布式架构
    4、FlumeNG应用场景
    5、FlumeNG与同类产品的优缺点
    6、FlumeNG工作原理
    7、FlumeNG运行时系统实现的逻辑

  • FlumeNG实践

    1、FlumeNG指定文件数据作为数据源
    2、FlumeNG监测并读取新增文件数据作为数据源
    3、FlumeNG命令输出作为数据源
    4、FlumeNG监听TCP的端口作为数据源
    5、FlumeNG获取HTTP数据作为数据源
    6、FlumeNG HDFS作为输出源
    7、FlumeNG本地目录作为输出源

  • Sqoop原理剖析

    1、Sqoop介绍
    2、Sqoop架构原理/p>

  • Sqoop实践

    1、数据迁入大数据存储
    2、数据迁出大数据存储

第十三阶段+第十四
阶段
(Scala大数据黄金语言+kafka分布式总线系统)
  • Scala语法剖析

    1、Scala基础
    2、Scala流程控制
    3、Scala异常处理
    4、Scala数据类型
    5、Scala运算符
    6、Scala函数基础
    7、Scala匿名函数
    8、Scala嵌套函数
    9、Scala递归函数、部分应用函数、柯里函数、高阶函数

  • Scala应用实践

    1、Scala闭包
    2、Scala对象
    3、Scala特征
    4、Scala模式匹配
    5、Scala隐式转换
    6、Scala Lists
    7、Scala Seqs
    8、Scala Sets
    9、Scala Maps
    10、Scala Tuples、Scala Iterators、Scala Options

  • Kafka原理剖析

    1、Kafka初识
    2、Kafka主题
    3、Kafka日志
    4、Kafka生产者
    5、Kafka消费者
    6、Kafka消费组
    7、Kafka消息读写原理
    8、Kafka位移管理
    9、Kafka副本机制、分布式、消息传送机制

  • Kafka实践

    1、Kafka命令工具
    2、Kafka生产API
    3、Kafka消费API
    4、Kafka实战训练

第十五阶段+第十六
阶段+第十七阶段
(SparkCore大数据计算基石+SparkSQL数据挖掘利器+SparkStreaming流式计算平台)
  • SparkCore核心原理

    1、SparkCore 基础原理
    2、SparkCore核心代码剖析
    3、SparkCore运行架构
    4、Rdd编程模型
    5、Rdd内存弹性分布式数据集的工作原理和机制
    6、RDD Transform
    7、RDD Action

  • SparkSQL原理

    1、SparkSQL简介
    2、SparkSQL运行原理
    3、SparkSQL程序开发光速入门
    4、SparkSQL程序开发之数据源
    5、SparkSQL程序开发之DataFrame态
    6、SparkSQL程序开发之DataSet
    7、SparkSQL程序开发之数据类型
    8、SparkSQL实战训练

  • SparkStreaming原理

    1、SparkStreaming原理
    2、SparkStreaming与Storm 在流处理方面的比较
    3、SparkStreaming与Spark 交互的实现机制
    4、SparkStreaming核心代码剖析

  • SparkStreaming实践

    1、SparkStreaming 滑动窗口
    2、SparkStreaming foreachRDD
    3、SparkStreaming 性能优化
    4、SparkStreaming 持久化
    5、SparkStreaming Checkpoint
    6、SparkStreaming 容错
    7、SparkStreaming 事务
    8、SparkStreaming客户端编程实践

第十八阶段+第十九
阶段
(SparkMllib机器学习平台+SparkGraphx图计算平台)
  • SparkMllib算法模型原理

    1、数据挖掘基础知识
    2、机器学习基础知识
    3、机器学习案例
    4、Mahout/Spark MLib 并行挖掘平台中的关联规则
    5、Mahout/Spark MLib 并行挖掘平台中的预测协同过滤
    6、Mahout/Spark MLib 并行挖掘平台中的推荐模型
    7、SparkMllib模型的原理
    8、SparkMllib模型的算法实现

  • SparkMllib算法实践

    1、推荐分析模块的深度剖析
    2、推荐分析算法MapReduce并行实现及应用开发
    3、关联规则挖掘算法Ma-
    pReduce并行实现及应用开发
    4、频繁模式挖掘算法的Ma-
    pReduce并行实现及应用开发
    5、回归预测的 MapReduce实现和Spark 实现技术
    6、局部加权线性回归预测算法MapReduce、Spark实现技术

  • SparkGraphX核心原理

    1、SparkGraphX基础原理
    2、SparkGraphX核心代码剖析

  • SparkGraphX实践

    1、SparkGraphX客户端 API 介绍
    2、基于 Spark GraphX 实现图数据的分析程序开发

第二十阶段
(大数据项目实战)
  • 电商数据离线分析平台

    用SparkSQL、SparkStreaming,进行离线计算和实时计算业务模块的开发。实现了用户访问session 分析、页面单跳转化率统计、热门商品离线统计、广告点击流量实时统计4 个业务模块。合理的将实际业务模块进行技术整合与改造,项目完全涵盖了Spark Core、Spark SQL和Spark Streaming这三个技术框架中几乎所有的功能点、知识点以及性能优化点

  • 移动基站信号监测大数据

    移动通信基站信号数据采集,实时分析及移动信号监测系统。该系统利用移动与联通两家运营商的信令数据,通过对基站信号大数据的实时提取与分析,结合基站信号覆盖模式、信号强弱、覆盖区域等实际情况,实时动态采集及分析监测置信度较高、精度较高的移动基站信号监测系统。

  • 运维大数据平台

    银行和金融服务行业相关系统每天产生数以 TB 计的交易、支付、渠道等各种日志数据。运维大数据平台为迅速增长的海量数据建立全新的处理策略和维护能力,应对日趋复杂的管理需求。运维大数据通过海量日志数据分析,可以帮助银行机构提高服务质量,占据竞争优势。

  • 舆情大数据平台

    舆情大数据监测平台系统是针对互联网新兴媒体,通过对海量网络舆论信息进行实时的自动舆情采集,舆情分析,舆情汇总,舆情监视,并识别其中的关键舆情信息,及时通知到相关人员,从而第一时间应急响应,为正确舆论导向及收集网友意见提供直接支持的一套信息化平台。

申请免费试听课程 >>
自主研发大数据实训云平台,学员可随时随地练手
练得代码多了,技术也就掌握了
立即申请试用 >>
  企业级项目实操,可接触项目底层代码
  • 滴滴打车车辆与用户数据
  • 京东电商用户画像分析平
  • 基于分布式计算的用户行
  • 天眼查企业征信大数据分
  • 舆情大数据

项目名称: 滴滴打车车辆与用户数据

项目简述:
本项目涉及用户画像对出行需求者和滴滴司机行为进行画像,并在海量数据中通过连接和匹配算法寻找可匹配的供需对象。

所用技术:Hadoop + MongoDB + Memcached + Ngnix + Mysql

项目名称: 京东电商用户画像分析平

项目简述:
通过用户画像数据还原用户的属性特征、社会背景、兴趣爱好,甚至还能揭示内心需求、性格特点、社交人群等潜在属性。通过数据源、数据建模、数据集市等多方面的代码练习,了解用户画像过程及建模方式。

所用技术:HDFS + hbase + kafka + Flume + redis +Spark +storm

项目名称: 基于分布式计算的用户行

项目简述:
电商平台用户行为分析,获取用户感兴趣或经常浏览的数据,并经过分布式计算,对所有用户的行为数据进行统计分析,智能化精准投放推荐商品及广告,能够可视化的方式展示用户的喜好等。

所用技术:websocket + kafka + Spark + flume + redis + hdfs + hive + echarts

项目名称: 天眼查企业征信大数据分

项目简述:
本项目通过网络爬虫抓取公开的企业工商数据、法律诉讼信息、知识产权、商标专利等信息,并对数据进行关联细分数据可视化等操作,掌握Solr的使用方法和优化技巧。

所用技术:Client + HDFS + solr + MapReduce + Hbase + Spark

项目名称: 舆情大数据

项目简述:
通过分布式爬虫,从互联网爬取海量数据,通过清洗、转换并挖缺出热点数据,能够对这些数据进行统计分析并对网络信息进行监控。

所用技术:Spark + mongodb + hdfs + yarn + hbase + kafka + redis

  丰富项目实战师资团队
授课老师均来自一线互联网公司,5年以上项目实战经验
了解更多讲师详情 >>
贴合企业用人需求的课程,自然成就学员高薪就业

180902班
平均月薪11080

181005班
平均月薪12030

181105班
平均月薪10990

以上统计就业信息,仅是学员毕业后的首份工作起薪,不包含绩效、奖金、补助等各种福利
点击查看更多就业信息 >>

部分学员就业喜报

对于就业,我们多重保障
入学签订就业保障协议,提供就业指导,通过考核后,推荐200+人才培养合作企业中,实现精准就业,快速进入大数据行业。

入学即签订“就业保障协议”,毕业即就业

为保障学员顺利就业,加米谷大数据与200+行业内大数据企业达成人才培养及定向输送战略合作协议,用海量优质高薪大数据岗位保障学员顺利就业。
学员在入学加米谷大数据之前签订就业保障协议,只要学员按要求正常入学、上课、考勤、参加阶段考试并通过,按时完成作业及实战项目等,均可保障学员顺利就业!

完善教学体系,从入学到就业,我们全程服务
  • 入学指导

    课程老师全程在线,有任何问题可一对一咨询解答

  • 阶段测评

    每个阶段设置阶段测评,评测近段时间学习成果,及时查漏补缺

  • 项目实训

    阶段项目实训,在实践中完善自身技能,增加项目经验

  • 结业测评

    最后企业项目实战操作,检测学习成果,为就业做准备

  • 就业指导

    就业老师指导简历、面试技巧,推荐就业企业,保障学员就业

大数据开发班往期开课情况与学员活动
更多学员关心问题,可以获取一对一解答
加米谷部分合作企业
立即申请>>