很多想学大数据的同学,对于大数据学哪些课程很迷茫,不知道从何下手。下面,系里的大数据老师带大家看看,学习大数据需要学习哪些具体的课程?
第一,大数据技术的基础
1.linux操作基础
linux系统的介绍和安装
常见的linux命令-文件操作
常见的linux命令——用户管理和权限
常见的linux命令-系统管理
Linux通用命令-无秘密登录配置和网络管理
linux上常见的软件安装
Linux本地yum源码配置和yum软件安装
Linux防火墙配置
Linux高级文本处理命令剪切、sed、awk
Linux定时任务crontab
2.外壳编程
外壳编程-基本语法
外壳编程–过程控制
外壳编程–功能
外壳编程–综合案例–自动化部署脚本
3.内存数据库redis
redis和nosql简介
Redis客户端连接
redis对象缓存字符串数据结构的操作与应用
redis任务调度队列的列表式数据结构操作及应用实例
redis购物车散列和集合数据结构的操作及应用实例
再生列排序集数据结构的操作及应用实例
4.布料协调服务动物园管理员
动物园管理员介绍及应用场景
动物园管理员集群安装和部署
动物园管理员的数据节点和命令行操作
动物园管理员的java客户端基本操作和事件监控
动物园管理员核心机制和数据节点
Zookeeper应用案例分布式共享资源锁
Zookeeper应用案例–服务器启动和关闭的动态感知
动物园管理员的数据一致性原则和领导选举机制
5.java的高级特性得到了增强
Java多线程基础知识
Java同步关键词详解
Java并发契约线程池及其在开源软件中的应用
Java并发契约消息团队及其在开源软件中的应用
Java JMS技术
Java动态代理反射
6.轻量级RPC框架开发
RPC原理学习
Nio原理学习
Netty通用API学习
轻量级RPC框架的需求分析和原理分析
轻量级RPC框架的开发
第二,离线计算系统
1.hadoop QuickStart
Hadoop背景介绍
分布式系统概述
离线数据分析流程介绍
集群建筑
群集使用初步
2.HDFS增强
HDFS的概念和特征
HDFS shell(命令行客户端)操作
HDFS的工作机制
NAMENODE的工作机制
java的api操作
案例1:开发外壳收集脚本
3.MAPREDUCE详解
自定义hadoop的RPC框架
Mapreduce编程规范和示例编写
Mapreduce程序运行模式及调试方法
mapreduce程序运行模式的内在机制
mapreduce计算框架的主要工作流程
自定义对象的序列化方法
MapReduce编程案例
4.MAPREDUCE增强
Mapreduce排序
自定义分区程序
Mapreduce的组合器
mapreduce工作机制详解
5、MAPREDUCE实战
映射任务并行机制——文件切片
Maptask并行度设置
倒排索引
共同的朋友
6.联盟的介绍和蜂巢的使用
Hadoop的高可用性机制
高可用性集群的安装和部署
集群运维测试中数据节点的动态上下行
集群运维测试的节点状态切换管理
集群运行维护测试中数据块的平衡
HDFS-房委会辖下的空气污染指数变动
蜂巢介绍
蜂巢建筑
蜂巢安装部署
Hvie首次使用
7.蜂巢增强和水槽介绍
HQL-DDL基本语法
HQL-DML基本语法
HIVE的Join
HIVE参数配置
HIVE自定义函数和转换
HIVE执行HQL的实例分析
HIVE最佳实践注意点
HIVE优化策略
HIVE实战案例
水槽介绍
水槽的安装和部署
案例:收集HDFS名录
案例:向HDFS收集文件
第三,流量计算
1.从入门到精通的风暴
什么是风暴
风暴建筑分析
风暴建筑分析
风暴编程模型,元组源代码,并发分析
风暴字数案例及常用应用编程接口分析
风暴集群的实际部署
风暴+卡夫卡+Redis的业务指标计算
Storm源代码下载和编译
Strom集群启动和源代码分析
风暴任务提交和源代码分析
风暴数据传输过程分析
风暴通信机制分析
风暴消息的容错机制及源代码分析
风暴多流项目分析
编写自己的流式任务执行框架
2.风暴上下游及架构整合
什么是消息队列
Kakfa核心组件
卡夫卡集群部署实战与共同指挥
梳理卡夫卡的配置文件
Kakfa JavaApi学习
卡夫卡文件存储机制分析
Redis基础和独立环境部署
Redis数据结构及典型案例
水槽入门
水槽+卡夫卡+风暴+Redis融合
第四,内存计算系统Spark
1.scala编程
scala编程介绍
Scala相关软件安装
Scala基本语法
Scala方法和函数
scala函数式编程的特点
Scala数组和集合
Scala编程练习(独立字数统计)
Scala面向对象
Scala模式匹配
演员编程入门
选项和部分功能
实战:演员并发字数
真皮化
隐式转换
2.AKKA和刚果爱国者联盟
Akka并发编程框架
实战:RPC编程实战
3.火花快速启动
火花引入
星火环境建设
RDD简介
RDD的变革与行动
实战:RDD综合演练
RDD高级操作员
自定义分区程序
实战:网站访问量
广播变量
实战:根据IP计算归属
自定义排序
使用JDBC·RDD的数据导入和导出
世界计数执行过程的详细说明
4.RDD详解
RDD属地
RDD缓存机制
RDD检查站机制
火花任务执行过程分析
RDD舞台部
5.Spark-Sql应用程序
实现
火花与蜂巢结合
数据帧
实战:火花-SQL和数据帧案例
6.SparkStreaming应用于实战
火花流简介
火花流编程
实战:StageFulWordCount
结合火花流的水槽
卡夫卡结合火花流
窗口函数
推出ELK技术堆栈
弹性搜索安装和使用
风暴建筑分析
风暴编程模型,元组源代码,并发分析
风暴字数案例及常用应用编程接口分析
7.Spark核心源代码分析
Spark源代码编译
火花远程调试
Spark任务提交行流程源代码分析
Spark通信过程源代码分析
SparkContext创建过程的源代码分析
司机和客户之间沟通过程的源代码分析
工人启动执行器进程的源代码分析
执行者和驱动者之间注册过程的源代码分析
执行器注册驱动的源代码分析
调度器和任务调度器的源代码分析
Shuffle过程的源代码分析
任务执行过程的源代码分析
5.机器学习算法
1.python和numpy库
机器学习导论
机器学习和python
Python语言-入门
Python语言-详细数据类型
Python语言——流量控制语句
Python语言-函数用法
Python语言——模块和包
Phthon语言——面向对象
Python机器学习算法库-numpy
机器学习必需的数学知识——概率论
2.常见算法的实现
Knn分类算法——算法原理
Knn分类算法-代码实现
Knn分类算法-手写识别案例
谱系回归分类算法——算法原理
谱系回归分类算法——算法实现和演示
朴素贝叶斯分类算法——算法原理
朴素贝叶斯分类算法——算法实现
朴素贝叶斯分类算法——垃圾邮件识别应用案例
Kmeans聚类算法——算法原理
Kmeans聚类算法——算法实现
Kmeans聚类算法——地理位置聚类应用
决策树分类算法——算法原理
决策树分类算法——算法实现
好吧,那就是大数据要学的课程。学生们帮助你了吗?更多关于大数据的问题,请找鼓童先生一对一在线指导。
1.《大数据课程 大数据需要学习哪些课程》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《大数据课程 大数据需要学习哪些课程》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/junshi/1255368.html