我的位置: 主页 > 北大青鸟新闻 > 行业新闻 > > 成都零基础学大数据要从哪里开始?

成都零基础学大数据要从哪里开始?

2019-07-17 15:54北大青鸟锦江天府学院
[导读] 学习大数据,并不是一味的跟风去学习,而是需要制定自己的学习计划。大数据技术包含的方面很多,但不是每一门技术都需要去掌握。
首先,你需要确定你学习大数据是否为了更高的薪资,以及个人能力的提升。其次,你需要了解市场需求,经常去招聘网站去了解,目前大数据比较火爆的技术有哪些,总结出目前比较流行的大数据技术。
?
目前,大数据比较火爆的技术,主要有以下几个:
Hadoop, 可能很多人都了解过这门技术,但是并不知道这门技术到底是否对企业有作用,这门技术分三块:MapReduce,Yarn以及HDFS,其中MapReduce是分布式计算模型,但是现在在企业中实际用的非常少,原因很多,主要是一个是编写的复杂程度以及执行速度相对比较慢,所以很多公司放弃掉了它。Yarn,是统一资源管理器,现在用的还比较多,对于集群来说,通常需要跑很多的程序,如果没有统一的资源管理,将无法充分利用集群的资源,如:CPU、内存等。

HDFS,分布式文件系统,这个用的相对比较多,很多着名的分布式数据库都是基于HDFS的,如Hbase。

Spark,这个应该是目前最火爆的技术之一了,它是一个一站式分布式计算平台,它包含SparkCore、SparkStreaming、SparkMllib、SparkSQL,它不仅能做实时处理,还能进行离线处理、机器学习以及图计算,非常强大,只要掌握一门Spark就能做各种事情,所以它也是一站式的。

Kafka,最开始是作为消息中间件,随着时间的推移,逐渐发展围完备的流式处理平台,它包含Producer、Consumer、Connector及Streaming。在大数据中,它一般以分布式数据总线的角色存在。后期出了Connector,可以用作数据收集和输出,Streaming用来做相对简单的流处理。
?
Hbase,分布式列式数据库,有时候也称为KeyValue数据库,之前也说到它是基于Hadoop的。用它的人分两类,一类是觉得不好用的人,一类是觉得非常好用的人。Hbase重点在于它的设计与调优,如果能有一个好的表设计和RowKey设计,能针对实际业务场景最好调优,那它是非常好用的。
?
Scala,这里说一门语言,它是大数据的黄金语言,着名的Kafka和Spark就是用Scala编写的。它是函数式和面向对象完美结合的语言,大家可以认为它是Java的加强版语言,特别适合用来做分析。
?
其他的如:Mongodb、Redis 建议去掌握,因为交互式查询时一般会用到这两个数据库。
当然根据不同的业务可能会用到其他更多的技术,但是主流技术如上所述。
?
北大青鸟一直在为年轻人实现职业梦想而努力,因此,为帮助年轻人把握好互联网的风口,北大青鸟大数据课程应运而生!
相较于其他IT培训机构来说,北大青鸟是较早开设大数据课程的,其教师也在IT行业,大数据领域有着多年工作经验!
北大青鸟课程设置方面,以JavaEE为学员打好框架基础,学习Hadoop进行大数据处理,涵盖大数据离线数据分析、实时数据分析、内存计算三大部分,并且包含其他主流大数据开发工具,如flume、hive、hbase等等,后续有计划加入Python、爬虫、数据挖掘分析等相关热点内容。
相信在这里,你能发现和找到自己所喜欢的专业,学习到一个技能,进入所梦想的行业!
热点专题
>>
相关文章推荐
>>