最全的大数据学习资料整理
互联网的发展已经有影响了整个世界的进程,从互联网的诞生到现在的互联网时代的成熟,整个互联网正在从IT时代转向DT时代。随着前几年大数据概念的提出。当前的大数据一词不仅在于数据规模的定义,更代表着信息技术的发展进入一个全新的时代。
对于刚刚接触大数据的人来说,可能还不知道学习大数据应该从哪些方面入手,柠檬学院特此翻译了一些资源,供对大数据感兴趣或者想进入大数据行业的人参考学习。更多关于大数据的学习请到柠檬学院,注册就可在线听课学习。
内容有点多,请耐心看完或者收藏。
资源列表:
关系数据库管理系统(RDBMS)
分布式编程
分布式文件系统
文件数据模型
Key -Map 数据模型
键-值数据模型
图形数据模型NewSQL数据库列式数据库
时间序列数据库类SQL处理
数据摄取
实习单位指导教师评语服务编程
调度
机器学习
基准测试
安全性
系统部署
李心艾胖了应用程序
咱们相爱吧大结局搜索引擎与框架
MySQL的分支和演化
Postgr eSQL的分支和演化Memcac hed的分支和演化
嵌入式数据库
商业智能
数据可视化
六小龄童真名物联网和传感器
文章
论文
视频
关系数据库管理系统(RDBMS)
MySQL:世界最流行的开源数据库;
Postgr eSQL:世界最先进的开源数据库;
Oracle数据库:对象-关系型数据库管理系统。
好看的穿越耽美小说框架
Apache Hadoop:分布式处理架构,结合了MapReduce(并行处理)、YARN(作业调度)和HDFS(分布式文件系统);
Tigon:高吞吐量实时流处理框架。
分布式编程
AddThis Hydra:最初在Add This上开发的分布式数据处理和存储系统;
AMPLab SIMR:用在Hado op MapRed uce v1上运行S park;
Apache Beam:为统一的模型以及一套用于定义和执行数据处理工作流的特定SDK语言;
Apache Crunch:一个简单的J ava API,用于执行在普通的Map Reduc e实现时比较单调的连接、数据聚合等任务;
Apache DataFu:由Linke dIn开发的针对Hadoopand 和Pig的用户定义的函数集合;
Apache Flink:具有高性能的执行时间和自动程序优化;
暗月岛在哪Apache Gora:内存中的数据模型和持久性框架;
Apache Hama:BSP(整体同步并行)计算框架;
Apache MapRed uce :在集上使用并行、分布式算法处理大数据集的编程模型; Apache Pig :Hadoop中,用于处理数据分析程序的高级查询语言;
Apache REEF :用来简化和统一低层大数据系统的保留性评估执行框架;
Apache S4 :S4中流处理与实现的框架;
Apache Spark:内存集计算框架;
Apache SparkStreaming :流处理框架,同时是Spa rk的一部分;
Apache Storm:Twitte r流处理框架,也可用于YA RN;
Apache Samza:基于Kafk a和YARN的流处理框架;
Apache Tez :基于YARN,用于执行任务中的复杂D A G(有向无环图);
发布评论