`大数据`分类下的文章

大数据

Apache Kafka - 介绍

Apache Kafka起源于LinkedIn,后来成为2011年的开源Apache项目,然后在2012年成为Apache的一流项目。Kafka以Scala和Java编写>。Apache Kafka是基于发布订阅的容错消息系统。它是快速,可扩展和分布的设计。

阅读剩下更多

Apache Kafka - 介绍
大数据

kafka安装及部署

kafka安装及部署,下载Kafka并解压 kafka_2.11-0.10.1.1.tgz. 百度网盘下载地址- 链接 ![](https://pan.baidu.com/s/1hrJOIPI) 密码 67i9,下载后解压,tar -zxvf kafka_2.11-0.10.1.1.tgz

阅读剩下更多

kafka安装及部署
大数据

Kafka 介绍

Apache Kafka是一个分布式发布 -订阅消息系统和一个强大的队列,可以处理大量的数据,并使您能够将消息从一个端点传递到另一个端点。Kafka适合离线和在线消息消费。Kafka消息保留在磁盘上,并在群集内复制以防止数据丢失。

阅读剩下更多

Kafka 介绍
大数据

浅谈HDFS-20170705

Hadoop分布式文件系统(HDFS)是一种分布式文件系统,用于在商品硬件上运行。它与现有的分布式文件系统有很多相似之处。然而,与其他分布式文件系统的区别很大。HDFS具有高度的容错能力,旨在部署在低成本的硬件上。HDFS提供对应用程序数据的高吞吐量访问,适用于具有大数据集的应用程序。HDFS现在是一个Apache Hadoop子项目。项目URL为http://hadoop.apache.org/hdfs/。

阅读剩下更多

浅谈HDFS-20170705
大数据

Hadoop安装

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。

阅读剩下更多

Hadoop安装
返回顶部