已选条件 :  
img
Hadoop安装.txt

主要是对hadoop的安装配置的过程,包括网络配置,ssh免密登录以及hadoop的配置文件

img
hadoop-book-master.7z

hadoop权威指南代码及数据hadoop权威指南数据集(NCDC) Hadoop The Definitive Guide中使用的天气数据集

img
mastering-spark-sql.pdf

Jacek Laskowski的mastering-spark-sql.pdf,该资源为spark-sql部分

img
Beijing.zip

spark代码 利用spark常用算子,计算mro的数据等信息,

img
Beijing-1.0-SNAPSHOT-jar-with-dependencies.jar

spark代码 利用spark常用的算子函数,实现复杂的的计算

img
离群点挖掘方法综述_薛安荣.pdf

离群点挖掘方法综述_薛安荣.pdf

img
vivino网站葡萄酒数据+爬虫程序

vivino网站葡萄酒信息,使用Python开发爬虫,从vivino网站爬取的数据,压缩包中main.py为爬虫程序,wine.csv为当时爬取的数据

img
环境部署(一)-虚拟机安装.pdf

安装虚拟机 1.配置网络 2.设置UseDNS为no 3.关闭防火墙 4.关闭SELinux 5.同步系统时间

img
cuda_10.1.105_418.39_linux.run(Ubuntu 18.04)

sudo bash cuda_10.1.105_418.39_linux.run ,安装路径默认/usr/locol

img
zookeeper安装教程.pdf

zookeeper安装教程.pdf,详细介绍了这么安装zookeeper,与使用znode

img
数据分析项目by_BIGBOSS.zip

数据分析项目所有资源,包含整个项目必须的代码,答辩ppt都有!

img
apache-hive-1.2.1源码包(已编译)(含Hive的使用全解).tar.gz

apache-hive-1.2.1源码包(已编译)(含Hive的使用全解)

img
HBASE_thrift_cpp.rar

使用C++,通过thrift来访问Hbase数据库,实现数据表的操作,增删查等

img
linux下的jdk安装包.txt

这个按照rpm,jdk安装包,资源是百度云盘的地址。希望大家能有所收获

img
sqoop-1.4.6-cdh5.7.6.tar.gz

大数据环境cdh5.7.6版本的sqoop压缩包 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

img
基于关联规则的增量更新算法.pdf

分析了基于关联规则的增量数据挖掘算法 , 针对传统数据挖掘算法多次迭代扫描 , 数据库和最小支持度不能同时发生变化 , 数据结构复杂等的不足 , 提出哈希增量数据挖掘算法 HIUA 。该算法只需要扫描数据库一次 , 并且采用常用的哈希存储结构 , 数据结构简单 , 操作方便、可行 , 通过测试结果表明该算法是合理有效的。

img
一种分段曲线拟合方法研究.pdf

分段曲线拟合方法研究,可以写成一段程序,自动分段拟合

img
S2 (2).zip

Spark Core 实现Spark的基本功能,包括任务调度、内存管理、错误恢复、与存储系统交互等,以及RDD(Resilient Distributed Dataset)API的定义。

img
BaiduNetdiskDownload.zip

Hadoop的出现解决了互联网时代的海量数据存储和处理,其是一种支持分布式计算和存储的框架体系。假如把Hadoop集群抽象成一台机器的话,理论上我们的硬件资源(CPU、Memoery等)是可以无限扩展的。

img
全jar包.zip

内含 hadoop-hdfs-2.7.1-sources.jar,hadoop-common-2.7.1.jar,zookeeper-3.4.6.jar等大数据所用到的74个jar包

最新Chat
  • 作者/分享人:李烨 · 微软高级软件工程师

  • 作者/分享人:应书澜 · 阿里巴巴资深工程师

  • 作者/分享人:张仕超 · 技术圈次元壁破冰者

公告