Spark [spɑːrk] 计算引擎--tony技术网站

Spark [spɑːrk] 计算引擎

发布于：2023-08-26 20:55:30

Spark [spɑːrk]

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越，换句话说，Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

Spark 是在 Scala 语言中实现的，它将 Scala 用作其应用程序框架。与 Hadoop 不同，Spark 和 Scala 能够紧密集成，其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。

https://baike.baidu.com/item/Apache%20Spark/59924870?fromtitle=Spark&fromid=2229312&fr=aladdin

阅读 230+ 10

热门标签

加星文章

最新排行

阅读排行

友情链接

Java程序员进阶...

PHP 5 Array 函数（php基本知识）

鱼皮 - Java 学习路线

菜鸟Java

大话设计模式-php版

奇安信Webscan

阿里巴巴矢量图标库

花瓣网

Java 全栈知识体系

开发者头条

RabbitMQ

细说php 66页

ThinkPHP5+Vue2.5

Webpack 入门教程

ReflectionClass 反射类

Bootstrap4

jQuery API 中文文档

walle 瓦力

招商银行个人存款计算器

Maven 教程

Spring 教...

Docker 教程

Linux 教程

尚硅谷IDEA教程(idea经典之作)

ES6 教程

2021年度全网最全Web前端学习路线-视频

T-SQL 教程

vue全家桶

Less 教程

TypeScript 快速入门

CSS3 教程

JavaScript

Vue3 教程

Android 教程

Laravel 7...

showdoc
屏幕尺寸大全

Vite中文网 (vitejs.cn)

C#教程

workermanPHP应用容器

菜鸟教程提供的工具集

ES6 入门教程

产品经理必备网址导航