首页
学习
活动
专区
圈层
工具
发布

#spark

Apache Spark是一个开源集群运算框架,Spark使用了存储器内运算技术,能在数据尚未写入硬盘时即在存储器内分析运算。

Gemini Spark深度拆解:Google给AI一台永不关机的云服务器

陆业聪

• 中俄元首会晤叠加万亿科创再贷款政策,A股做多情绪显著回暖,资金聚焦AI与半导体主线

7410

DGX Spark 赋能!spark-dictate 离线语音听写工具,本地极速转录直达剪贴板

GPUS Lady

有开发者基于DGX Spark打造了一款轻量化离线语音听写工具——spark-dictate,以解决传统在线语音工具隐私泄露、网速受限、高额收费等痛点。日常办公...

10710

4节点DGX Spark分布式大模型推理集群搭建、实测数据与踩坑总结

GPUS Lady

近期一技术开发者完成了一套4节点DGX Spark分布式大模型推理集群的搭建与全场景性能实测,专门用于LLM分布式推理任务。

34910

Gemma 4 × DGX Spark 问答全集:你关心的问题,一次讲透

GPUS Lady

Gemma 4 推出了一系列强大的全新原生多模态与多语言模型家族,可完整适配 NVIDIA 全系列硬件 —— 从数据中心的 Blackwell 架构到边缘端的 ...

26610

【赵渝强老师】Hadoop的伪分布部署模式

赵渝强老师

Hadoop的安装和部署是大数据生态圈体系中最麻烦的一个。Hadoop部署完成后,进一步地部署Spark和Flink就非常容易了。Hadoop的部署模式分为本地...

9810

告别 Spring Boot!Spark Java 极简框架快速开发 RESTful API 全解析

jack.yang

在 Java Web 开发的世界里,我们习惯了 Spring Boot 的“全栈式”解决方案,也领略了 Vert.x 的“响应式”魅力。然而,当面对一个简单、明...

17620

告别 Spring Boot!Spark Java 极简框架快速开发 RESTful API 全解析

jack.yang

在 Java Web 开发的世界里,我们习惯了 Spring Boot 的“全栈式”解决方案,也领略了 Vert.x 的“响应式”魅力。然而,当面对一个简单、明...

17620

万字长文:Spark Java “无配置”哲学下的全方位设置指南

jack.yang

在 Java Web 开发领域,“配置文件”几乎是所有框架的标准组件。Spring Boot 有 application.properties,Dropwiza...

10820

万字长文:Spark Java “无配置”哲学下的全方位设置指南

jack.yang

在 Java Web 开发领域,“配置文件”几乎是所有框架的标准组件。Spring Boot 有 application.properties,Dropwiza...

10820

一文搞定 DGX Spark + PyTorch 微调:从数据准备到模型验证全链路

GPUS Lady

本教程对应 Arm 官方高级学习路径,聚焦在 NVIDIA DGX Spark 工作站上,通过 PyTorch 与 Hugging Face 生态对 Llama...

61910

数仓入门篇-维度模型与第三范式

用户12062117

第三范式(Third Normal Form, 3NF)源于关系型数据库理论,由 E.F. Codd 提出,也是传统 OLTP(在线事务处理)系统(如 ERP、...

18610

【赵渝强老师】使用TiSpark在Spark中访问TiDB

赵渝强老师

TiSpark是TiDB为解决用户复杂OLAP需求而推出的产品。它借助Spark平台,同时融合TiKV分布式集群的优势,和TiDB一起为用户一站式解决HTAP的...

13710

DGX Spark 实测评测:官方基准与实际应用的差距解析

GPUS Lady

近期后台收到很多开发者咨询 DGX Spark 的实际性能与开发体验。为了更真实、客观地回答大家,我们专门整理了一线开发者的实测笔记,从性能表现、上手难度、实际...

2.3K10

NVIDIA DGX Spark 多节点集群搭建,这些坑千万别踩!

GPUS Lady

外网一位技术博主曾录制过一期趣味十足的技术视频,视频中他详细分享了自己从4台NVIDIA DGX Spark硬件入手,逐步扩展至8台、搭建大模型训练与推理集群的...

3.4K10

NVIDIA DGX Spark全维度问答:性能优化/教育应用/双集群支持,你想问的都在这

GPUS Lady

A: NVIDIA 最近在 GitHub 上发布了详细的性能指南,可以在 build.nvidia.com/spark 页面找到链接。该指南提供了如何使用不同框...

62710

NVIDIA 发布 DGX Spark 性能基准测试指南,赋能多节点 AI 高效部署

GPUS Lady

英伟达(NVIDIA)今日正式发布 DGX Spark 性能基准测试指南(),该指南不仅适用于 NVIDIA 原生 DGX Spark 设备,更全面适配所有搭载...

89410

玩转 PySpark 自定义函数:UDF、UDAF、UDTF 全解析与实战

ETL 小当家

UDF 的核心逻辑是一行进、一个值出,本质上是对表中每一行的某个字段做一次独立的转换或计算,结果作为新的一列返回。你可以把它理解为对每一行数据套用同一个"加工模...

24610

Spark SQL练习1-电商用户行为分析

用户12062117

在数字化转型的浪潮中,全球领先的电商平台**商城每天承载着数亿级用户的访问与交易。面对海量的用户行为数据,如何从中挖掘商业价值、实现精准营销、提升用户生命周期价...

18410

PySpark入门教程(非常详细)从零基础入门到精通

用户12062117

注:本章节将重点阐述基于3.5.8版本的Spark Core,并采用Python语言进行代码实现。尽管在企业级应用中,Spark SQL得到了更为广泛的应用,老...

38710

Spark SQL Catalyst 优化器详解

ETL 小当家

宏观来看:Spark SQL 语句,经过一个优化器(Catalyst),转化为 RDD,交给集群执行。

25410
领券