前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >[译]理解 Node.js 的中 Worker Threads

[译]理解 Node.js 的中 Worker Threads

作者头像
腾讯IVWEB团队
发布于 2020-06-28 02:48:50
发布于 2020-06-28 02:48:50
2.1K00
代码可运行
举报
运行总次数:0
代码可运行

原文:https://nodesource.com/blog/worker-threads-nodejs

理解 Node 的底层对于理解 Workers 是很有必要的。

当一个 Node.js 的应用启动的同时,它会启动如下模块:

  • 一个进程
  • 一个线程
  • 事件循环机制
  • JS 引擎实例
  • Node.js 实例

一个进程:process 对象是一个全局变量,可在 Node.js 程序中任意地方访问,并提供当前进程的相关信息。

一个线程:单线程意味着在当前进程中同一时刻只有一个指令在执行。

事件循环:这是 Node.js 中需要重点理解的一个部分,尽管 JavaScript 是单线程的,但通过使用回调,promises, async/await 等语法,基于事件循环将对操作系统的操作异步化,使得 Node 拥有异步非阻塞 IO 的特性。

一个 JS 引擎实例:即一个可以运行 JavaScript 代码的程序。

一个 Node.js 实例:即一个可以运行 Node.js 环境的程序。

换言之,Node 运行在单线程上,并且在事件循环中同一时刻只有一个进程的任务被执行,每次同一时刻只会执行一段代码(多段代码不会同时执行)。这是非常有效的,因为这样的机制足够简单,让你在使用 JavaScript 的时候无需担心并发编程的问题。

这样的原因在于 JavaScript 起初是用于客户端的交互(比如 web 页面的交互或表单的验证),这些逻辑并不需要多线程这样的机制来处理。

所以这也带来了另一个缺点:如果你需要使用 CPU 密集型的任务,比如在内存中使用一个大的数据集进行复杂计算,它会阻塞掉其他进程的任务。同样的,当你在发起一个有 CPU 密集型任务的远程接口请求时,也同样会阻塞掉其他需要被执行的请求。

如果一个函数阻塞了事件循环机制直到这个函数执行完才能执行下一个函数,那么它就被认为是一个阻塞型函数。一个非阻塞的函数是不会阻塞住事件循环进行下一个函数的执行的,它会使用回调通知事件循环函数任务已执行完毕。

最佳实践:不要阻塞事件循环,要让事件循环保持不断运行,并且注意避免使用回阻塞线程的操作比如同步的网络接口调用或死循环。

区分开 CPU 密集型操作与 I/O(input/output) 密集型操作是很重要的。像前面所说的,Node.js 并不会同时执行多段代码,只有 I/O 操作才会同时去执行,因为它们是异步的。

所以 Worker Threads 对于 I/O 密集型操作是没有太大的帮助的,因为异步的 I/O 操作比 worker 更有效率,Wokers 的主要作用是用于提升对于 CPU 密集型操作的性能。

其他方案

此外,目前已经存在很多对于 CPU 密集型操作的解决方案,比如多进程(cluster API)方案,保证了充分利用多核 CPU。

这个方案的好处在于进程之间是相互独立的,如果一个进程出现了问题,并不会影响到其他进程。此外它们还拥有稳定的 API,然而,这也意味着不能同享内存空间,而且进程间通信只能通过 JSON 格式的数据进行交互。

JavaScript 和 Node.js 不会有多线程,理由如下:

所以,人们可能会认为添加一个创建和同步线程的 Node.js 核心模块就可以解决 CPU 密集型操作的需求。

然而并不是,如果添加多线程模块,将会改变语言本身的特性。添加多线程模块作为可用的类或者函数是不可能的。在一些支持多线程的语言比如 Java 中,使用同步特性来使得多个线程之间的同步能够实现。

并且一些数字类型是不够原子性的,这意味着如果你不同步操作它们,在多线程的同时执行计算的情况下,变量的值可能会不断变动,没有确定的值,变量的值可能经过一个线程计算后改变了几个字节,在另一个线程计算后有改变了其他几个字节的数据。比如,在 JavaScript 中一些简单的计算像 0.1 + 0.2 的结果中小数部分有 17 位(小数的最高位数)。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
var x = 0.1 + 0.2; // x will be 0.30000000000000004

但是浮点数的计算并不是 100% 精准的。所以如果不同步计算,小数部分的数字就会因为多个线程永远没有一个准确的数字。

最佳实践

所以解决 CPU 密集型操作的性能问题是使用 Worker Threads。浏览器在很久之前就已经有了 Workers 特性了。

单线程下的 Node.js:

  • 一个进程
  • 一个线程
  • 一个事件循环
  • 一个 JS 引擎实例
  • 一个 Node.js 实例

多线程 Workers 下 Node.js 拥有:

  • 一个进程
  • 多个线程
  • 每个线程都拥有独立的事件循环
  • 每个线程都拥有一个 JS 引擎实例
  • 每个线程都拥有一个 Node.js 实例

就像下图:

Worker_threads 模块允许使用多个线程来同时执行 JavaScript 代码。使用下面这个方式引入:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
const worker = require('worker_threads');

Worker Threads 已经被添加到 Node.js 10 版本中,但是仍处于实验阶段。

使用 Worker threads 我们可以在在同一个进程内可以拥有多个 Node.js 实例,并且线程可以不需要跟随父进程的终止的时候才被终止,它可以在任意时刻被终止。当 Worker 线程销毁的时候分配给该 Worker 线程的资源依然没有被释放是一个很不好的操作,这会导致内存泄漏问题,我们也不希望这样。我们希望这些分配资源能够嵌入到 Node.js 中,让 Node.js 有创建线程的能力,并且在线程中创建一个新的 Node.js 实例,本质上就像是在同一个进程中运行多个独立的线程。

Worker Threads 有如下特性:

  • ArrayBuffers 可以将内存中的变量从一个线程转到另外一个
  • SharedArrayBuffer 可以在多个线程中共享内存中的变量,但是限制为二进制格式的数据。
  • 可用的原子操作,可以让你更有效率地同时执行某些操作并且实现竞态变量
  • 消息端口,用于多个线程间通信。可以用于多个线程间传输结构化的数据,内存空间
  • 消息通道就像多线程间的一个异步的双向通信通道。
  • WorkerData 是用于传输启动数据。在多个线程间使用 postMessgae 进行传输的时候,数据会被克隆,并将克隆的数据传输到线程的 contructor 中。

API:

  • const { worker, parantPort } = require('worker_threads'); =>worker 函数相当于一个独立的 JavaScript 运行环境线程,parentPort 是消息端口的一个实例
  • new Worker(filename) or new Worker(code, { eval: true }) =>启动 worker 的时候有两种方式,可以通过传输文件路径或者代码,在生产环境中推荐使用文件路径的方式。
  • worker.on('message'),worker.postMessage(data) => 这是多线程间监听事件与推送数据的方式。
  • parentPort.on('message'), parentPort.postMessage(data) => 在线程中使用 parentPort.postMessage 方式推送的数据可以在父进程中使用 worker.on('message') 的方式接收到,在父进程中使用 worker.postMessage() 的方式推送的数据可以在线程中使用 parentPort.on('message') 的方式监听到。

例子

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
const { Worker } = require('worker_threads');

const worker = new Worker(`
const { parentPort } = require('worker_threads');
parentPort.once('message',
    message => parentPort.postMessage({ pong: message }));  
`, { eval: true });
worker.on('message', message => console.log(message));      
worker.postMessage('ping');
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ node --experimental-worker test.js
{ pong: ‘ping’ }

上面例子所做的也就是使用 new Worker 创建一个线程,线程中的代码监听了 parentPort 的消息,并且当接收到数据的时候只触发一次回调,将收到的数据传输回父进程中。

你需要使用 --experimental-worker 启动程序因为 Workers 还在实验阶段。

另一个例子:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
const {
	Worker, isMainThread, parentPort, workerData
} = require('worker_threads');

if (isMainThread) {
    module.exports = function parseJSAsync(script) {
        return new Promise((resolve, reject) => {
        	const worker = new Worker(filename, {
        		workerData: script
    		});
            worker.on('message', resolve);
            worker.on('error', reject);
            worker.on('exit', (code) => {
                if (code !== 0)
                    reject(new Error(`Worker stopped with exit code ${code}`));
            });
         });
    };
} else {
    const { parse } = require('some-js-parsing-library');
    const script = workerData;
    parentPort.postMessage(parse(script));
}

上面代码中:

  • Worker: 相当于一个独立的 JavaScirpt 运行线程。
  • isMainThread: 如果为 true 的话说明代码不是运行在 Worker 线程中
  • parentPort: 消息端口被使用来进行线程间通信
  • workerData:被传入 worker 的 contructor 的克隆数据。

在实际使用中,应该使用线程池的方式,不然不断地创建 worker 线程的代价将会超过它带来的好处。

对于 Worker 的使用建议:

  • 传输原生的句柄比如 sockets,http 请求
  • 死锁检测。死锁是一种多个进程间被阻塞的情况,原因是每一个进程都持有一部分资源并等待另一个进程释放它所持有的资源。在 Workers Threads 中死锁检测是非常有用的特性
  • 更好的隔离,所以如果一个线程中受影响,它不会影响到其他线程。

对于 Worker 的一些不好的想法:

  • 不要认为 Workers 会带来不可思议的速度提升,有时候使用线程池会是更好的选择。
  • 不要使用 Workers 来并行执行 I/O 操作。
  • 不要认为创建 Worker 进程的开销是很低的。

最后

Chrome devTools 支持 Node.js 中的 Workers 线程特性。worker_threads 是一个实验模块,如果你需要在 Node.js 中运行 CPU 密集型的操作,目前不建议在生产环境中使用 worker 线程,可以使用进程池的方式来代替。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
[译] 深入理解 Node.js 中的 Worker 线程
原文:https://blog.insiderattack.net/deep-dive-into-worker-threads-in-node-js-e75e10546b11
江米小枣
2020/06/15
2.4K0
Node.js多线程完全指南[每日前端夜话0x43]
很多人都想知道单线程的 Node.js 怎么能与多线程后端竞争。考虑到其所谓的单线程特性,许多大公司选择 Node 作为其后端似乎违反直觉。要想知道原因,必须理解其单线程的真正含义。
疯狂的技术宅
2019/04/23
4.3K0
Node.js多线程完全指南[每日前端夜话0x43]
NodeJS工作线程Worker使用简介
NodeJs为异步单线程模型,其中如果主线程如果执行比较耗CPU的操作,可能会失去响应,因此工作线程(Worker)对于执行 CPU 密集型 JavaScript 操作非常有用。
用户4623659
2024/01/18
9690
一门看懂Node处理CPU密集型任务的方法有哪些
不知道当你听到类似的话时会不会有和我一样的疑惑:单线程的Node为什么适合用来开发I/O密集型应用?按道理来说不是那些支持多线程的语言(例如Java和Golang)做这些工作更加有优势吗?
进击的大葱
2022/12/20
8620
一门看懂Node处理CPU密集型任务的方法有哪些
压榨计算机性能:浏览器和 Node.js 的异步计算
所有的软件代码最终都是通过 CPU 来跑的,能不能把 CPU 高效利用起来是区分性能高低的标志,也就是说不能让它空转。
神说要有光zxg
2021/09/28
6550
一文看懂 Node.js 中的多线程和多进程[每日前端夜话0x107]
Node.js 是一个免费的跨平台 JavaScript 运行时环境,尽管它本质上是单线程的,但是可以在后台使用多个线程来执行异步代码。
疯狂的技术宅
2020/01/14
3.7K0
一文看懂 Node.js 中的多线程和多进程[每日前端夜话0x107]
关于Node,一定要学这个10+万Star项目!
Node.js Best Practices 是 GitHub 上一个超级热门的项目,
沉浸式趣谈
2025/03/29
1280
关于Node,一定要学这个10+万Star项目!
多线程指南:探究多线程在Node.js中的广泛应用
最初,JavaScript是用于设计执行简单的web任务的,比如表单验证。直到2009年,Node.js的创建者Ryan Dahl让开发人员认识到了通过JavaScript 进行后端开发已成为可能,在后端开发中,用到最多的就是多线程以及线程之间的同步功能,今天小编就为大家介绍一下如何使用Node.js实现多线程的应用。
葡萄城控件
2023/10/27
1.1K0
nodejs中使用worker_threads来创建新的线程
之前的文章中提到了,nodejs中有两种线程,一种是event loop用来相应用户的请求和处理各种callback。另一种就是worker pool用来处理各种耗时操作。
程序那些事
2021/01/28
2.4K0
[真] Node多线程
一般人理解 Node 是单线程的,所以 Node 启动后线程数应该为 1,我们做实验看一下。
李振
2021/11/26
8820
[真] Node多线程
node.js 中的进程和线程工作原理
进程是对正在运行中的程序的一个抽象,是系统进行资源分配和调度的基本单位,操作系统的其他所有内容都是围绕着进程展开的
ACK
2024/09/18
1600
node.js 中的进程和线程工作原理
回顾 2024:技术项目、经历与沉淀的启发
2024 年是充满挑战与成长的一年,我有幸参与了多个技术项目,从中收获了宝贵的经验,同时也经历了不少棘手的 BUG 与技术难题。本文将以详实的描述与丰富的代码片段,分享我的成长与启发。
Undoom
2025/01/03
1230
关于Node.js,一定要学这个10+万Star项目 !!
给大家分享一个关于 Node.js 的宝藏项目,目前已经有 10+万 Star,非常值得学习。
沉浸式趣谈
2025/04/02
1010
node 线程池技术让文档编译起飞
最近在维护微信文档这块内容,遇到一个问题,文档数量多起来编译时间会变慢,而且有时候会越来越慢。后面,发现文档的编译一直走的是单线程的,只用到了一个核,顿时感觉有套路可以走了。node 在 v10 过后提出了 worker_threads 模块,它是在一个单独的 node v8 实例进程里面,可以创建多个线程来搞 CPU 任务。
villainhr
2019/08/27
1.8K0
node 线程池技术让文档编译起飞
深入理解Node.js 进程与线程(8000长文彻底搞懂)
进程与 线程是一个程序员的必知概念,面试经常被问及,但是一些文章内容只是讲讲理论知识,可能一些小伙伴并没有真的理解,在实际开发中应用也比较少。本篇文章除了介绍概念,通过Node.js 的角度讲解 进程与 线程,并且讲解一些在项目中的实战的应用,让你不仅能迎战面试官还可以在实战中完美应用。
coder_koala
2019/08/08
2.7K0
深入理解Node.js 进程与线程(8000长文彻底搞懂)
Node开启多线程多进程
我们知道Node.js是以单线程的模式运行的,但它使用的是事件驱动来处理并发,这样有助于我们在多核cpu的系统上创建多个进程,从而提高性能。
不作声
2020/07/21
1.9K0
Node.js 应用中出现 high event loop utilization 现象的原因
Node.js 采用的是基于事件驱动、非阻塞 I/O 的架构,这意味着 Node.js 的执行依赖于一个名为“事件循环(Event Loop)”的机制。事件循环的存在,使得 Node.js 可以通过单个线程处理大量并发连接,具有高效的性能。
编程小妖女
2024/12/20
1460
Node.js 应用中出现 high event loop utilization 现象的原因
nodejs 多线程支持
1、类似于cluster的多进程模式需要判断当前是否主进程,这边也提供了类似的api。通过isMainThread即可。
ACK
2020/01/14
1.2K0
nodejs 多线程支持
解锁Node.js的五大神器:让你的开发之旅更上一层楼
Node.js,一个在开发者中口碑相传的JavaScript运行环境,以其单线程事件循环而著称。但你知道吗?在这个简单的架构之下,隐藏着强大的功能等待被发掘。今天,就让我们一起探索Node.js的五大特性,它们能极大地丰富你的开发体验,包括:
前端达人
2024/02/21
1960
解锁Node.js的五大神器:让你的开发之旅更上一层楼
nodejs中的并发编程
在nodejs中,如果要实现sleep的功能主要是通过“setTimeout + promise”实现,也可以通过“循环空转”来解决。前者是利用定时器实现任务的延迟执行,并通过promise链管理任务间的时序与依赖,本质上nodejs的执行线程并没有真正的sleep,事件循环以及v8仍在运行,是仅仅表现在业务逻辑上sleep;而后者的实现则无疑实在浪费CPU性能,有点类似自旋锁,不符合大多数场景。
欲休
2020/03/23
2.1K0
推荐阅读
相关推荐
[译] 深入理解 Node.js 中的 Worker 线程
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验