一提到多线程,你首先想到的是什么?是并发执行?是执行效率加快?你真的了解多线程吗?又对多线程了解多少呢?接下来就让我们从多线程的应用场景等方面来聊一聊多线程。
一
什么是多线程?
多线程(英语:multithreading),是指从软件或者硬件上实现多个线程并发执行的技术。
以上是多线程的定义,让我们通俗的解释下多线程:多线程用于堆积处理,就像一个大土堆,一个推土机很慢,那么十个推土机一起来处理呢,当然速度就快了。不过由于位置的限制,如果推土机过多,那么推土机之间会产生相互的避让,相互摩擦,相互拥挤,反而不如十个推土机处理的效率高。所以多线程处理,线程数要开的恰当,这样才会提高效率。
二
多线程的使用目的
多线程是为了同步完成多项任务,不是为了提高运行效率,而是为了提高资源使用效率来提高系统的效率。线程是在同一时间需要完成多项任务的时候实现的。
1、吞吐量:做WEB,容器帮你做了多线程,但是它只能帮你做请求层面的。简单的说,就是一个请求一个线程(如struts2,是多线程的,每个客户端请求创建一个实例 ,保证线程安全),或多个请求一个线程,如果是单线程,那只能处理一个用户的请求。
2、伸缩性:通常增加CPU核数来提升技能。
多线程就像火车的每一节车厢,而进程则是火车。车厢离开火车是无法跑动的,同理火车也不可能只有一节车厢。多线程的出现就是为了提高效率。
三
多线程的应用场景
在大多数研究领域内是要求线程调度程序要能够快速选择其中一个已就绪线程去运行,而不是一个一个运行而降低效率。所以要让调度程序去分辨线程的优先级是很重要的。而线程调度程序可能是以硬件、软件,或是软硬件并存的形式存在。
1、常见的是浏览器,Web服务(现在写的Web是中间件帮助完成了线程的控制),web处理请求,各种专用服务器(如游戏服务器)
2、servlet多线程
3、FTP下载,多线程操作文件
4、swing编程
5、分布式计算
6、tomcat:Tomcat内部采用多线程,上百个客户端访问同一个Web应用,tomcat介入后就是把后续的处理扔给一个新的线程来处理,这个新的线程最后调用我们的servlet程序,比如doGet或doPost
7、后台任务:如定时向大量(100W以上)的用户发送邮件;定期更新配置文件,任务调度,监控用于定期信息采集
8、自动作业处理:比如定期备份日志、定期备份数据库
9、异步处理:如发微博、记录日志
10、页面异步处理:比如大批量数据的核对工程(有10W个手机号码,核对哪些是已有用户)
11、数据库的数据分析,数据迁移
12、多步骤的任务处理,可根据步骤特征选用不同个数和特征的线程来协作处理;多任务的分割,由一个主线程分割给多个线程来完成
13、desktop应用开发,一个费时的计算开个线程,前台加个进度条显示
四
案例说明
一个文本文件有100M,全部是字符串,要执行节分字符串,没达到N长度便要执行切分,最后求切分完成后的字符串的集合
单线程处理:
读取文本数据,扫描全部数据,一个一个的切分,最后消耗时间=文件传输时间(文本数据加载到内存)+切分过程消耗
多线程处理:
专门设置一个线程执行加载数据的操作,此时,如果加载的数据达到一个设定值,启动一个切线程来处理,如此继续,多个切分字符串的线程能够并发执行,CPU的利用率提高了(文件传输的过程中没有占用处理器,而可以将加载的部分数据分配给切分线程,占用处理器来执行任务)
五
总结
单线程处理:文件加载的过程中,处理器一直空闲,但也被加入到总执行时间之内,串行执行切分总时间,等于每切分一个时间*切分后字符串的个数,执行程序,估计等几分钟能处理完就不错了。
多线程处理:文件加载过程与拆分过程,拆分过程与拆分过程,都存在并发——文件加载的过程中就执行了切分任务,切分任务执行过程中多线程并行处理,总消耗时间能比单线程提高很多,甚至几个数量级都不止。
往期经典
领取专属 10元无门槛券
私享最新 技术干货