内容简介:啃碎并发(一):Java线程总述与概念
在JDK5之前,Java的多线程(包括它的性能)一直是个软肋,只有synchronized、Thread.sleep()、Object.wait/notify这样有限的方法,而synchronized的效率还特别地低,开销比较大。JDK5相对于前面版本是重大改进,不仅在 Java 语法上有了很多改进(包括泛型、装箱、for循环、变参等),在多线程上有了彻底的提高,其引进了并发编程大师Doug Lea的java.util.concurrent包(后面简称J.U.C), 支持了现代CPU的CAS原语 ,不仅在性能上有了很大提升,在自由度上也有了更多的选择,此时 J.U.C的效率在高并发环境下的效率远优于synchronized 。
但 JDK6(Mustang 野马)中对synchronized的内在机制做了大量显著的优化,加入了CAS的概念以及偏向锁、轻量级锁,使得synchronized的效率与J.U.C不相上下 ,并且官方说后面该关键字还有继续优化的空间,所以在现在JDK7的时代, synchronized已经成为一般情况下的首选,在某些特殊场景——如可中断的锁、条件锁、等待获得锁一段时间如果失败则停止,J.U.C是适用的 ,所以对于 多线程研究来说,了解其原理以及各自的适用场景是必要的 。
2 基本概念
2.1 线程
线程是依附于进程的,进程是分配资源的最小单位,一个进程可以生成多个线程,这些线程拥有共享的进程资源。就每个线程而言,只有很少的独有资源, 如控制线程运行的线程控制块,保留局部变量和少数参数的栈空间等 。线程有就绪、阻塞和运行三种状态,并可以在这之间切换。也正因为多个线程会共享进程资源,所以当它们对同一个共享变量/对象进行操作的时候,线程的冲突和不一致性就产生了。
多线程并发环境下,本质上要解决地是这两个问题:
- 线程之间如何通信。
- 线程之间如何同步。
概括起来说就是:线程之间如何正确地通信。虽然说的是在Java层面如何保证,但会涉及到 java虚拟机、Java内存模型,以及Java这样的高级语言最终是要映射到CPU来执行(关键原因是如今的CPU有缓存、并且是多核的) ,虽然有些难懂,但对于深刻把握多线程是至关重要的,所以需要多花一些时间。
2.2 锁
当多个线程对同一个共享变量/对象进行操作,即使是最简单的操作,如i++,在处理上实际也涉及到读取、自增、赋值这三个操作,也就是说 这中间存在时间差,导致多个线程没有按照如程序编写者所设想的去顺序执行,出现错位,从而导致最终结果与预期不一致 。
Java中的多线程同步是通过锁的概念来体现。 锁不是一个对象、不是一个具体的东西,而是一种机制的名称 。锁机制需要保证如下两种特性:
- 互斥性 :即在同一时间只允许一个线程持有某个对象锁,通过这种特性来实现多线程中的协调机制,这样在同一时间只有一个线程对需同步的代码块(复合操作)进行访问。互斥性我们也往往称为操作的原子性。
- 可见性 :必须确保在锁被释放之前,对共享变量所做的修改,对于随后获得该锁的另一个线程是可见的(即在获得锁时应获得最新共享变量的值),否则另一个线程可能是在本地缓存的某个副本上继续操作从而引起不一致。
2.3 挂起、休眠、阻塞与非阻塞
挂起(Suspend):当线程被挂起的时候,其会失去CPU的使用时间,直到被其他线程(用户线程或调度线程)唤醒。
休眠(Sleep):同样是会失去CPU的使用时间,但是在过了指定的休眠时间之后,它会自动激活,无需唤醒(整个唤醒表面看是自动的, 但实际上也得有守护线程去唤醒,只是不需编程者手动干预 )。
阻塞(Block):在线程执行时,所需要的资源不能得到,则线程被挂起,直到满足可操作的条件。
非阻塞(Block):在线程执行时,所需要的资源不能得到,则线程不是被挂起等待,而是继续执行其余事情,待条件满足了之后, 收到了通知(同样是守护线程去做)再执行 。
挂起和休眠是独立的操作系统的概念,而阻塞与非阻塞则是在资源不能得到时的两种处理方式,不限于操作系统,当资源申请不到时,要么挂起线程等待、要么继续执行其他操作,资源被满足后再通知该线程重新请求。显然非阻塞的效率要高于阻塞,相应的实现的复杂度也要高一些。
在Java中显式的挂起原先是通过Thread的suspend方法来体现,现在此概念已经消失,原因是suspend/resume方法已经被废弃,它们容易产生死锁,在suspend方法的注释里有这么一段话: 当suspend的线程持有某个对象锁,而resume它的线程又正好需要使用此锁的时候,死锁就产生了 。所以在现在的JDK版本中, 挂起是JVM的系统行为,程序员无需干涉 。休眠的过程中也不会释放锁,但它一定会在某个时间后被唤醒,所以不会死锁。 现在我们所说的挂起,往往并非指编写者的程序里主动挂起,而是由操作系统的线程调度器去控制 。所以,我们常常说的“线程在申请锁失败后会被挂起、然后等待调度”这样有一定歧义, 因为这里的“挂起”是操作系统级别的挂起,其实是在申请资源失败时的阻塞,和Java中的线程的挂起(可能已经获得锁,也可能没有锁,总之和锁无关)不是一个概念 ,很容易混淆,所以在后文中说的挂起,一般指的是操作系统的操作,而不是Thread中的suspend()。
相应地我们有必要提下java.lang.Object的wait/notify,这两个方法同样是等待/通知,但它们的 前提是已经获得了锁,且在wait(等待)期间会释放锁 。在wait方法的注释里明确提到: 线程要调用wait方法,必须先获得该对象的锁,在调用wait之后,当前线程释放该对象锁并进入休眠 (这里到底是进入休眠还是挂起?文档没有细说, 从该方法能指定等待时间来看,我觉得更可能是休眠,没有指定等待时间的,则可能是挂起,不管如何,在休眠/挂起之前,JVM都会从当前线程中把该对象的锁释放掉 ),只有以下几种情况下会被唤醒:其他线程调用了该对象的notify或notifyAll、当前线程被中断、调用wait时指定的时间已到。
2.4 内核态与用户态
这是两个操作系统的概念,但理解它们对我们理解Java的线程机制有着一定帮助。
有一些系统级的调用,比如清除时钟、创建进程等这些系统指令,如果这些底层系统级指令能够被应用程序任意访问的话,那么后果是危险的,系统随时可能崩溃,所以 CPU将所执行的指令设置为多个特权级别,在硬件执行每条指令时都会校验指令的特权 ,比如Intel x86架构的CPU将特权分为0-3四个特权级,0级的权限最高,3权限最低。
而操作系统根据这系统调用的安全性分为两种: 内核态和用户态 。 内核态执行的指令的特权是0,用户态执行的指令的特权是3 。当一个任务(进程)执行系统调用而进入内核指令执行时,我们就说进程处于内核运行态(或简称为内核态)。当任务(进程)执行自己的代码的时候,就处于用户态。这就像我们Java的class,有很多的private方法,但对外公开的只有少量public方法一样,这些private方法只有class本身可以调用的,不允许外界调用,否则会产生意料不到的问题。
那明白了内核态和用户态的概念之后,我们来看在这两种状态之间切换会造成什么样的效率影响( 这里所说的切换就是执行一段用户代码、再执行一段内核代码、再执行一段用户代码这样的交替行为,说交替执行更合适,说切换有些混淆 )。 在执行系统级调用时,需要将变量传递进去、可能要拷贝、计数、保存一些上下文信息,然后内核态执行完成之后需要再将参数传递到用户进程中去,这个切换的代价相对来说是比较大的,所以应该是尽量避免频繁地在内核态和用户态之间切换 。
好了,那操作系统的这两种形态和我们的线程主题有什么关系呢?这里是关键。 Java并没有自己的线程模型,而是使用了操作系统的原生线程 !如果要实现自己的线程模型,那么有些问题就特别复杂,难以解决,比如如何处理阻塞、如何在多CPU之间合理地分配线程、如何锁定,包括创建、销毁线程这些,都需要Java自己来做,在JDK1.2之前Java曾经使用过自己实现的线程模型,后来放弃了,转向使用操作系统的线程模型,因此创建、销毁、调度、阻塞等这些事都交由操作系统来做, 而线程方面的事在操作系统来说属于系统级的调用,需要在内核态完成,所以如果频繁地执行线程挂起、调度,就会频繁造成在内核态和用户态之间切换,影响效率 (当然,操作系统的线程操作是不允许外界(包括Java虚拟机)直接访问的,而是开放了叫“轻量级进程”的接口供外界使用,其与内核线程在Window和 Linux 上是一对一的关系,这里不多叙述)。
我们说JDK5之前的synchronized效率低下, 是因为在阻塞时线程就会被挂起、然后等待重新调度,而线程操作属于内核态,这频繁的挂起、调度使得操作系统频繁处于内核态和用户态的转换,造成频繁的变量传递、上下文保存等,从而性能较低 。
3 线程优势
尽管面临很多挑战,多线程有一些优点使得它一直被使用。这些优点是:
- 资源利用率更好
- 程序设计在某些情况下更简单
- 程序响应更快速
3.1 资源利用率更好
CPU能够在等待IO的时候做一些其他的事情。这个不一定就是磁盘IO。它也可以是网络的IO,或者用户输入。通常情况下,网络和磁盘的IO比CPU和内存的IO慢的多。
3.2 程序设计更简单
在单线程应用程序中,如果你想编写程序手动处理多个IO的读取和处理的顺序,你必须记录每个文件读取和处理的状态。相反,你可以启动两个线程,每个线程处理一个文件的读取和操作。 线程会在等待磁盘读取文件的过程中被阻塞 。 在等待的时候,其他的线程能够使用CPU去处理已经读取完的文件 。其结果就是,磁盘总是在繁忙地读取不同的文件到内存中。这会带来磁盘和CPU利用率的提升。而且每个线程只需要记录一个文件,因此这种方式也很容易编程实现。
3.3 程序响应更快速
将一个单线程应用程序变成多线程应用程序的另一个常见的目的是实现一个响应更快的应用程序。设想一个服务器应用,它在某一个端口监听进来的请求。当一个请求到来时,它去处理这个请求,然后再返回去监听。
如果一个请求需要占用大量的时间来处理,在这段时间内新的客户端就无法发送请求给服务端。只有服务器在监听的时候,请求才能被接收。
另一种设计是,监听线程把请求传递给工作者线程池(worker thread pool),然后立刻返回去监听。而工作者线程则能够处理这个请求并发送一个回复给客户端。
4 线程代价
从一个单线程的应用到一个多线程的应用并不仅仅带来好处,它也会有一些代价。 不要仅仅为了使用多线程而使用多线程 。而应该明确在使用多线程时能多来的好处比所付出的代价大的时候,才使用多线程。如果存在疑问,应该尝试测量一下应用程序的性能和响应能力,而不只是猜测。
4.1 设计更复杂
虽然有一些多线程应用程序比单线程的应用程序要简单,但其他的一般都更复杂。在多线程访问共享数据的时候,这部分代码需要特别的注意。线程之间的交互往往非常复杂。不正确的线程同步产生的错误非常难以被发现,并且重现以修复。
4.2 上下文切换开销
当CPU从执行一个线程切换到执行另外一个线程的时候, 它需要先存储当前线程的本地的数据,程序指针等,然后载入另一个线程的本地数据,程序指针等 ,最后才开始执行。这种切换称为“上下文切换”(“context switch”)。CPU会在一个上下文中执行一个线程,然后切换到另外一个上下文中执行另外一个线程。
上下文切换并不廉价。如果没有必要,应该减少上下文切换的发生。
4.3 增加资源消耗
线程在运行的时候需要从计算机里面得到一些资源。 除了CPU,线程还需要一些内存来维持它本地的堆栈。它也需要占用操作系统中一些资源来管理线程 。我们可以尝试编写一个程序,让它创建100个线程,这些线程什么事情都不做,只是在等待,然后看看这个程序在运行的时候占用了多少内存。
5 创建运行
编写线程运行时执行的代码有两种方式: 一种是创建Thread子类的一个实例并重写run方法,第二种是创建类的时候实现Runnable接口 。
5.1 创建Thread的子类
创建Thread子类的一个实例并重写run方法,run方法会在调用start()方法之后被执行。例子如下:
public class MyThread extends Thread { public void run(){ System.out.println("MyThread running"); } }
可以用如下方式创建并运行上述Thread子类:
MyThread myThread = new MyThread(); myTread.start();
一旦线程启动后start方法就会立即返回,而不会等待到run方法执行完毕才返回。就好像run方法是在另外一个cpu上执行一样。当run方法执行后,将会打印出字符串MyThread running。
5.2 实现Runnable接口
第二种编写线程执行代码的方式是新建一个实现了java.lang.Runnable接口的类的实例,实例中的方法可以被线程调用。下面给出例子:
public class MyRunnable implements Runnable { public void run(){ System.out.println("MyRunnable running"); } }
为了使线程能够执行run()方法,需要在Thread类的构造函数中传入 MyRunnable的实例对象。示例如下:
Thread thread = new Thread(new MyRunnable()); thread.start();
当线程运行时,它将会调用实现了Runnable接口的run方法。上例中将会打印出”MyRunnable running”。
5.3 创建子类还是实现Runnable接口?
对于这两种方式哪种好并没有一个确定的答案,它们都能满足要求。就个人意见,更倾向于实现Runnable接口这种方法。 因为线程池可以有效的管理实现了Runnable接口的线程,如果线程池满了,新的线程就会排队等候执行,直到线程池空闲出来为止 。而如果线程是通过实现Thread子类实现的,这将会复杂一些。
有时我们要同时融合实现Runnable接口和Thread子类两种方式。例如, 实现了Thread子类的实例可以执行多个实现了Runnable接口的线程 。一个典型的应用就是线程池。
5.4 常见错误:调用run()方法而非start()方法
创建并运行一个线程所犯的常见错误是调用线程的run()方法而非start()方法,如下所示:
Thread newThread = new Thread(MyRunnable()); newThread.run(); //should be start();
起初你并不会感觉到有什么不妥,因为run()方法的确如你所愿的被调用了。但是, 事实上,run()方法并非是由刚创建的新线程所执行的,而是被创建新线程的当前线程所执行了 。也就是被执行上面两行代码的线程所执行的。想要让创建的新线程执行run()方法,必须调用新线程的start方法。
5.5 线程名
当创建一个线程的时候,可以给线程起一个名字。它有助于我们区分不同的线程。例如:如果有多个线程写入System.out,我们就能够通过线程名容易的找出是哪个线程正在输出。例子如下:
MyRunnable runnable = new MyRunnable(); Thread thread = new Thread(runnable, "New Thread"); thread.start(); System.out.println(thread.getName());
需要注意的是,因为MyRunnable并非Thread的子类,所以MyRunnable类并没有getName()方法。可以通过以下方式得到当前线程的引用:
Thread.currentThread();
因此,通过如下代码可以得到当前线程的名字:
String threadName = Thread.currentThread().getName();
首先输出执行main()方法线程名字。这个线程JVM分配的。然后开启10个线程,命名为1~10。每个线程输出自己的名字后就退出。
public class ThreadExample { public static void main(String[] args){ System.out.println(Thread.currentThread().getName()); for(int i=0; i<10; i++){ new Thread("" + i){ public void run(){ System.out.println("Thread: " + getName() + "running"); } }.start(); } } }
需要注意的是, 尽管启动线程的顺序是有序的,但是执行的顺序并非是有序的 。也就是说,1号线程并不一定是第一个将自己名字输出到控制台的线程。这是因为线程是并行执行而非顺序的。 JVM和操作系统一起决定了线程的执行顺序,他和线程的启动顺序并非一定是一致的 。
6 并发与并行
并发和并行的区别就是 一个处理器同时处理多个任务 和 多个处理器或者是多核的处理器同时处理多个不同的任务 。 前者是逻辑上的同时发生(simultaneous),而后者是物理上的同时发生 。
并发性(concurrency),又称共行性,是指能处理多个同时性活动的能力,并发事件之间不一定要同一时刻发生。
并行(parallelism)是指同时发生的两个并发事件,具有并发的含义,而并发则不一定并行。
来个比喻: 并发和并行的区别就是一个人同时吃三个馒头和三个人同时吃三个馒头 。
上图反映了一个包含8个操作的任务在一个有两核心的CPU中创建四个线程运行的情况。假设每个核心有两个线程,那么每个CPU中两个线程会交替并发,两个CPU之间的操作会并行运算。 单就一个CPU而言两个线程可以解决线程阻塞造成的不流畅问题,其本身运行效率并没有提高,多CPU的并行运算才真正解决了运行效率问题,这也正是并发和并行的区别 。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- java中线程安全,线程死锁,线程通信快速入门
- ObjC 多线程简析(一)-多线程简述和线程锁的基本应用
- Java多线程之线程中止
- Android 的线程和线程池
- iOS 多线程之线程安全
- java多线程 线程安全问题
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
JS 压缩/解压工具
在线压缩/解压 JS 代码
XML 在线格式化
在线 XML 格式化压缩工具