【深入学习JVM 02】HotSpot虚拟机对象探秘

栏目: Java · 发布时间: 7年前

内容简介：虚拟机运行时数据区域描述了虚拟机管理的内存划分情况，但是目前我们对于虚拟机还是有很多困惑，比如：为了搞清楚这些问题，我们先从虚拟机是如何创建对象开始讲起。当虚拟机遇到一条new 指令时，便会进行对象的创建过程。

虚拟机运行时数据区域描述了虚拟机管理的内存划分情况，但是目前我们对于虚拟机还是有很多困惑，比如：

问题1：如何为对象分配内存？
问题2：对象内存模型是怎样的？
问题3：是怎样访问内存中的对象的？
问题4：分配内存的时候如果遇到并发问题，怎么保证分配操作的线程安全性？

为了搞清楚这些问题，我们先从虚拟机是如何创建对象开始讲起。

一、对象创建过程

当虚拟机遇到一条new 指令时，便会进行对象的创建过程。

创建对象的过程如下：

1.检查常量池中有没有这个类的符号引用，并且检查这个符号引用代表的类有没有被虚拟机加载过。

如果没有被加载过，则执行类加载过程，然后进入下一步；如果已加载，则进入下一步。

2.根据方法区中类的信息，在堆区划分一块确定大小的内存给对象。

（经过类加载后，类的信息被保存在方法区中，一个类的对象所需的内存大小也固定下来。）

3.为对象的成员变量赋初始值

内存分配完成之后，需要对分配的内存空间部分区域的内容都初始化为零值。这一步保证了对象成员变量在 java 代码中可以不赋初始值。

4.设置 对象头 中的信息

关于对象头是什么, 别急，继续往下看。
5.调用 <init> 方法进行初始化

别再问 <init> 是什么了,先往下看。

二、问题1解惑：

在堆区分配内存有两种方式。

指针碰撞法

如果堆中内存是规整的，即所有用过的内存都放在一边，空闲的内存放在另一边，中间用一个指针做分界点的指示器。

分配内存的过程，实际上就是 指针向空闲空间那边移动一段与对象大小相等的距离 。

空闲列表法

java堆中的内存如果不是规整的，就需要使用空闲列表的分配方式。

空闲列表概念：虚拟机维护了一个列表，用于记录哪些内存块是可用的。

在分配的时候，从列表中找到一块满足对象大小的内存空间划分给对象实例，同时会更新列表上的记录。

关于两种分配方式的选择

选择哪种分配方式取决于java堆是否规整。

而java堆是否规整取决于所采用的垃圾收集器是否带有压缩整理的功能。

因此，选择哪种分配方式最终 取决于使用了哪种垃圾收集器 。

使用了指针碰撞的垃圾收集器有哪些？

serial、ParNew等基于复制算法或标记整理（Mark Compact）算法的收集器，不会导致内存碎片，因此使用的是指针碰撞。

采用空闲链表垃圾收集器有哪些？

CMS等基于Mark-Sweep（标记清除）算法的收集器，会产生内存碎片，所以使用空闲列表法。

三、问题2解惑

对象在内存中的数据除了实例本身的数据外，还包括 对象头 和 对齐填充

3.1 实例数据

实例数据存储的是成员变量的值，包括从父类继承下来的成员变量。

成员变量在内存中的顺序：相同宽度的字段会分配在一起，父类定义的变量会出现在子类之前，默认情况下，子类中较窄的变量可能会被插入到父类变量的间隙中。反正就是不一定按定义的顺序来分配。

3.2 对象头是什么？

对象头的作用是记录对象在运行过程中所需的数据。

比如对象属于哪个类的实例、所属类的信息在方法区中的位置（类型指针）、对象的哈希码、对象的GC分代年龄等信息。这些信息就保存在对象头中（Object Header）

3.3 对齐填充又是什么？

对齐填充是用于确保对象的内存的总长度为8字节的整数倍。

为什么要是确保是8字节的整数倍呢？

因为hotspot要求对象起始地址为8字节的整数倍以便于自动内存管理，换句话说，对象的总长度要为8字节的整数倍才能保证如此。而又因为对象头正好是8字节（32位或64位）的整数倍，但是实例数据长度是任意的，因此需要对齐补充来确保整个对象总长度为8字节的整数倍。

四、问题3解惑

java程序需要通过引用来操作堆上的具体数据。根据引用存放的地址类型的不同，对象有不同的访问方式

主要有两种访问方式：

使用句柄访问
使用直接指针访问

4.1 使用句柄访问

堆中会划分一块内存用来做句柄池。引用中存储的就是对象的句柄地址。句柄包含了对象实例数据和对象类型的数据的指针。

通过引用访问对象的时候，会首先根据引用找到对象的句柄，然后根据句柄中对象的地址来访问对象。

4.2 使用直接指针访问

引用中存储的直接是对象的地址，直接通过引用来访问对象。

4.3 两种方式对比

使用句柄
- 优点：引用中存储的是稳定的句柄地址，发生垃圾收集时可能会移动对象，这时候只需要改变句柄中实例数据的指针指向新对象，而引用的值不需要改。
- 缺点：需要两次寻址。
使用直接指针
- 优点：速度快，一次寻址即可。
- 缺点：需要在对象实例的内存中保存一个指向方法区中该类型数据的指针。不过使用句柄方式句柄中也需要保存类型指针。

直接指针的速度快，hotspot采用就是直接指针的方式

五、问题4解惑

对象分配内存不是线程安全的，比如给对象A分配内存，还没来得及修改指针的指向，另一个线程创建对象B也用了原来的指针，这样就会出问题的。

如何解决？

方案1：对分配内存空间的动作进行同步处理

实际上虚拟机采用CAS配上失败重试的方式保证更新指针操作的原子性。

方案2：把内存分配的动作按照线程划分在不同的空间中进行

即：每个线程在java堆中预分配一小块内存，这一小块内存称作“本地线程分配缓冲"（Thread Local Allocation Buffer, TLAB）

内存分配的过程就可以总结为：不同线程使用指针碰撞或者空闲列表的方式在各自的 TLAB 上分配内存。

当线程的 TLAB 用完需要分配新的 TLAB ，这时候才需要同步内存分配操作。

虚拟机是否需要使用 TLAB ，可以通过 -XX:+/-UseTLAB 参数来决定。

六、遗留问题：<init>方法是个啥？

从上面对象的创建过程，我们可以了解到，在内存分配完成之后，所有成员变量的值都还只是零值。

对于虚拟机来说，对象创建已经完毕，但是，对于java程序来说，对象的初始化才刚开始。

成员变量的初始化工作交由 <init> 方法的来完成。

编译器收集了成员变量上的赋值操作，实例初始化代码块的赋值操作，以及构造方法中的赋值操作，构成了 <init> 方法，并执行，对象就得到了初始化。

学习过java基础的人都知道，对象初始化的顺序为: 成员变量上的赋值-->实例初始化块-->构造方法。

<init> 方法就解释了为什么是这个过程。

七、讲点对象头

对象头的内存模型分三部分：

Mark Word
类型指针
记录数组的长度

7.1 Mark Word

存放hashCode、GC分代年龄、锁状态标志、线程持有的锁、偏向线程id、偏向时间戳等。长度为32位或者64位（32位虚拟机和64位虚拟机）。

mark word是一个非固定的数据结构，在不同情况下结构会有所变化。

比如：在32位的虚拟机中，如果对象处于未被锁定的状态， mark Word的32位空间将有25位用于存储hashcode, 4位用于存储对象的分代年龄，2位用于存储对象上锁标志，1位固定为0

这些东西我就不一个个介绍他们是用来干嘛的，讲多了反而复杂，大概了解就行，有兴趣的可以百度。

7.2 类型指针

一个指向类元数据的指针，通过这个指针，可以确定对象是哪个类的实例。记住，这个指针是在对象头中，但不是在Mark Word中的。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

JavaScript设计模式

Ross Harmes、Dustin Diaz / 谢廷晟 / 人民邮电出版社 / 2008 / 45.00元

本书共有两部分。第一部分给出了实现具体设计模式所需要的面向对象特性的基础知识，主要包括接口、封装和信息隐藏、继承、单体模式等内容。第二部分则专注于各种具体的设计模式及其在JavaScript语言中的应用，主要介绍了工厂模式、桥接模式、组合模式、门面模式等几种常见的模式。为了让每一章中的示例都尽可能地贴近实际应用，书中同时列举了一些JavaScript 程序员最常见的任务，然后运用设计模式使其解决方......一起来看看《JavaScript设计模式》这本书的介绍吧!

码农工具

RGB转16进制工具

RGB HEX 互转工具

SHA 加密

SHA 加密工具