深入理解Java虚拟机到底是什么

栏目: Java · 发布时间: 6年前

内容简介:深入理解Java虚拟机到底是什么

什么是 Java 虚拟机

作为一个Java程序员,我们每天都在写 Java 代码,我们写的代码都是在一个叫做 Java 虚拟机的东西上执行的。但是如果要问什么是虚拟机,恐怕很多人就会模棱两可了。在本文中,我会写下我对虚拟机的理解。因为能力所限,可能有些地方描述的不够欠当。如果你有不同的理解,欢迎交流。

我们都知道 Java 程序必须在虚拟机上运行。那么虚拟机到底是什么呢?先看网上搜索到的比较靠谱的解释:

虚拟机是一种抽象化的 计算机 ,通过在实际的计算机上仿真模拟各种计算机功能来实现的。 Java 虚拟机有自己完善的 硬体 架构 ,如 处理器 堆栈 寄存器 等,还具有相应的 指令 系统。 JVM 屏蔽了与具体 操作系统 平台相关的信息,使得 Java 程序 只需生成在 Java 虚拟机上运行的目标代码( 字节码 ),就可以在多种平台上不加修改地运行。

这种解释应该算是正确的,但是只描述了虚拟机的外部行为和功能,并没有针对内部原理做出说明。一般情况下我们不需要知道虚拟机的运行原理,只要专注写 java 代码就可以了,这也正是虚拟机之所以存在的原因 -- 屏蔽底层操作系统平台的不同并且减少基于原生语言开发的复杂性,使 java 这门语言能够跨各种平台(只要虚拟机厂商在特定平台上实现了虚拟机),并且简单易用。这些都是虚拟机的外部特性,但是从这些信息来解释虚拟机,未免太笼统了,无法让我们知道内部原理。

从进程的角度解释 JVM

让我们尝试从操作系统的层面来理解虚拟机。我们知道,虚拟机是运行在操作系统之中的,那么什么东西才能在操作系统中运行呢?当然是进程,因为进程是操作系统中的执行单位。可以这样理解,当它在运行的时候,它就是一个操作系统中的进程实例,当它没有在运行时(作为可执行文件存放于文件系统中),可以把它叫做程序。

对命令行比较熟悉的同学,都知道其实一个命令对应一个可执行的二进制文件,当敲下这个命令并且回车后,就会创建一个进程,加载对应的可执行文件到进程的地址空间中,并且执行其中的指令。下面对比 C 语言和 Java 语言的 HelloWorld 程序来说明问题。

首先编写 C 语言版的 HelloWorld 程序。

#include <stdio.h>  
#include <stdlib.h>  
  
int main(void) {  
    printf("hello world\n");  
    return 0;  
}  

编译 C语言 版的HelloWorld程序:

gcc HelloWorld.c -o HelloWorld  

运行C语言版的HelloWorld程序:

zhangjg@linux:/deve/workspace/HelloWorld/src$ ./HelloWorld   
hello world  

gcc编译器编译后的文件直接就是可被操作系统识别的二进制可执行文件,当我们在命令行中敲下 ./HelloWorld这条命令的时候, 直接创建一个进程, 并且将可执行文件加载到进程的地址空间中, 执行文件中的指令。

作为对比, 我们看一下Java版HelloWord程序的编译和执行形式。

首先编写源文件HelloWord.java :

public class HelloWorld {  
  
    public static void main(String[] args) {  
        System.out.println("HelloWorld");  
    }  
}  

编译Java版的HelloWorld程序:

zhangjg@linux:/deve/workspace/HelloJava/src$ javac HelloWorld.java   
zhangjg@linux:/deve/workspace/HelloJava/src$ ls  
HelloWorld.class  HelloWorld.java  

运行Java版的HelloWorld程序:

zhangjg@linux:/deve/workspace/HelloJava/src$ java -classpath . HelloWorld   
HelloWorld  

从上面的过程可以看到, 我们在运行Java版的HelloWorld程序的时候, 敲入的命令并不是 ./HelloWorld.class 。 因为class文件并不是可以直接被操作系统识别的二进制可执行文件 。 我们敲入的是java这个命令。 这个命令说明, 我们首先启动的是一个叫做java的程序, 这个java程序在运行起来之后就是一个JVM进程实例。 

上面的命令执行流程是这样的:

java 命令首先启动虚拟机进程,虚拟机进程成功启动后, 读取参数 HelloWorld” ,把他作为初始类加载到内存,对这个类进行初始化和动态链接(关于类的初始化和动态链接会在后面的博客中介绍), 然后从这个类的 main 方法开始执行。也就是说我们的 .class 文件不是直接被系统加载后直接在 cpu 上执行的, 而是被一个叫做虚拟机的进程托管的。首先必须虚拟机进程启动就绪,然后由虚拟机中的类加载器加载必要的 class 文件,包括 jdk 中的基础类(如 String Object 等),然后由虚拟机进程解释 class 字节码指令, 把这些字节码指令翻译成本机 cpu 能够识别的指令,才能在 cpu 上运行。

从这个层面上来看,在执行一个所谓的java程序的时候,真真正正在执行的是一个叫做 Java 虚拟机的进程,而不是我们写的一个个的 class 文件。这个叫做虚拟机的进程处理一些底层的操作,比如内存的分配和释放等等。我们编写的 class 文件只是虚拟机进程执行时需要的 原料 。这些 原料 在运行时被加载到虚拟机中,被虚拟机解释执行,以控制虚拟机实现我们 java 代码中所定义的一些相对高层的操作,比如创建一个文件等,可以将 class 文件中的信息看做对虚拟机的控制信息,也就是一种虚拟指令。

编程语言也有自己的原理, 学习一门语言, 主要是把它的原理搞明白。 看似一个简单的HelloWorld程序, 也有很多深入的内容值得剖析。

JVM体系结构简介

为了展示虚拟机进程和 class 文件的关系,特意画了下面一张图:

深入理解Java虚拟机到底是什么

根据上图表达的内容,我们编译之后的 class 文件是作为 Java 虚拟机的原料被输入到 Java 虚拟机的内部的,那么具体由谁来做这一部分工作呢?其实在 Java 虚拟机内部,有一个叫做类加载器的子系统,这个子系统用来在运行时根据需要加载类。注意上面一句话中的 根据需要 四个字。在 Java 虚拟机执行过程中,只有他需要一个类的时候,才会调用类加载器来加载这个类,并不会在开始运行时加载所有的类。就像一个人,只有饿的时候才去吃饭,而不是一次把一年的饭都吃到肚子里。一般来说,虚拟机加载类的时机,在第一次使用一个新的类的时候。本专栏后面的文章会具体讨论 Java 中的类加载器。

由虚拟机加载的类,被加载到 Java 虚拟机内存中之后,虚拟机会读取并执行它里面存在的字节码指令。虚拟机中执行字节码指令的部分叫做执行引擎。就像一个人,不是把饭吃下去就完事了,还要进行消化,执行引擎就相当于人的肠胃系统。在执行的过程中还会把各个 class 文件动态的连接起来。关于执行引擎的具体行为和动态链接相关的内容也会在本专栏后续的文章中进行讨论。

我们知道, Java 虚拟机会进行自动内存管理。具体说来就是自动释放没有用的对象,而不需要 程序员 编写代码来释放分配的内存。这部分工作由垃圾收集子系统负责。

从上面的论述可以知道, 一个Java虚拟机实例在运行过程中有三个子系统来保障它的正常运行,分别是类加载器子系统, 执行引擎子系统和垃圾收集子系统。 如下图所示:

深入理解Java虚拟机到底是什么

虚拟机的运行,必须加载 class 文件,并且执行 class 文件中的字节码指令。它做这么多事情,必须需要自己的空间。就像人吃下去的东西首先要放在胃中。虚拟机也需要空间来存放个中数据。首先,加载的字节码,需要一个单独的内存空间来存放;一个线程的执行,也需要内存空间来维护方法的调用关系,存放方法中的数据和中间计算结果;在执行的过程中,无法避免的要创建对象,创建的对象需要一个专门的内存空间来存放。关于虚拟机运行时数据区的内容,也会出现在本专栏后续的文章中。虚拟机的运行时内存区大概可以分成下图所示的几个部分。(这里只是大概划分, 并没有划分的很精细)

深入理解Java虚拟机到底是什么

总结

写到这里,基本上关于我对 java 虚拟机的理解就写完了。这篇文章的主题虽然是深入理解 Java 虚拟机,但是你可能感觉一点也不 深入 ,也只是泛泛而谈。我也有这样的感觉。限于自己水平有限,也只能这样了,要是想深入理解 java 虚拟机,强烈建议读一下三本书:

《深入 Java 虚拟机》

《深入理解 Java 虚拟机 JVM 高级特性与最佳实践》

Java 虚拟机规范》

其实我也读过这几本书,但是它们对虚拟机的解释也是基于一个外部模型,而没有深入剖析虚拟机内部的实现原理。虚拟机是一个大而复杂的东西,实现虚拟机的人都是大牛级别的,如果不是参与过虚拟机的实现,应该很少有人能把它参透。本专栏后面的一些文章也参考了这三本书, 虽然讲解Java语法的书不计其数, 但是深入讲解虚拟机的书, 目前为止我就见过这三本,并且网上的资料也不是很多。

最后做一个总结:

虚拟机并不神秘,在操作系统的角度看来,它只是一个普通进程。

这个叫做虚拟机的进程比较特殊,它能够加载我们编写的 class 文件。如果把 JVM 比作一个人,那么 class 文件就是我们吃的食物。

加载 class 文件的是一个叫做类加载器的子系统。就好比我们的嘴巴,把食物吃到肚子里。

虚拟机中的执行引擎用来执行 class 文件中的字节码指令。就好比我们的肠胃,对吃进去的食物进行消化。

虚拟机在执行过程中,要分配内存创建对象。当这些对象过时无用了,必须要自动清理这些无用的对象。清理对象回收内存的任务由垃圾收集器负责。就好比人吃进去的食物,在消化之后,必须把废物排出体外,腾出空间可以在下次饿的时候吃饭并消化食物。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

计算机程序设计艺术(第3卷)-排序和查找(英文影印版)

计算机程序设计艺术(第3卷)-排序和查找(英文影印版)

(美)Donald E.Knuth / 清华大学出版社 / 2002-9 / 85.00元

《计算机程序设计艺术排序和查找(第3卷)(第2版)》内容简介:这是对第3卷的头一次修订,不仅是对经典计算机排序和查找技术的最全面介绍,而且还对第1卷中的数据结构处理技术作了进一步的扩充,通盘考虑了将大小型数据库和内外存储器。它遴选了一些经过反复检验的计算机方法,并对其效率做了定量分析。第3卷的突出特点是对“最优排序”一节作了修订,对排列论原理与通用散列法作了全新讨论。一起来看看 《计算机程序设计艺术(第3卷)-排序和查找(英文影印版)》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

URL 编码/解码
URL 编码/解码

URL 编码/解码

MD5 加密
MD5 加密

MD5 加密工具