再谈类加载器
# 再谈类加载器
类加载器是JVM执行类加载机制的前提。
# 概述
ClassLoader
是Java的核心组件,所有的Class都是由ClassLoader进行加载的,ClassLoader负责通过各种方式将Class信息的二进制数据流读入JVM内部,转换为一个与目标类对应的java.lang.Class
对象实例。然后交给Java虚拟机进行链接、初始化等操作。因此,ClassLoader在整个装载阶段,只能影响到类的加载,而无法通过ClassLoader去改变类的链接和初始化行为。至于它是否可以运行,则由Execution Engine决定。
类加载器最早出现在Java1.0版本中,那个时候只是单纯地为了满足Java Applet应用而被研发出来。但如今类加载器却在OSGi
、字节码加解密领域大放异彩。这主要归功于Java虚拟机的设计者们当初在涉及类加载器的时候,并没有考虑将它绑定到Java虚拟机内部,这样的好处是能够更加灵活和动态地执行类加载操作。
# 类加载的分类
类的加载分为为两类:显式加载和隐式加载
class文件的显式加载与隐式加载的区别是JVM加载class文件到内存的方式不同:
显式加载:指的是在代码中通过调用ClassLoader加载Class对象,如直接使用
Class.forName(name)
或this.getClass().getClassLoader().loadClass()
加载Class对象。隐式加载:指的是不直接在代码中调用ClassLoader的方法加载Class对象,而是通过虚拟机自动加载到内存中,如在加载某个类的class文件时,该类的class文件中引用了另外一个类的对象,此时额外引用的类将通过JVM自动加载到内存中。
在日常开发以上两种方式一般会混合使用。
// 隐式加载
User user = new User();
// 显式加载,并初始化
Class clazz = Class.forName("com.test.java.User");
// 显式加载,但不初始化
ClassLoader.getSystemClassLoader().loadClass("com.test.java.Parent");
# 类加载器的必要性
一般情况下,Java开发人员并不需要在程序中显式地使用类加载器,但是了解类加载器的加载机制却显得至关重要。从以下几个方面说:
- 避免在开发中遇到
java.lang.ClassNotFoundException
异常或java.lang.NoClassDefFoundError
异常时,手足无措。只有了解类加载器的加载机制才能够在出现异常的时候快速地根据错误异常日志定位问题和解决问题 - 需要支持类的动态加载或需要对编译后的字节码文件进行加解密操作时,就需要与类加载器打交道了。
- 开发人员可以在程序中编写自定义类加载器来重新定义类的加载规则,以便实现一些自定义的处理逻辑。
# 命名空间
何为类的唯一性?
对于任意一个类,都需要由加载它的类加载器和这个类本身一同确认其在Java虚拟机中的唯一性。
每一个类加载器,都拥有一个独立的类名称空间:比较两个类是否相等,只有在这两个类是由同一个类加载器加载的前提下才有意义。否则,即使这两个类源自同一个class文件,被同一个虚拟机加载,只要加载他们的类加载器不同,那这两个类就必定不相等。
命名空间
- 每个类加载器都有自己的命名空间,命名空间由该加载器及所有的父加载器所加载的类组成
- 在同一命名空间中,不会出现类的完整名字(包括类的包名)相同的两个类
- 在不同的命名空间中,有可能会出现类的完整名字(包括类的包名)相同的两个类
在大型应用中,我们往往借助这一特性,来运行同一个类的不同版本。
代码举例:
public static void main(String[] args) {
String rootDir = "/Users/wenwl/Projects/JVMDemo1/chapter04/src";
try {
// 创建自定义的类的加载器1
UserClassLoader loader1 = new UserClassLoader(rootDir);
Class clazz1 = loader1.findClass("com.atguigu.java.User");
// 创建自定义的类的加载器2
UserClassLoader loader2 = new UserClassLoader(rootDir);
Class clazz2 = loader2.findClass("com.atguigu.java.User");
System.out.println(clazz1 == clazz2); // clazz1与clazz2对应了不同的类模板结构。
System.out.println(clazz1.getClassLoader());
System.out.println(clazz2.getClassLoader());
// 系统类加载器加载
Class clazz3 = ClassLoader.getSystemClassLoader().loadClass("com.atguigu.java.User");
System.out.println(clazz3.getClassLoader());
System.out.println(clazz1.getClassLoader().getParent());
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
}
运行结果:
false
com.atguigu.java.UserClassLoader@29453f44
com.atguigu.java.UserClassLoader@6e0be858
sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$AppClassLoader@18b4aac2
说明:由于我的是macOS,更改了老师的rootDir以及classNameToPath方法。
# 类加载机制的基本特征
双亲委派模型。但不是所有类加载都遵守这个模型,有的时候,启动类加载器所加载的类型,是可能要加载用户代码的,比如JDK内部的
ServiceProvider/ServiceLoader
机制,用户可以在标准API框架上,提供自己的实现,JDK也需要提供些默认的参考实现。例如,Java中JNDI、JDBC、文件系统、Cipher等很多方面,都是利用的这种机制,这种情况就不会用双亲委派模型去加载,而是利用所谓的上下文加载器。可见性,子类加载器可以访问父加载器加载的类型,但是反过来是不允许的。不然,因为缺少必要的隔离,我们就没有办法利用类加载器去实现容器的逻辑。
单一性,由于父加载器的类型对于子加载器是可见的,所以父加载器中加载过的类型,就不会在子加载器中重复加载。但是注意,类加载器“邻居”间,同一类型仍然可以被加载多次,因为互相并不可见。
# 类加载器之间的关系
ClassLoader
的核心源码是Launcher
类,Launcher
类核心代码如下:
public class Launcher {
······
public Launcher() {
Launcher.ExtClassLoader var1;
try {
var1 = Launcher.ExtClassLoader.getExtClassLoader();
} catch (IOException var10) {
throw new InternalError("Could not create extension class loader", var10);
}
try {
this.loader = Launcher.AppClassLoader.getAppClassLoader(var1);
} catch (IOException var9) {
throw new InternalError("Could not create application class loader", var9);
}
Thread.currentThread().setContextClassLoader(this.loader);
······
}
······
}
总结如下:
ExtClassLoader
的Parent类是null
AppClassLoader
的Parent类是ExtClassLoader
- 当前线程的
ClassLoader
是AppClassLoader
注意,这里的Parent类并不是Java语言意义上的继承关系,而是一种包含关系。
# 类加载器的分类
JVM支持两种类型的类加载器,分别为引导类加载器(Bootstrap ClassLoader)和自定义类加载器(User-Defined ClassLoader)。
从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是Java虚拟机规范却没有这么定义,而是将所有派生于抽象类ClassLoader的类加载器都划分为自定义类加载器。无论类加载器的类型如何划分,在程序中我们最常见的类加载器结构主要是如下情况:
- 除了顶层的启动类加载器外,其余的类加载器都应当有自己的“父类”加载器。
- 不同类加载器看似是继承(Inheritance)关系,实际上是包含关系。在下层加载器中,包含着上层加载器的引用。
父类加载器和子类加载器的关系:
class ClassLoader{
ClassLoader parent; // 父类加载器
public ClassLoader(ClassLoader parent){
this.parent = parent;
}
}
class ParentClassLoader extends ClassLoader{
public ParentClassLoader(ClassLoader parent){
super(parent);
}
}
class ChildClassLoader extends ClassLoader{
public ChildClassLoader(ClassLoader parent){ // parent = new ParentClassLoader();
super(parent);
}
}
正是由于子类加载器中包含着父类加载器的引用,所以可以通过子类加载器的方法获取对应的父类加载器。
注意:启动类加载器通过C/C++语言编写,而自定义类加载器都是由Java语言编写的,虽然扩展类加载器和应用程序类加载器是被JDK开发人员使用Java语言来编写的,但是也是由Java语言编写的,所以也被称为自定义类加载器。
# 引导类加载器
启动类加载器(引导类加载器,Bootstrap ClassLoader):
这个类加载使用C/C++语言实现的,嵌套在JVM内部。
它用来加载Java的核心库,用于提供JVM自身需要的类。
- 核心库:JAVAHOME/jre/lib/rt.jar或sun.boot.class.path路径下的内容
并不继承自
java.lang.ClassLoader
,没有父加载器。出于安全考虑,Bootstrap启动类加载器只加载包名为
java、javax、sun
等开头的类加载扩展类和应用程序类加载器,并指定为他们的父类加载器。见下图:
使用 -XX:+TraceClassLoading : 打印加载的Class
启动类加载器使用C++编写的? Yes!
- C/C++:指针函数&函数指针、C++支持多继承、更加高效
- Java:由C++演变而来,单继承... => C++--
获取引导类加载器加载jar包路径:
System.out.println("**********启动类加载器**************");
// 获取BootstrapClassLoader能够加载的api的路径
URL[] urLs = sun.misc.Launcher.getBootstrapClassPath().getURLs();
for (URL element : urLs) {
System.out.println(element.toExternalForm());
}
执行结果:
**********启动类加载器**************
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/resources.jar
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/rt.jar
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/sunrsasign.jar
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/jsse.jar
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/jce.jar
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/charsets.jar
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/jfr.jar
file:/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/classes
# 扩展类加载器
扩展类加载器(Extension ClassLoader):
- Java语言编写,由
sun.misc.Launcher$ExtClassLoader
实现。 - 继承于ClassLoader类
- 父类加载器为启动类加载器
- 从
java.ext.dirs
系统属性所指定的目录中加载类库,或从JDK的安装目录的jre/lib/ext
子目录下加载类库。如果用户创建的JAR放在此目录下,也会自动由扩展类加载器加载。
获取扩展类加载器加载jar包路径:
System.out.println("***********扩展类加载器*************");
String extDirs = System.getProperty("java.ext.dirs");
for (String path : extDirs.split(":")) { // win系统改成“:”
System.out.println(path);
}
执行结果:
***********扩展类加载器*************
/Users/wenwl/Library/Java/Extensions
/Library/Java/JavaVirtualMachines/jdk1.8.0_271.jdk/Contents/Home/jre/lib/ext
/Library/Java/Extensions
/Network/Library/Java/Extensions
/System/Library/Java/Extensions
/usr/lib/java
# 系统类加载器
应用程序类加载器(系统类加载器,AppClassLoader):
- Java语言编写,由
sun.misc.Launcher$AppClassLoader
实现 - 继承于ClassLoader类
- 父类加载器为扩展类加载器
- 它负责加载环境变量
classpath
或系统属性java.class.path
指定路径下的类库 - 应用程序中的类加载器默认是系统类加载器
- 它是用户自定义类加载器的默认父加载器
- 通过ClassLoader的
getSystemClassLoader()
方法可以获取到该类加载器
# 用户自定义类加载器
用户自定义类加载器(User-Defined ClassLoader)
- 在Java的日常应用程序开发中,类的加载几乎是由上述3种类加载器相互配合执行的。在必要时,我们还可以自定义类加载器,来定制类的加载方式。
- 体现Java语言强大生命力和巨大魅力的关键因素之一便是,Java开发者可以自定义类加载器来实现类库的动态加载,加载源可以是本地的JAR包,也可以是网络上的远程资源。
- 通过类加载器可以实现非常绝妙的插件机制,这方面的实际应用案例举不胜举。例如,著名的OSGI组件框架,再如Eclipse的插件机制。类加载器为应用程序提供了一种动态增加新功能的机制,这种机制无须重新打包发布应用程序就能实现。
- 同时,自定义加载器能够实现应用隔离,例如
Tomcat,Spring
等中间件和组件框架都在内部实现了自定义的加载器,并通过自定义加载器隔离不同的组件模块。这种机制比C/C程序要好太多,想不修改C/C程序就能为其新增功能,几乎是不可能的,仅仅一个兼容性便能阻挡住所有美好的设想。 - 自定义类加载器通常需要继承于ClassLoader。
# 测试不同的类的加载器
每个Class对象都会包含一个定义它的ClassLoader
的一个引用。
获取ClassLoader的途径:
// 获得当前类的ClassLoader
clazz.getClassLoader()
// 获得当前线程上下文的ClassLoader
Thread.currentThread().getContextClassLoader()
// 获得系统的ClassLoader
ClassLoader.getSystemClassLoader()
站在程序的角度看,引导类加载器与另外两种类加载器(系统类加载器和扩展类加载器)并不是同一个层次意义上的加
载器,引导类加载器是使用C++语言编写而成的,而另外两种类加载器则是使用Java语言编写而成的。由于引导类加载 器压根儿就不是一个Java类,因此在Java程序中只能打印出null
。
数组类的Class对象,不是由类加载器去创建的,而是在Java运行期JVM根据需要自动创建的。对于数组类的类加载器
来说,是通过Class.getClassLoader()
返回的,与数组当中元素类型的类加载器是一样的;如果数组当中的元素类型
是基本数据类型,数组类是没有类加载器的。
// 运行结果:null
String[] strArr = new String[6];
System.out.println(strArr.getClass().getClassLoader());
// 运行结果:sun.misc.Launcher$AppCLassLoader@18b4aac2
ClassLoaderTest[] test = new ClassLoaderTest[1];
System.out.println(test.getClass().getClassLoader());
// 运行结果:null
int[]ints = new int[2];
System.out.println(ints.getClass().getClassLoader());
代码:
public class ClassLoaderTest1{
public static void main(String[] args) {
// 获取系统该类加载器
ClassLoader systemClassLoader=ClassLoader.getSystemCLassLoader();
System.out.print1n(systemClassLoader); // sun.misc.Launcher$AppCLassLoader@18b4aac2
// 获取扩展类加载器
ClassLoader extClassLoader =systemClassLoader.getParent();
System.out.println(extClassLoader); // sun.misc. Launcher$ExtCLassLoader@1540e19d
// 试图获取引导类加载器:失败
ClassLoader bootstrapClassLoader =extClassLoader.getParent();
System.out.print1n(bootstrapClassLoader);// null
// ##################################
try{
ClassLoader classLoader =Class.forName("java.lang.String").getClassLoader();
System.out.println(classLoader);
// 自定义的类默认使用系统类加载器
ClassLoader classLoader1=Class.forName("com.atguigu.java.ClassLoaderTest1").getClassLoader();
System.out.println(classLoader1);
// 关于数组类型的加载:使用的类的加载器与数组元素的类的加载器相同
String[] arrstr = new String[10];
System.out.println(arrstr.getClass().getClassLoader());// null:表示使用的是引导类加载器
ClassLoaderTest1[] arr1 =new ClassLoaderTest1[10];
System.out.println(arr1.getClass().getClassLoader());// sun.misc. Launcher$AppcLassLoader@18b4aac2
int[] arr2 = new int[10];
System.out.println(arr2.getClass().getClassLoader());// null:
} catch (ClassNotFoundException e) {
e.printStackTrace();
}
}
}
# ClassLoader源码解析
ClassLoader与现有类的关系:
除了以上虚拟机自带的加载器外,用户还可以定制自己的类加载器。Java提供了抽象类java.lang.ClassLoader
,所有用户自定义的类加载器都应该继承ClassLoader类。
# ClassLoader主要方法
抽象类ClassLoader的主要方法(内部没有抽象方法):
getParent方法:返回该类加载器的超类加载器
public final ClassLoader getParent()
loadClass方法:加载名称为name的类,返回结果为
java.lang.Class
类的实例,如果找不到类,则返回ClassNotFoundException
异常。双亲委派机制的核心实现代码。public Class<?> loadClass(String name) throws ClassNotFoundException
findClass方法:查找二进制名称为name的类,返回结果为
java.lang.Class
类的实例。这是一个受保护的方法,JVM鼓励我们重写此方法,需要自定义加载器遵循双亲委托机制,该方法会在检查完父类加载器之后被loadClass()
方法调用。protected Class<?> findClass(String name) throws ClassNotFoundException
在JDK 1.2之前,在自定义类加载时,总会去继承ClassLoader类并重写
loadClass
方法,从而实现自定义的类加载类。但是在JDK 1.2之后已不再建议用户去覆盖loadClass()
方法,而是建议把自定义的类加载逻辑写在findClass()方法中,从前面的分析可知,findClass()
方法是在loadClass()
方法中被调用的,当loadClass()
方法中父加载器加载失败后,则会调用自己的findClass()
方法来完成类加载,这样就可以保证自定义的类加载器也符合双亲委托模式。需要注意的是ClassLoader类中并没有实现
findClass()
方法的具体代码逻辑,取而代之的是抛出ClassNotFoundException
异常,同时应该知道的是findClass
方法通常是和defineClass
方法一起使用的。一般情况下,在自定义类加载器时,会直接覆盖ClassLoader的
findClass()
方法并编写加载规则,取得要加载类的字节码后转换成流,然后调用defineClass()
方法生成类的Class对象。defineClass方法:根据给定的字节数组b转换为Class的实例,off和len参数表示实际Class信息在byte数组中的位置和长度,其中byte数组b是ClassLoader从外部获取的。这是受保护的方法,只有在自定义ClassLoader子类中可以使用。
protected final Class<?> defineClass(String name, byte[] b,int off,int len)
defineClass()
方法是用来将byte字节流解析成JVM能够识别的Class对象(ClassLoader中已实现该方法逻辑),通过这个方法不仅能够通过class文件实例化class对象,也可以通过其他方式实例化class对象,如通过网络接收一个类的字节码,然后转换为byte字节流创建对应的Class对象。所以,defineClass()方法通常与findClass()方法一起使用。一般情况下,在自定义类加载器时,会直接覆盖ClassLoader的
findClass()
方法并编写加载规则,取得要加载类的字节码后转换成流,然后调用defineClass()
方法生成类的Class对象。简单举例:
protected Class<?> findClass(String name) throws ClassNotFoundException { // 获取类的字节数组 byte[] classData =getClassData(name); if (classData == null) { throw new ClassNotFoundException(); } else{ //使用defineClass生成class对象 return defineClass(name,classData,θ,classData.length); } }
resolveClass方法:链接指定的一个Java类。使用该方法可以使用类的Class对象创建完成的同时也被解析。前面我们说链接阶段主要是对字节码进行验证,为类变量分配内存并设置初始值同时将字节码文件中的符号引用转换为直接引用。
protected final void resolveClass(Class<?> c)
findLoadedClass方法:查找名称为name的已经被加载过的类,返回结果为java.lang.Class类的实例。这个方法是final方法,无法被修改。
protected final Class<?> findLoadedClass(String name)
parent属性:它也是一个ClassLoader的实例,这个字段所表示的ClassLoader也称为这个ClassLoader的双亲。在类加载的过程中,ClassLoader可能会将某些请求交予自己的双亲处理。
private final ClassLoader parent;
# SecureClassLoader与URLClassLoader
SecureClassLoader扩展了ClassLoader,新增了几个与使用相关的代码源(对代码源的位置及其证书的验证)和权限定义类验证(主要指对class源码的访问权限)的方法,一般我们不会直接跟这个类打交道,更多是与它的子类URLClassLoader有所关联。
前面说过,ClassLoader是一个抽象类,很多方法是空的没有实现,比如findClass()
、findResource()
等。而URLClassLoader这个实现类为这些方法提供了具体的实现。并新增了URLClassPath类协助取得Class字节码流等功能。在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承URLClassLoader类,这样就可以避免自己去编写findClass()
方法及其获取字节码流的方式,使自定义类加载器编写更加简洁。
# ExtClasssLoader与AppClassLoader
了解完URLClassLoader后接着看看剩余的两个类加载器,即拓展类加载器ExtClassLoader
和系统类加载器AppClassLoader
,这两个类都继承自URLClassLoader,是sun.misc.Launcher
的静态内部类。sun.misc.Launcher
主要被系统用于启动主应用程序,ExtClassLoader和AppClassLoader都是由sun.misc.Launcher
创建的,其类主要类结构如下:
我们发现ExtClassLoader并没有重写loadClass()
方法,这足以说明其遵循双亲委派模式,而AppClassLoader重载了loadClass()
方法,但最终调用的还是父类loadClass()
方法,因此依然遵守双亲委派模式。
# Class.forName()与ClassLoader.loadClass()
Class.forName():是一个静态方法,最常用的是
Class.forName(String className);
根据传入的类的全限定名返回一个Class对象。该方法在将Class文件加载到内存的同时,会执行类的初始化。Class.forName("com.atguigu.java.Helloworld");
ClassLoader.loadClass():这是一个实例方法,需要一个ClassLoader对象来调用该方法。 该方法将Class文件加载到内存时,并不会执行类的初始化,直到这个类第一次使用时才进行初始化。该方法因为需要得到一个ClassLoader对象,所以可以根据需要指定使用哪个类加载器。
Classloader cl = ......; cl.loadClass("com.atguigu.java.Helloworld");
# 双亲委派模型
类加载器用来把类加载到Java虚拟机中。从JDK 1.2版本开始,类的加载过程采用双亲委派机制,这种机制能更好地保证Java平台的安全。
# 定义与本质
定义:如果一个类加载器在接到加载类的请求时,它首先不会自己尝试去加载这个类,而是把这个请求任务委托给父类加载器去完成,依次递归,如果父类加载器可以完成类加载任务,就成功返回。只有父类加载器无法完成此加载任务时,才自己去加载。
本质:规定了类加载的顺序是:引导类加载器先加载,若加载不到,由扩展类加载器加载,若还加载不到,才会由系统类加载器或自定义的类加载器进行加载。
# 优势与劣势
# 双亲委派机制优势
- 避免类的重复加载,确保一个类的全局唯一性。Java类随着它的类加载器一起具备了一种带有优先级的层次关系,通过这种层级关可以避免类的重复加载,当父亲已经加载了该类时,就没有必要子ClassLoader再加载一次。
- 保护程序安全,防止核心API被随意篡改
# 源码实现
双亲委派机制在java.lang.ClassLoader#loadClass(java.lang.String, boolean)
接口中体现。该接口的逻辑如下:
- 先在当前加载器的缓存中查找有无目标类,如果有,直接返回。
- 判断当前加载器的父加载器是否为空,如果不为空,则调用
parent.loadClass(name,false)
接口进行加载。 - 反之,如果当前加载器的父类加载器为空,则调用
findBootstrapClassorNull(name)
接口,让引导类加载器进行加载。 - 如果通过以上3条路径都没能成功加载,则调用
findClass(name)
接口进行加载。该接口最终会调用java.lang.ClassLoader
接口的defineClass
系列的native
接口加载目标Java类。
双亲委派的模型就隐藏在这第2和第3步中。
举例
假设当前加载的是java.lang.Object
这个类,很显然,该类属于JDK中核心得不能再核心的一个类,因此一定只能由引导类加载器进行加载。当JVM准备加载javaJang.Object
时,JVM默认会使用系统类加载器去加载,按照上面4步加载的逻辑,在第1步从系统类的缓存中肯定查找不到该类,于是进入第2步。由于从系统类加载器的父加载器是扩展类加载器,于是扩展类加载器继续从第1步开始重复。由于扩展类加载器的缓存中也一定查找不到该类,因此进入第2步。扩展类的父加载器是null
,因此系统调用findClass(String)
,最终通过引导类加载器进行加载。
思考
如果在自定义的类加载器中重写java.lang.ClassLoader.loadClass(String)
或java.lang.ClassLoader.loadclass(String,boolean)
方法,抹去其中的双亲委派机制,仅保留上面这4步中的第l步与第4步,那么是不是就能够加载核心类库了呢?
这也不行!因为JDK还为核心类库提供了一层保护机制。不管是自定义的类加载器,还是系统类加载器亦或扩展类加载器,最终都必须调用 java.lang.ClassLoader.defineclass(String,byte[],int,int,ProtectionDomain)
方法,而该方法会执行preDefineClass()
接口,该接口中提供了对JDK核心类库的保护。
# 双亲委派机制弊端
检查类是否加载的委托过程是单向的,这个方式虽然从结构上说比较清晰,使各个ClassLoader的职责非常明确,但是同时会带来一个问题,即顶层的ClassLoader无法访问底层的ClassLoader所加载的类。
通常情况下,启动类加载器中的类为系统核心类,包括一些重要的系统接口,而在应用类加载器中为应用类。按照这种模式,应用类访问系统类自然是没有问题,但是系统类访问应用类就会出现问题。比如在系统类中提供了一个接口,该接口需要在应用类中得以实现,该接口还绑定一个工厂方法,用于创建该接口的实例,而接口和工厂方法都在启动类加载器中。这时,就会出现该工厂方法无法创建由应用类加载器加载的应用实例的问题。
# 结论
由于Java虚拟机规范并没有明确要求类加载器的加载机制一定要使用双亲委派模型,只是建议采用这种方式而已。比如在Tomcat
中,类加载器所采用的加载机制就和传统的双亲委派模型有一定区别,当缺省的类加载器接收到一个类的加载任务时,首先会由它自行加载,当它加载失败时,才会将类的加载任务委派给它的超类加载器去执行,这同时也是Serylet
规范推荐的一种做法。
# 破坏双亲委派
双亲委派模型并不是一个具有强制性约束的模型,而是Java设计者推荐给开发者们的类加载器实现方式。
在Java的世界中大部分的类加载器都遵循这个模型,但也有例外的情况,直到Java模块化出现为止,双亲委派模型主要出现过3次较大规模“被破坏”的情况。
# 第一次破坏双亲委派机制
双亲委派模型的第一次“被破坏”其实发生在双亲委派模型出现之前,即JDK 1.2面世以前的“远古”时代。
由于双亲委派模型在JDK 1.2之后才被引入,但是类加载器的概念和抽象类java.lang.ClassLoader
则在Java的第一个版本中就已经存在,面对经存在的用户自定义类加载器的代码,Java设计者们引入双亲委派模型时不得不做出一些妥协,为了兼容这些已有代码,无法再以技术手段避免loadClass()被子类覆盖的可能性,只能在JDK 1.2之后的java.lang.ClassLoader
中添加一个新的protected
方法findClass()
,并引导用户编写的类加载逻辑时尽可能去重写这个方法,而不是在loadClass()
中编写代码。上节我们已经分析过loadClass()
方法,双亲委派的具体逻辑就实现在这里面,按照loadClass()
方法的逻辑,如果父类加载失败,会自动调用自己的findClass()
方法来完成加载,这样既不影响用户按照自己的意愿去加载类,又可以保证新写出来的类加载器是符合双亲委派规则的。
以上,简单来说就是JDK 1.2之前还没有引入双亲委派机制,所以JDK 1.2之前就是破坏双亲委派机制的情况。
# 第二次破坏双亲委派机制:线程上下文类加载器
双亲委派模型的第二次“被破坏”是由这个模型自身的缺陷导致的,双亲委派很好地解决了各个类加载器协作时基础类型的一致性问题(越基础的类由越上层的加载器进行加载),基础类型之所以被称为“基础”,是因为它们总是作为被用户代码继承、调用的API存在,但程序设计往往没有绝对不变的完美规则,如果有基础类型又要调用回用户的代码,那该怎么办呢?
这并非是不可能出现的事情,一个典型的例子便是JNDI
服务,JNDI现在已经是Java的标准服务,它的代码由启动类加载器来完成加载(在JDK 1.3时加入到rt.jar
的),肯定属于Java中很基础的类型了。但JNDI存在的目的就是对资源进行查找和集中管理,它需要调用由其他厂商实现并部署在应用程序的ClassPath
下的JNDI服务提供者接口(Service Provider Interface,SPI)的代码,现在问题来了,启动类加载器是绝不可能认识、加载这些代码的,那该怎么办?(SPI:在Java平台中,通常把核心类rt.jar
中提供外部服务、可由应用层自行实现的接口称为SPI)
为了解决这个困境,Java的设计团队只好引入了一个不太优雅的设计:线程上下文类加载器(Thread Context ClassLoader)。这个类加载器可以通过java.lang.Thread
类的setContextClassLoader()
方法进行设置,如果创建线程时还未设置,它将会从父线程中继承一个,如果在应用程序的全局范围内都没有设置过的话,那这个类加载器默认就是应用程序类加载器。
有了线程上下文类加载器,程序就可以做一些“舞弊”的事情了。JNDI服务使用这个线程上下文类加载器去加载所需的SPI服务代码,这是一种父类加载器去请求子类加载器完成类加载的行为,这种行为实际上是打通了双亲委派模型的层次结构来逆向使用类加载器,已经违背了双亲委派模型的一般性原则,但也是无可奈何的事情。Java中涉及SPI的加载基本上都是采用这种方式来完成的,例如,JNDI、JDBC、JCE、JAXB和JBI等。不过,当SPI的服务提供者多于一个的时候,代码就只能根据具体提供者的类型来硬编码判断,为了消除这种极不优雅的实现方式,在JDK 6时,JDK提供了java.util.ServiceLoader
类,以META-INF/services
中的配置信息,辅以责任链模式,这才算是给SPI的加载提供了一种相对合理的解决方案。
以上,简单来说就是默认上下文加载器就是应用类加载器,这样以上下文加载器为中介,使得启动类加载器中的代码也可以访问应用类加载器中的类。
# 第三次破坏双亲委派机制
双亲委派模型的第三次“被破坏”是由于用户对程序动态性的追求而导致的。如:代码热替换(Hot Swap)、模块热部署(Hot Deployment)等。
IBM公司主导的JSR-291(即OSGi R4.2)实现模块化热部署的关键是它自定义的类加载器机制的实现,每一个程序模块(OSGi中称为Bundle)都有一个自己的类加载器,当需要更换一个Bundle时,就把Bundle连同类加载器一起换掉以实现代码的热替换。在OSGi环境下,类加载器不再是双亲委派模型推荐的树状结构,而是进一步发展为更加复杂的网状结构。
当收到类加载请求时,OSGi将按照下面的顺序进行类搜索:
- 将以java.*开头的类,委派给父类加载器加载。
- 否则,将委派列表名单内的类,委派给父类加载器加载。
- 否则,将Import列表中的类,委派给Export这个类的Bundle的类加载器加载。
- 否则,查找当前Bundle的ClassPath,使用自己的类加载器加载。
- 否则,查找类是否在自己的Fragment Bundle中,如果在,则委派给Fragment Bundle的类加载器加载。
- 否则,查找Dynamic Import列表的Bundle,委派给对应Bundle的类加载器加载。
- 否则,类查找失败。
说明:只有开头两点仍然符合双亲委派模型的原则,其余的类查找都是在平级的类加载器中进行的。
小结:这里,我们使用了“被破坏”这个词来形容上述不符合双亲委派模型原则的行为,但这里“被破坏”并不一定是带有贬义的,只要有明确的目的和充分的理由,突破旧有原则无疑是一种创新。正如:OSGi中的类加载器的设计不符合传统的双亲委派的类加载器架构,且业界对其为了实现热部署而带来的额外的高复杂度还存在不少争议,但对这方面有了解的技术人员基本还是能达成一个共识,认为OSGi中对类加载器的运用是值得学习的,完全弄懂了OSGi的实现,就算是掌握了类加载器的精粹。
# 热替换的实现
热替换是指在程序的运行过程中,不停止服务,只通过替换程序文件来修改程序的行为。热替换的关键需求在于服务不能中断,修改必须立即表现正在运行的系统之中。基本上大部分脚本语言都是天生支持热替换的,比如:PHP,只要替换了PHP源文件,这种改动就会立即生效,而无需重启Web服务器。
但对Java来说,热替换并非天生就支持,如果一个类已经加载到系统中,通过修改类文件,并无法让系统再来加载并重定义这个类。因此,在Java中实现这一功能的一个可行的方法就是灵活运用ClassLoader。
注意:由不同ClassLoader加载的同名类属于不同的类型,不能相互转换和兼容。即两个不同的ClassLoader加载同一个类,在虚拟机内部,会认为这2个类是完全不同的(上文的命名空间中对此有描述)。
根据这个特点,可以用来模拟热替换的实现,基本思路如下图所示:
简单来说就是每次调用方法之前都要加载字节码文件,然后创建对象,我们可以把字节码文件变成最新的,那么创建的对象肯定是最新的,所以这就完成了热替换。
# 沙箱安全机制
什么是沙箱?沙箱是一个限制程序运行的环境。
Java安全模型的核心就是Java沙箱(sandbox)。沙箱机制主要目的是保证程序安全以及保护Java原生的JDK代码。
沙箱机制就是将Java代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问。通过这样的措施来保证对代码的有限隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。
所有的Java程序运行都可以指定沙箱,可以定制安全策略。
# JDK 1.0时期
在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱(Sandbox)机制。如下图所示JDK 1.0安全模型:
# JDK 1.1时期
JDK 1.0中如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的Java 1.1版本中,针对安全机制做了改进,增加了安全策略。允许用户指定代码对本地资源的访问权限。如下图所示JDK 1.1安全模型:
# JDK 1.2时期
在Java 1.2版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示JDK 1.2安全模型:
# JDK 1.6时期
当前最新的安全机制实现,则引入了**域(Domain)**的概念。虚拟机会把所有代码加载到不同的系统域和应用域。系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域(Protected Domain),对应不一样的权限(Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示,最新的安全模型(JDK 1.6):
# 自定义类加载器
# 为什么要自定义类加载器
- 隔离加载类:在某些框架内进行中间件与应用的模块隔离,把类加载到不同的环境。比如:阿里内某容器框架通过自定义类加载器确保应用中依赖的jar包不会影响到中间件运行时使用的jar包;再比如:Tomcat这类Web应用服务器,内部自定义了好几种类加载器,用于隔离同一个Web应用服务器上的不同应用程序。
- 修改类加载的方式:类的加载模型并非强制,除Bootstrap外,其他的加载并非一定要引入,或者根据实际情况在某个时间点进行按需进行动态加载
- 扩展加载源:比如从数据库、网络、甚至是电视机机顶盒进行加载
- **防止源码泄漏:**Java代码容易被编译和篡改,可以进行编译加密。那么类加载也需要自定义,还原加密的字节码。
常见的场景
- 实现类似进程内隔离,类加载器实际上用作不同的命名空间,以提供类似容器、模块化的效果。例如,两个模块依赖于某个类库的不同版本,如果分别被不同的容器加载,就可以互不干扰。这个方面的集大成者是JavaEE和OSGi、JPMS等框架。
- 应用需要从不同的数据源获取类定义信息,例如网络数据源,而不是本地文件系统。或者是需要自己操纵字节码,动态修改或者生成类型。
注意
在一般情况下,使用不同的类加载器去加载不同的功能模块,会提高应用程序的安全性。但是,如果涉及Java类型转换,则加载器反而容易产生不美好的事情。在做Java类型转换时,只有两个类型都是由同一个加载器所加载,才能进行类型转换,否则转换时会发生异常。
# 实现方式
Java提供了抽象类java.lang.ClassLoader
,所有用户自定义的类加载器都应该继承ClassLoader类。
在自定义ClassLoader的子类时候,我们常见的会有两种做法:
- 方式一:重写
loadClass()
方法 - 方式二:重写
findclass()
方法,建议使用这种方式。
对比:这两种方法本质上差不多,毕竟loadClass()
也会调用findClass()
,但是从逻辑上讲我们最好不要直接修改loadClass()
的内部逻辑。建议的做法是只在findClass()
里重写自定义类的加载方法,根据参数指定类的名字,返回对应的Class对象的引用。
loadclass()
这个方法是实现双亲委派模型逻辑的地方,擅自修改这个方法会导致模型被破坏,容易造成问题。
因此,我们最好是在双亲委派模型框架内进行小范围的改动,不破坏原有的稳定结构。同时,也避免了自己重写loadClass()
方法的过程中必须写双亲委托的重复代码,从代码的复用性来看,不直接修改这个方法始终是比较好的选择。当编写好自定义类加载器后,便可以在程序中调用loadClass()方法来实现类加载操作。
补充说明:
- 自定义类加载器的父类加载器是系统类加载器。
- JVM中的所有类加载都会使用
java.lang.ClassLoader.loadClass(String)
接口(自定义类加载器并重写java.lang.ClassLoader.loadClass(String)
接口的除外),连JDK的核心类库也不能例外。
示例代码:
public class MyClassLoader extends ClassLoader {
private String byteCodePath;
public MyClassLoader(String byteCodePath) {
this.byteCodePath = byteCodePath;
}
public MyClassLoader(ClassLoader parent, String byteCodePath) {
super(parent);
this.byteCodePath = byteCodePath;
}
@Override
protected Class<?> findClass(String className) throws ClassNotFoundException {
BufferedInputStream bis = null;
ByteArrayOutputStream baos = null;
try {
// 获取字节码文件的完整路径
String fileName = byteCodePath + className + ".class";
// 获取一个输入流
bis = new BufferedInputStream(new FileInputStream(fileName));
// 获取一个输出流
baos = new ByteArrayOutputStream();
// 具体读入数据并写出的过程
int len;
byte[] data = new byte[1024];
while ((len = bis.read(data)) != -1) {
baos.write(data, 0, len);
}
// 获取内存中的完整的字节数组的数据
byte[] byteCodes = baos.toByteArray();
// 调用defineClass(),将字节数组的数据转换为Class的实例。
Class clazz = defineClass(null, byteCodes, 0, byteCodes.length);
return clazz;
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if (baos != null)
baos.close();
} catch (IOException e) {
e.printStackTrace();
}
try {
if (bis != null)
bis.close();
} catch (IOException e) {
e.printStackTrace();
}
}
return null;
}
}
# Java9新特性
为了保证兼容性,JDK 9没有从根本上改变三层类加载器架构和双亲委派模型,但为了模块化系统的顺利运行,仍然发生了一些值得被注意的变动。
扩展机制被移除,扩展类加载器由于向后兼容性的原因被保留,不过被重命名为**平台类加载器(**platform class loader)。可以通过
ClassLoader
的新方法getPlatformClassLoader()
来获取。JDK 9时基于模块化进行构建(原来的rt.jar和tools.jar被拆分成数十个JMOD文件),其中的Java类库就已天然地满足了可扩展的需求,那自然无须再保留
<JAVA_HOME>\lib\ext
目录,此前使用这个目录或者java.ext.dirs
系统变量来扩展JDK功能的机制已经没有继续存在的价值了。平台类加载器和应用程序类加载器都不再继承自
java.net.URLClassLoader
。 现在启动类加载器、平台类加载器、应用程序类加载器全都继承于jdk.internal.loader.BuiltinClassLoader
。如果有程序直接依赖了这种继承关系,或者依赖了
URLClassLoader
类的特定方法,那代码很可能会在JDK 9及更高版本的JDK中崩溃。在Java 9中,类加载器有了名称。该名称在构造方法中指定,可以通过
getName()
方法来获取。平台类加载器的名称是platform
,应用类加载器的名称是app
。类加载器的名称在调试与类加载器相关的问题时会非常有用。启动类加载器现在是在JVM内部和Java类库共同协作实现的类加载器(以前是C++实现),但为了与之前代码兼容,在获取启动类加载器的场景中仍然会返回
null
,而不会得到BootClassLoader实例。类加载的委派关系也发生了变动。当平台及应用程序类加载器收到类加载请求,在委派给父加载器加载前,要先判断该类是否能够归属到某一个系统模块中,如果可以找到这样的归属关系,就要优先委派给负责那个模块的加载器完成加载。
加载器 启动类加载器 平台类加载器 应用程序加载器 加载的模块
代码:
public class ClassLoaderTest {
public static void main(String[] args) {
// jdk.internal.loader.ClassLoaders$AppClassLoader@6a6824be
System.out.println(ClassLoaderTest.class.getClassLoader());
// jdk.internal.loader.ClassLoaders$PlatformClassLoader@d041cf
System.out.println(ClassLoaderTest.class.getClassLoader().getParent());
// null
System.out.println(ClassLoaderTest.class.getClassLoader().getParent().getParent());
// 获取系统类加载器, jdk.internal.loader.ClassLoaders$AppClassLoader@6a6824be
System.out.println(ClassLoader.getSystemClassLoader());
// 获取平台类加载器,jdk.internal.loader.ClassLoaders$PlatformClassLoader@d041cf
System.out.println(ClassLoader.getPlatformClassLoader());
// 获取类的加载器的名称,app
System.out.println(ClassLoaderTest.class.getClassLoader().getName());
}
}
# 附:大厂面试题
蚂蚁金服:深入分析ClassLoader,双亲委派机制?类加载器的双亲委派模型是什么?一面:双亲委派机制及使用原因
百度:都有哪些类加载器,这些类加载器都加载哪些文件?手写一个类加载器Demo。
Class的forName(“java.lang.String”)和Class的getClassLoader()的Loadclass(“java.lang.String”)有什么区别?
腾讯:什么是双亲委派模型?类加载器有哪些?
小米:双亲委派模型介绍一下
滴滴:简单说说你了解的类加载器一面:讲一下双亲委派模型,以及其优点
字节跳动:什么是类加载器,类加载器有哪些?
京东:类加载器的双亲委派模型是什么?双亲委派机制可以打破吗?为什么?