为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

栏目: IT资讯 · 发布时间: 6年前

内容简介:Hollis公众号的文章已经授权<维权骑士>进行原创维权,为避免不必要的版权追责问题,转载请注明出处!- MORE | 更多精彩文章 -

序列化是一种对象持久化的手段。普遍应用在网络传输、RMI等场景中。类通过实现 java.io.Serializable 接口以启用其序列化功能。

在我的博客中,其实已经有多篇文章介绍过序列化了,对序列化的基础知识不够了解的朋友可以参考以下几篇文章:

在这几篇文章中,我分别介绍过了序列化涉及到的类和接口、如何自定义序列化策略、transient关键字和序列化的关系等,还通过学习ArrayList对序列化的实现源码深入学习了序列化。并且还拓展分析了一下序列化对单例的影响等。

但是,还有一个知识点并未展开介绍,那就是关于 serialVersionUID 。这个字段到底有什么用?如果不设置会怎么样?为什么《阿里巴巴Java开发手册》中有以下规定:

为什么阿里巴巴要求 <a href='https://www.codercto.com'>程序员</a> 谨慎修改 serialVersionUID 字段的值

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

背景知识

在展开本文的介绍之前,先来简单介绍一些和序列化有关的知识,内容均来自文章开头的三个文章链接中。

Serializable 和 Externalizable

Java类通过实现 java.io.Serializable 接口以启用其序列化功能。 未实现此接口的类将无法进行序列化或反序列化。 可序列化类的所有子类型本身都是可序列化的。

如果读者看过 Serializable 的源码,就会发现,他只是一个空的接口,里面什么东西都没有。 Serializable接口没有方法或字段,仅用于标识可序列化的语义。 但是,如果一个类没有实现这个接口,想要被序列化的话,就会抛出 java.io.NotSerializableException 异常。

它是怎么保证只有实现了该接口的方法才能进行序列化与反序列化的呢?

原因是在执行序列化的过程中,会执行到以下代码:

if (obj instanceof String) {
    writeString((String) obj, unshared);
} else if (cl.isArray()) {
    writeArray(obj, desc, unshared);
} else if (obj instanceof Enum) {
    writeEnum((Enum<?>) obj, desc, unshared);
} else if (obj instanceof Serializable) {
    writeOrdinaryObject(obj, desc, unshared);
} else {
    if (extendedDebugInfo) {
        throw new NotSerializableException(
            cl.getName() + "\n" + debugInfoStack.toString());
    } else {
        throw new NotSerializableException(cl.getName());
    }
}

在进行序列化操作时,会判断要被序列化的类是否是 EnumArraySerializable 类型,如果都不是则直接抛出 NotSerializableException

Java中还提供了 Externalizable 接口,也可以实现它来提供序列化能力。

Externalizable 继承自 Serializable ,该接口中定义了两个抽象方法: writeExternal()readExternal()

当使用 Externalizable 接口来进行序列化与反序列化的时候需要开发人员重写 writeExternal()readExternal() 方法。否则所有变量的值都会变成默认值。

transient

transient 关键字的作用是控制变量的序列化,在变量声明前加上该关键字,可以阻止该变量被序列化到文件中,在被反序列化后, transient 变量的值被设为初始值,如 int 型的是 0,对象型的是 null。

自定义序列化策略

在序列化过程中,如果被序列化的类中定义了 writeObjectreadObject 方法,虚拟机会试图调用对象类里的 writeObjectreadObject 方法,进行用户自定义的序列化和反序列化。

如果没有这样的方法,则默认调用是 ObjectOutputStreamdefaultWriteObject 方法以及 ObjectInputStreamdefaultReadObject 方法。

用户自定义的 writeObjectreadObject 方法可以允许用户控制序列化的过程,比如可以在序列化的过程中动态改变序列化的数值。

所以,对于一些特殊字段需要定义序列化的策略的时候,可以考虑使用transient修饰,并自己重写 writeObjectreadObject 方法,如 java.util.ArrayList 中就有这样的实现。

以上,就是一些读者需要掌握和和序列化有关的知识。

我们随便找几个Java中实现了序列化接口的类,如String、Integer等,我们可以发现一个细节,那就是这些类除了实现了 Serializable 外,还定义了一个 serialVersionUID

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

那么,到底什么是 serialVersionUID 呢?为什么要设置这样一个字段呢?

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

什么是serialVersionUID

序列化是将对象的状态信息转换为可存储或传输的形式的过程。我们都知道,Java对象是保存在JVM的堆内存中的,也就是说,如果JVM堆不存在了,那么对象也就跟着消失了。

而序列化提供了一种方案,可以让你在即使JVM停机的情况下也能把对象保存下来的方案。就像我们平时用的U盘一样。把Java对象序列化成可存储或传输的形式(如二进制流),比如保存在文件中。这样,当再次需要这个对象的时候,从文件中读取出二进制流,再从二进制流中反序列化出对象。

虚拟机是否允许反序列化,不仅取决于类路径和功能代码是否一致,一个非常重要的一点是两个类的序列化 ID 是否一致,这个所谓的序列化ID,就是我们在代码中定义的 serialVersionUID

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

如果serialVersionUID变了会怎样

我们举个例子吧,看看如果 serialVersionUID 被修改了会发生什么?

public class SerializableDemo1 {
    public static void main(String[] args) {
        //Initializes The Object
        User1 user = new User1();
        user.setName("hollis");
        //Write Obj to File
        ObjectOutputStream oos = null;
        try {
            oos = new ObjectOutputStream(new FileOutputStream("tempFile"));
            oos.writeObject(user);
        } catch (IOException e) {
            e.printStackTrace();
        } finally {
            IOUtils.closeQuietly(oos);
        }
    }
}

class User1 implements Serializable {
    private static final long serialVersionUID = 1L;
    private String name;
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
 }

我们先执行以上代码,把一个User1对象写入到文件中。然后我们修改一下User1类,把 serialVersionUID 的值改为 2L

class User1 implements Serializable {
    private static final long serialVersionUID = 2L;
    private String name;
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
}

然后执行以下代码,把文件中的对象反序列化出来:

public class SerializableDemo2 {
    public static void main(String[] args) {
        //Read Obj from File
        File file = new File("tempFile");
        ObjectInputStream ois = null;
        try {
            ois = new ObjectInputStream(new FileInputStream(file));
            User1 newUser = (User1) ois.readObject();
            System.out.println(newUser);
        } catch (IOException e) {
            e.printStackTrace();
        } catch (ClassNotFoundException e) {
            e.printStackTrace();
        } finally {
            IOUtils.closeQuietly(ois);
            try {
                FileUtils.forceDelete(file);
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

执行结果如下:

java.io.InvalidClassException: com.hollis.User1; local class incompatible: stream classdesc serialVersionUID = 1, local class serialVersionUID = 2

可以发现,以上代码抛出了一个 java.io.InvalidClassException ,并且指出 serialVersionUID 不一致。

这是因为,在进行反序列化时,JVM会把传来的字节流中的 serialVersionUID 与本地相应实体类的 serialVersionUID 进行比较,如果相同就认为是一致的,可以进行反序列化,否则就会出现序列化版本不一致的异常,即是 InvalidCastException

这也是《阿里巴巴Java开发手册》中规定,在兼容性升级中,在修改类的时候,不要修改 serialVersionUID 的原因。 除非是完全不兼容的两个版本 。所以, serialVersionUID 其实是验证版本一致性的。

如果读者感兴趣,可以把各个版本的JDK代码都拿出来看一下,那些向下兼容的类的 serialVersionUID 是没有变化过的。比如String类的 serialVersionUID 一直都是 -6849794470754667710L

但是,作者认为,这个规范其实还可以再严格一些,那就是规定:

如果一个类实现了 Serializable 接口,就必须手动添加一个 private static final long serialVersionUID 变量,并且设置初始值。

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

为什么要明确定一个serialVersionUID

如果我们没有在类中明确的定义一个 serialVersionUID 的话,看看会发生什么。

尝试修改上面的demo代码,先使用以下类定义一个对象,该类中不定义 serialVersionUID ,将其写入文件。

class User1 implements Serializable {
    private String name;
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
 }

然后我们修改User1类,向其中增加一个属性。在尝试将其从文件中读取出来,并进行反序列化。

class User1 implements Serializable {
    private String name;
    private int age;
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public int getAge() {
        return age;
    }
    public void setAge(int age) {
        this.age = age;
    }
 }

执行结果:

java.io.InvalidClassException: com.hollis.User1; local class incompatible: stream classdesc serialVersionUID = -2986778152837257883, local class serialVersionUID = 7961728318907695402

同样,抛出了 InvalidClassException ,并且指出两个 serialVersionUID 不同,分别是 -29867781528372578837961728318907695402

从这里可以看出,系统自己添加了一个 serialVersionUID

所以,一旦类实现了 Serializable ,就建议明确的定义一个 serialVersionUID 。不然在修改类的时候,就会发生异常。

serialVersionUID 有两种显示的生成方式:        

一种是默认的1L,比如:     

private static final long serialVersionUID = 1L;   

另外一种是根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段,比如:

private static final  long   serialVersionUID = xxxxL;

后面这种方式,可以借助IDE生成,后面会介绍。

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

背后原理

知其然,要知其所以然,我们再来看看源码,分析一下为什么 serialVersionUID 改变的时候会抛异常?在没有明确定义的情况下,默认的 serialVersionUID 是怎么来的?

为了简化代码量,反序列化的调用链如下:

ObjectInputStream.readObject -> 
readObject0 -> 
readOrdinaryObject -> 
readClassDesc -> 
readNonProxyDesc -> 
ObjectStreamClass.initNonProxy

initNonProxy 中 ,关键代码如下:

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

在反序列化过程中,对 serialVersionUID 做了比较,如果发现不相等,则直接抛出异常。

深入看一下 getSerialVersionUID 方法:

public long getSerialVersionUID() {
    // REMIND: synchronize instead of relying on volatile?
    if (suid == null) {
        suid = AccessController.doPrivileged(
            new PrivilegedAction<Long>() {
                public Long run() {
                    return computeDefaultSUID(cl);
                }
            }
        );
    }
    return suid.longValue();
}

在没有定义 serialVersionUID 的时候,会调用 computeDefaultSUID 方法,生成一个默认的 serialVersionUID

这也就找到了以上两个问题的根源,其实是代码中做了严格的校验,并且在未定义的时候自动生成了一个 serialVersionUID

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

IDEA提示

为了确保我们不会忘记定义 serialVersionUID ,可以调节一下Intellij IDEA的配置,在实现 Serializable 接口后,如果没定义 serialVersionUID 的话,IDEA(eclipse一样)会进行提示:

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

并且可以一键生成一个:

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

当然,这个配置并不是默认生效的,需要手动到IDEA中设置一下:

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

在图中标号3的地方(Serializable class without serialVersionUID的配置),打上勾,保存即可。

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

总结

serialVersionUID 是用来验证版本一致性的。所以 在做兼容性升级的时候,不要改变类中 serialVersionUID 的值。

特别说明一下,由于本文标题并不完全能表达本文的全部内容,这里再强调一下: serialVersionUID 既然是验证版本一致性的,在做版本升级的时候(非兼容性升级),记得要修改这个字段的值哦,这样可以避免序列化混乱。

如果一个类实现了Serializable接口,一定要记得定义 serialVersionUID ,否则会发生异常。可以在IDE中通过设置,让他帮忙提示,并且可以一键快速生成一个 serialVersionUID

之所以会发生异常,是因为反序列化过程中做了校验,并且如果没有明确定义的话,会根据类名及属性等自动生成一个。

Hollis公众号的文章已经授权<维权骑士>进行原创维权,为避免不必要的版权追责问题,转载请注明出处!

2018年最后一个月,Hollis的知识星球限时折扣中。 深入理解Java中的并发编程:到底什么是线程安全? 欢迎您的加入。

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

直面Java第197期:为什么会出现乱码?

成神之路第015期:深入学习Java中的IO

深入并发第004期:实现线程的多种方式

- MORE | 更多精彩文章 -

如果你喜欢本文。

请长按二维码,关注 Hollis

为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值

转发朋友圈,是对我最大的支持。


以上所述就是小编给大家介绍的《为什么阿里巴巴要求程序员谨慎修改 serialVersionUID 字段的值》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

The Art of Computer Programming, Volumes 1-3 Boxed Set

The Art of Computer Programming, Volumes 1-3 Boxed Set

Donald E. Knuth / Addison-Wesley Professional / 1998-10-15 / USD 199.99

This multivolume work is widely recognized as the definitive description of classical computer science. The first three volumes have for decades been an invaluable resource in programming theory and p......一起来看看 《The Art of Computer Programming, Volumes 1-3 Boxed Set》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

SHA 加密
SHA 加密

SHA 加密工具