性能优化之使用LongAdder替换AtomicLong

栏目: 编程工具 · 发布时间: 7年前

内容简介：如果让你实现一个计数器，有点经验的同学可以很快的想到使用AtomicInteger或者AtomicLong进行简单的封装。因为计数器操作涉及到内存的可见性和线程之间的竞争，而Atomic***的实现完美的屏蔽了这些技术细节，我们只需要执行相应的方法，就能实现对应的业务需求。Atomic**虽然好用，不过这些的操作在并发量很大的情况下，性能问题也会被相应的放大。我们可以先看下其中

如果让你实现一个计数器，有点经验的同学可以很快的想到使用AtomicInteger或者AtomicLong进行简单的封装。

因为计数器操作涉及到内存的可见性和线程之间的竞争，而Atomic***的实现完美的屏蔽了这些技术细节，我们只需要执行相应的方法，就能实现对应的业务需求。

Atomic**虽然好用，不过这些的操作在并发量很大的情况下，性能问题也会被相应的放大。我们可以先看下其中 getAndIncrement 的实现代码

public final long getAndIncrement() {
    return unsafe.getAndAddLong(this, valueOffset, 1L);
}

// unsafe类中的实现
public final long getAndAddLong(Object var1, long var2, long var4) {
    long var6;
    do {
        var6 = this.getLongVolatile(var1, var2);
    } while(!this.compareAndSwapLong(var1, var2, var6, var6 + var4));

    return var6;
}

很显然，在 getAndAddLong 实现中，为了实现正确的累加操作，如果并发量很大的话，cpu会花费大量的时间在试错上面，相当于一个spin的操作。如果并发量小的情况，这些消耗可以忽略不计。

既然已经意识到Atomic***有这样的业务缺陷，Doug Lea大神又给我们提供了LongAdder，内部的实现有点类似ConcurrentHashMap的分段锁，最好的情况下，每个线程都有独立的计数器，这样可以大量减少并发操作。

下面通过JMH比较一下AtomicLong 和 LongAdder的性能。

@OutputTimeUnit(TimeUnit.MICROSECONDS)
@BenchmarkMode(Mode.Throughput)
public class Main {

    private static AtomicLong count = new AtomicLong();
    private static LongAdder longAdder = new LongAdder();
    public static void main(String[] args) throws Exception {
        Options options = new OptionsBuilder().include(Main.class.getName()).forks(1).build();
        new Runner(options).run();
    }

    @Benchmark
    @Threads(10)
    public void run0(){
        count.getAndIncrement();
    }

    @Benchmark
    @Threads(10)
    public void run1(){
        longAdder.increment();
    }
}

1、设置BenchmarkMode为Mode.Throughput，测试吞吐量

2、设置BenchmarkMode为Mode.AverageTime，测试平均耗时

线程数为1

1、吞吐量

Benchmark   Mode  Cnt    Score   Error   Units
Main.run0  thrpt    5  154.525 ± 9.767  ops/us
Main.run1  thrpt    5   89.599 ± 7.951  ops/us

2、平均耗时

Benchmark  Mode  Cnt  Score    Error  Units
Main.run0  avgt    5  0.007 ±  0.001  us/op
Main.run1  avgt    5  0.011 ±  0.001  us/op

单线程情况：

1、AtomicLong的吞吐量和平均耗时都占优势

线程数为10

1、吞吐量

Benchmark   Mode  Cnt    Score     Error   Units
Main.run0  thrpt    5   37.780 ±   1.891  ops/us
Main.run1  thrpt    5  464.927 ± 143.207  ops/us

2、平均耗时

Benchmark  Mode  Cnt  Score   Error  Units
Main.run0  avgt    5  0.290 ± 0.038  us/op
Main.run1  avgt    5  0.021 ± 0.001  us/op

并发线程为10个时：

LongAdder的吞吐量比较大，是AtomicLong的10倍多。
LongAdder的平均耗时是AtomicLong的十分之一。

线程数为30

1、吞吐量

Benchmark   Mode  Cnt    Score    Error   Units
Main.run0  thrpt    5   36.215 ±  2.341  ops/us
Main.run1  thrpt    5  486.630 ± 26.894  ops/us

2、平均耗时

Main.run0  avgt    5  0.792 ± 0.021  us/op
Main.run1  avgt    5  0.063 ± 0.002  us/op

线程数为30个时：

LongAdder的吞吐量比较大，也是AtomicLong的10倍多。
LongAdder的平均耗时也是AtomicLong的十分之一。

总结

一些高并发的场景，比如限流计数器，建议使用LongAdder替换AtomicLong，性能可以提升不少。

一份整理的蛮不错的 Java 核心知识点。覆盖了JVM、锁、并发、Java反射、Spring原理、微服务、Zookeeper、数据库、数据结构等大量知识点。

获取方式

关注公众号，并回复 666，获取通关口令。

以上所述就是小编给大家介绍的《性能优化之使用LongAdder替换AtomicLong》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

游戏测试精通

舒尔茨 / 周学毛 / 清华大学出版社 / 2007-9 / 48.00元

《游戏测试精通》来自3位在游戏测试领域都有着极其丰富经验的专业人员，是亚马逊“五星级”畅销书，也是国内第一本专业级游戏测试经典之作，不仅内容全面、实例丰富，而且讲解透彻、可读性强，并提供多个资源下载和技术支持站点。现如今，游戏产业发展迅猛，游戏测试已成为游戏产品、游戏软件、游戏程序设计与开发不可或缺的环节。《游戏测试精通》主要揭示了如何将软件测试的专业方法运用到游戏产业中，全面涵盖了游戏测试的基本......一起来看看《游戏测试精通》这本书的介绍吧!

码农工具

性能优化之使用LongAdder替换AtomicLong

线程数为1

线程数为10

线程数为30

总结

游戏测试精通

HTML 压缩/解压工具

在线进制转换器

URL 编码/解码