1、概览

当多线程帮助我们提高应用性能的同时,它同时也带来一些问题,本文我们将借助几个小例子看下两个问题,死锁和活锁。

2、死锁

2.1、什么是死锁

死锁发生在当两个或多个线程一直在等待另一个线程持有的锁或资源的时候。这会导致一个程序可能会被拖垮或者直接挂掉,因为线程们都不能继续工作了。

经典的哲学家进餐问题非常好的展示了多线程下的同步问题并且经常被用来当作死锁的例子。

2.2 死锁举例

首先,我们看一个简单的Java例子来理解死锁。

在这个例子中,我们创建两个线程,T1和T2。线程T1调用operation1,线程T2调用operation2。

为了完成操作,线程T1需要先获取到lock1再获取到lock2,然后此时线程T2需要先获取到lock2再获取到lock1。因此两个线程都在以相反的顺序获取锁。

现在,我们写一下DeadlockExample:

public class DeadlockExample {

    private Lock lock1 = new ReentrantLock(true);
private Lock lock2 = new ReentrantLock(true); public static void main(String[] args) {
DeadlockExample deadlock = new DeadlockExample();
new Thread(deadlock::operation1, "T1").start();
new Thread(deadlock::operation2, "T2").start();
} public void operation1() {
lock1.lock();
print("lock1 acquired, waiting to acquire lock2.");
sleep(50); lock2.lock();
print("lock2 acquired"); print("executing first operation."); lock2.unlock();
lock1.unlock();
} public void operation2() {
lock2.lock();
print("lock2 acquired, waiting to acquire lock1.");
sleep(50); lock1.lock();
print("lock1 acquired"); print("executing second operation."); lock1.unlock();
lock2.unlock();
} // helper methods
}

我们运行一下这个例子看下输出:

Thread T1: lock1 acquired, waiting to acquire lock2.
Thread T2: lock2 acquired, waiting to acquire lock1.

一运行这个例子我们就能看到程序导致了一个死锁且永远也退出不了。输出日志展示了线程T1在等待lock2,但lock2被线程T2所持有。相似的,线程T2在等待lock1,他被T1所持有。

2.3 避免死锁

死锁在Java中是个很常见的并发问题,因为我们应该设计一个程序来避免潜在的死锁条件。

  • 首先我们应该避免一个线程获取多个锁。
  • 其次如果一个线程真的需要多个锁,我们应该确保所有线程都以相同的顺序获取锁,来避免获取锁时的循环依赖问题
  • 我们也可以使用带有超时功能的锁,像Lock接口中的tryLock方法,来确保一个线程如果获取不到锁不会一直阻塞。

3、活锁

3.1 什么是活锁

活锁是另一个并发问题,它和死锁很相似。在活锁中,两个或多个线程彼此间一直在转移状态,而不像我们上个例子中互相等待。结果就是所有线程都不能执行它们各自的任务。

一个比较好的活锁例子就是消息队列。当发生异常的时候,消息消费者回滚事务并把消息放到队列头中,然后相同的消息又从队列头中被读到,又会造成异常并再次放入到队列头中。如此循坏往复,消费者永远读不到队列中其他的消息。

3.2 活锁举例

现在我们展示一下活锁的情况,我们同样拿上面死锁的例子来解释。线程T1调用operation1,线程T2调用operation2,但是我们稍微改变的操作的逻辑。

两个线程都需要拿到两把锁来完成工作,每个线程拿到第一个锁后都会发现拿不到第二把锁,因此为了让另一个线程先完成任务,每个线程都会释放第一把锁并会尝试再次获取到两把锁。

我们来看下下面的测试例子

public class LivelockExample {
 
    private Lock lock1 = new ReentrantLock(true);
    private Lock lock2 = new ReentrantLock(true);
 
    public static void main(String[] args) {
        LivelockExample livelock = new LivelockExample();
        new Thread(livelock::operation1, "T1").start();
        new Thread(livelock::operation2, "T2").start();
    }
 
    public void operation1() {
        while (true) {
            tryLock(lock1, 50);
            print("lock1 acquired, trying to acquire lock2.");
            sleep(50);
 
            if (tryLock(lock2)) {
                print("lock2 acquired.");
            } else {
                print("cannot acquire lock2, releasing lock1.");
                lock1.unlock();
                continue;
            }
 
            print("executing first operation.");
            break;
        }
        lock2.unlock();
        lock1.unlock();
    }
 
    public void operation2() {
        while (true) {
            tryLock(lock2, 50);
            print("lock2 acquired, trying to acquire lock1.");
            sleep(50);
 
            if (tryLock(lock1)) {
                print("lock1 acquired.");
            } else {
                print("cannot acquire lock1, releasing lock2.");
                lock2.unlock();
                continue;
            }
 
            print("executing second operation.");
            break;
        }
        lock1.unlock();
        lock2.unlock();
    }
 
    // helper methods
}

我们看下运行结果:

Thread T1: lock1 acquired, trying to acquire lock2.
Thread T2: lock2 acquired, trying to acquire lock1.
Thread T1: cannot acquire lock2, releasing lock1.
Thread T2: cannot acquire lock1, releasing lock2.
Thread T2: lock2 acquired, trying to acquire lock1.
Thread T1: lock1 acquired, trying to acquire lock2.
Thread T1: cannot acquire lock2, releasing lock1.
Thread T1: lock1 acquired, trying to acquire lock2.
Thread T2: cannot acquire lock1, releasing lock2.

能看到输出结果里,两个线程都在重复的获取锁和释放锁,导致两个线程都不能完成操作。

3.3 避免活锁

避免活锁我们得观察一下活锁发生的条件并根据情况提出方案,比如:

  • 如果我们有两个线程在重复的获取锁和释放锁导致了活锁,我们可以修改下代码让两个线程以一个随机的时间间隔来获取锁,这样线程就有机会获取到它们需要的锁了。
  • 另一个方式来解决我们前面提到的消息队列的问题就是把失败的消息放到单独的的队列中去进一步处理而不是再次放入原队列中。(这个在实际开发中还真遇到过,开发的时候漏掉了一个情况,导致循环消费多条错误消息,队列消息大量积压,要不是队列报警,险些造成线上bug,所以生产环境的队列消费最好还是设置个失败次数加上死信队列,不然出问题可真受不了。

最新文章

  1. Linux查看程序端口占用情况
  2. 【转】如何用 Chrome for Android 做远程遥控 debugging
  3. 扩展jQuery easyui datagrid增加动态改变列编辑的类型
  4. hdu 1271 整数对
  5. DHTMLX 前端框架 建立你的一个应用程序 教程(七)-- 添加筛选功能
  6. RHEL 7特性说明(六):集群
  7. BZOJ 1022 小约翰的游戏
  8. createObjectURL方法 实现本地图片预览
  9. erlang shell表格数据对齐
  10. [Sqlite]-->Java采用jdbc联系Sqlite各种特定的工艺数据库的数据操作
  11. html页面显示服务器时间
  12. Intellij Idea使用频率较高的几个快捷键
  13. openssl 生成证书基本原理
  14. 强大的数据库工具 dbForge Studio ForMySql
  15. byte数组和int之间相互转化的方法
  16. java框架注意
  17. 使用jQuery实现返回顶部功能
  18. Android四大组件应用系列——使用BroadcastReceiver和Service实现倒计时
  19. ftp工具类
  20. Swift与OC代码转换实例

热门文章

  1. 开发笔记:PDF生成文字和图片水印
  2. deploy.php
  3. 通过代码实现 `OutOfMemory
  4. Spring笔记(5) - 声明式事务@EnableTransactionManagement注解源码分析
  5. LC滤波器简单设计法 - 一文读懂LC滤波器简单设计方法及原理介绍,LC值计算方法
  6. ui 自动化的测试用例从哪来
  7. AtCoder 1807 食塩水
  8. CodeForces 1344D Résumé Review
  9. 漫谈:从APP崩溃率标准,到Monkey介绍拓展Maxim,及Jenkins自动化配置,持续集成获取崩溃monkey日志
  10. Oracle初始——第一天