在多线程、多处理器甚至是分布式环境的编程时代,并发是一个不可回避的问题,很多程序员一碰到并发二字头皮就发麻,也包括我。既然并发问题摆在面前一个到无法回避的坎,倒不如拥抱它,把它搞清楚,决心花一定的时间从操作系统底层原理到Java的基础编程再到分布式环境等几个方面深入探索并发问题。先就从原理开始吧。
并发产生的原因
虽然从直观效果上,处理器是并行处理多项任务,但本质上一个处理器在某个时间点只能处理一个任务,属于串行执行。在单处理器的情况下,并发问题源于多道程序设计系统的一个基本特性:进程的相对执行速度不可预测,它取决于其他进程的活动、操作系统处理中断的方式以及操作系统的调度策略。在分布式环境下,并发产生的可能性就更大了,只要大家有依赖的共享资源,就有并发问题的出现,因为互相调用次序更加没法控制。
并发带来的问题
● 全局资源的共享充满了危险。不同任务对同一个共享资源的读写顺序非常关键
● 操作系统很难对分配资源进行最优化管理。挂起的线程占有了其他活动线程需要的资源
● 定位错误非常困难。这种问题来源和触发的不确定性,导致定位问题非常困难
● 限制分布式系统横向扩展能力
进程的交互
进程的交互方式决定了并发问题产生的上下文,解决并发问题也需根据进程交互方式的不同而不同对待。一般进程交互分为以下三种:
1)进程间相互独立
这种情况下虽然进程间没有数据共享,所做事情也互不联系,但它们存在竞争关系。计算机中有些临界资源比如I/O设备、存储器、CPU时间和时钟等等都需要通过竞争得到,你占用的时候就得保证别人没法占用,因此首先得解决这种互斥的需求。另外,要处理好这种临界资源的调度策略,处理不当就有可能发生死锁和饥饿
2)进程间通过共享合作
这种情况下进程间虽然执行的过程是相互独立的,互不知道对方的执行情况,但互相之间有共享的数据。因此除了有以上互斥需求和死锁饥饿的可能,另外还会有数据一致性的问题。当多个进程非原子性操作同一个数据时候,互相之间操作时序不当就有可能造成数据不一致
3)进程间通过通信合作
这种情况下进程间通过消息互相通信,知晓各自的执行情况,不共享任何资源,因此就可以避免互斥和数据不一致问题,但仍然存在死锁和饥饿的问题
并发问题的解决办法
操作系统解决并发问题一般通过互斥,为了提供互斥的支持,需要满足以下需求:
● 一次只允许一个进程进入临界区
● 一个非临界区停止的进程必须不干涉其他进程
● 不允许出现一个需要访问临界区的进程被无限延迟
● 一个进程驻留在临界区中的时间必须是有限的
● 临界区空闲时,任何需要进入临界区的进程必须能够立即进入