Python 进程之间共享数据(全局变量)的方法

  

实现多进程之间的数据共享,可以通过使用共享内存的方式,或者使用第三方库multiprocessing中提供的Manager类型,下面分别进行详细的介绍。

使用共享内存

使用共享内存的方式,需要使用multiprocessing中提供的Value、Array对象。Value用于基本类型的共享内存,而Array用于数组的共享内存。

Value

Value用于创建共享内存中的基本类型变量,并且可以通过value属性进行读写。以下为一个示例:

import multiprocessing

def func(val):
    val.value += 1
    print(val.value)

if __name__ == '__main__':
    val = multiprocessing.Value('i', 0)
    process1 = multiprocessing.Process(target=func, args=(val,))
    process2 = multiprocessing.Process(target=func, args=(val,))
    process1.start()
    process2.start()
    process1.join()
    process2.join()

输出结果为:

1
2

这里创建了一个共享变量val,使用了Value对象,并且将类型指定为‘i’,即整型。在进程中,通过val.value可以进行对共享变量的读写。这里创建了两个进程,两个进程都对val进行了5次加1操作,最终输出结果为1、2。

Array

和Value类似,Array也需要指定类型,但可以指定类型为任意数组。以下为一个示例:

import multiprocessing

def func(arr):
    for i in range(len(arr)):
        arr[i] += 1
    print(arr[:])

if __name__ == '__main__':
    arr = multiprocessing.Array('i', [0, 1, 2, 3, 4])
    process1 = multiprocessing.Process(target=func, args=(arr,))
    process2 = multiprocessing.Process(target=func, args=(arr,))
    process1.start()
    process2.start()
    process1.join()
    process2.join()

输出结果为:

[2, 3, 4, 5, 6]
[3, 4, 5, 6, 7]

这里创建了一个共享数组arr,使用了Array对象,并且将类型指定为‘i’,即整型。在进程中,可以通过arr[:]来进行对共享数组的读写。这里创建了两个进程,两个进程都对arr进行了5次加1操作,最终输出结果为两个进程操作后的arr。

使用Manager类型

Manager类型可以在多进程间共享任意Python对象,包括list、dict、Queue等等,使用Manager需要深入了解Python对象的序列化和反序列化操作。以下为一个示例:

import multiprocessing

def func(d):
    d[1] = 'a'
    print(d)

if __name__ == '__main__':
    manager = multiprocessing.Manager()
    dict_shared = manager.dict()
    dict_shared[0] = 'b'
    process1 = multiprocessing.Process(target=func, args=(dict_shared,))
    process2 = multiprocessing.Process(target=func, args=(dict_shared,))
    process1.start()
    process2.start()
    process1.join()
    process2.join()

输出结果为:

{0: 'b', 1: 'a'}
{0: 'b', 1: 'a'}

这里创建了一个共享字典dict_shared,使用了Manager对象,Manager对象可以创建一个共享变量,并且可以放进任意Python对象,如字典,字典的读写可以通过[]进行操作。这里同样创建了两个进程,对dict_shared进行读写操作,最终输出2个进程对dict_shared的读写结果。

总结

以上介绍了多进程之间共享数据的两种方法,分别是使用共享内存的方式,或者使用第三方库multiprocessing中提供的Manager类型。根据不同的使用场景,选择不同的方法。共享内存具有读写速度快的优点,但是存在数据不安全的问题;而Manager类型虽然不存在数据不安全问题,但是增加了序列化、反序列化等操作,导致读写速度相对较慢。

相关文章