更新時間:2023年04月04日10時53分 來源:傳智教育 瀏覽次數(shù):
Python中的multiprocessing模塊提供了一種創(chuàng)建和管理進程的方式,使得可以利用多個CPU來加速程序運行。在這里,我會詳細介紹Python中的多進程編程,包括以下內(nèi)容:
一.多進程概念
二.multiprocessing模塊介紹
三.進程池
四.進程通信
五.multiprocessing的一些注意事項
多進程是指在同一時間內(nèi),同時執(zhí)行多個程序或多個部分的程序。每個進程都擁有自己的地址空間、內(nèi)存、文件描述符和其他系統(tǒng)資源。多進程的好處在于可以使程序并行執(zhí)行,從而提高程序的運行效率。
multiprocessing模塊提供了一個Process類,可以用來創(chuàng)建和管理進程。下面是一個簡單的示例:
import multiprocessing def worker(): """該函數(shù)將在子進程中執(zhí)行""" print('Worker') if __name__ == '__main__': # 創(chuàng)建子進程 p = multiprocessing.Process(target=worker) # 啟動子進程 p.start() # 等待子進程結束 p.join()
在上面的代碼中,worker函數(shù)將在子進程中執(zhí)行。首先,創(chuàng)建了一個Process對象,指定target參數(shù)為worker函數(shù)。然后,通過調(diào)用start方法啟動子進程,最后調(diào)用join方法等待子進程結束。
如果需要創(chuàng)建大量的進程,那么使用Process類可能會導致系統(tǒng)資源的浪費。此時,可以使用Pool類來創(chuàng)建進程池。下面是一個簡單的示例:
import multiprocessing def worker(num): """該函數(shù)將在子進程中執(zhí)行""" print('Worker %d' % num) if __name__ == '__main__': # 創(chuàng)建進程池 pool = multiprocessing.Pool(4) # 啟動進程池中的進程 pool.map(worker, range(10)) # 關閉進程池 pool.close() # 等待進程池中的進程結束 pool.join()
在上面的代碼中,Pool類的構造函數(shù)中指定了進程池的大小為4,然后通過調(diào)用map方法來啟動進程池中的進程。map方法會將worker函數(shù)和range(10)序列中的每個元素一一對應,然后將它們作為參數(shù)傳遞給進程池中的進程。最后,調(diào)用close方法關閉進程池,并調(diào)用join方法等待所有進程結束。
在多進程編程中,不同的進程之間需要進行通信。multiprocessing模塊提供了多種進程間通信的方式,例如使用隊列、管道、共享內(nèi)存等。
隊列是一種常用的進程間通信方式。multiprocessing模塊中提供了Queue類,可以用來創(chuàng)建隊列。下面是一個簡單的示例:
import multiprocessing def producer(q): """該函數(shù)將在生產(chǎn)者進程中執(zhí)行""" for i in range(10): q.put(i) def consumer(q): """該函數(shù)將在消費者進程中執(zhí)行""" while True: item = q.get() if item is None: break print(item) if __name__ == '__main__': # 創(chuàng)建隊列 q = multiprocessing.Queue() # 創(chuàng)建生產(chǎn)者進程 p1 = multiprocessing.Process(target=producer, args=(q,)) # 創(chuàng)建消費者進程 p2 = multiprocessing.Process(target=consumer, args=(q,)) # 啟動進程 p1.start() p2.start() # 等待進程結束 p1.join() # 發(fā)送結束信號 q.put(None) p2.join()
在上面的代碼中,首先創(chuàng)建了一個Queue對象,然后創(chuàng)建了一個生產(chǎn)者進程和一個消費者進程。生產(chǎn)者進程通過調(diào)用put方法將0~9的數(shù)字放入隊列中,消費者進程通過調(diào)用get方法從隊列中獲取數(shù)據(jù),并將其打印出來。最后,調(diào)用put方法發(fā)送結束信號,然后等待兩個進程結束。
管道是另一種常用的進程間通信方式。multiprocessing模塊中提供了Pipe類,可以用來創(chuàng)建管道。下面是一個簡單的示例:
import multiprocessing def producer(conn): """該函數(shù)將在生產(chǎn)者進程中執(zhí)行""" for i in range(10): conn.send(i) conn.close() def consumer(conn): """該函數(shù)將在消費者進程中執(zhí)行""" while True: item = conn.recv() if item is None: break print(item) if __name__ == '__main__': # 創(chuàng)建管道 conn1, conn2 = multiprocessing.Pipe() # 創(chuàng)建生產(chǎn)者進程 p1 = multiprocessing.Process(target=producer, args=(conn1,)) # 創(chuàng)建消費者進程 p2 = multiprocessing.Process(target=consumer, args=(conn2,)) # 啟動進程 p1.start() p2.start() # 等待進程結束 p1.join() # 發(fā)送結束信號 conn1.send(None) p2.join()
在上面的代碼中,首先創(chuàng)建了一個管道,然后創(chuàng)建了一個生產(chǎn)者進程和一個消費者進程。生產(chǎn)者進程通過調(diào)用send方法將0~9的數(shù)字發(fā)送到管道中,消費者進程通過調(diào)用recv方法從管道中獲取數(shù)據(jù),并將其打印出來。最后,調(diào)用send方法發(fā)送結束信號,然后等待兩個進程結束。
共享內(nèi)存是一種高效的進程間通信方式,它允許多個進程共享同一塊內(nèi)存區(qū)域。multiprocessing模塊中提供了Value和Array類,可以用來創(chuàng)建共享內(nèi)存。下面是一個簡單的示例:
import multiprocessing def worker1(n): """該函數(shù)將在進程1中執(zhí)行""" n.value += 1 print('worker1:', n.value) def worker2(n): """該函數(shù)將在進程2中執(zhí)行""" n.value += 1 print('worker2:', n.value) if __name__ == '__main__': # 創(chuàng)建共享內(nèi)存 n = multiprocessing.Value('i', 0) # 創(chuàng)建進程1 p1 = multiprocessing.Process(target=worker1, args=(n,)) # 創(chuàng)建進程2 p2 = multiprocessing.Process(target=worker2, args=(n,)) # 啟動進程 p1.start() p2.start() # 等待進程結束 p1.join() p2.join()
在上面的代碼中,首先創(chuàng)建了一個Value對象,用于存儲一個整數(shù)值。然后創(chuàng)建了兩個進程,每個進程都會將共享內(nèi)存中的值加1,并將其打印出來。最后,等待兩個進程結束。
除了Value類之外,multiprocessing模塊還提供了Array類,用于創(chuàng)建共享內(nèi)存數(shù)組。下面是一個簡單的示例:
在上面的代碼中,首先創(chuàng)建了一個Array對象,用于存儲一個整數(shù)數(shù)組。然后創(chuàng)建了兩個進程,每個進程都會將共享內(nèi)存數(shù)組中的第一個元素加1,并將其打印出來。最后,等待兩個進程結束。
在使用 multiprocessing 模塊進行多進程編程時,需要注意以下幾點:
每個子進程都有自己的內(nèi)存空間,因此全局變量在多進程之間不能直接共享。如果需要共享數(shù)據(jù),可以使用 multiprocessing.Value 或 multiprocessing.Array 來創(chuàng)建共享內(nèi)存。
多個進程之間需要相互通信,可以使用 multiprocessing.Queue 或 multiprocessing.Pipe 來進行進程間通信。
如果需要同時啟動多個進程,可以使用進程池來管理進程。進程池可以避免頻繁地啟動和關閉進程所帶來的開銷,提高程序的效率。
每個子進程都是一個獨立的進程,當子進程出現(xiàn)異常時,主進程并不會收到通知。因此需要在子進程中進行異常處理,并將異常信息通過進程間通信的方式傳遞給主進程。
可以使用 multiprocessing.Process 來創(chuàng)建進程,也可以使用 multiprocessing.Pool 來創(chuàng)建進程池。進程池可以方便地管理多個進程,避免手動啟動和關閉進程所帶來的麻煩。