设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 重新 试卷 文件
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

Python分布式进程中你会遇到的坑(2)

发布时间:2019-05-29 03:12 所属栏目:21 来源:编程思录
导读:现在,可以试试分布式进程的工作效果了。先启动task_master.py服务进程: Traceback(mostrecentcalllast): FileF:/Python/untitled/xianchengjincheng/master.py,line25,inmodule manager.start() FileF:Pythonpyst

现在,可以试试分布式进程的工作效果了。先启动task_master.py服务进程:

  1. Traceback (most recent call last): 
  2.  File "F:/Python/untitled/xianchengjincheng/master.py", line 25, in <module> 
  3.  manager.start() 
  4.  File "F:Pythonpystalllibmultiprocessingmanagers.py", line 513, in start 
  5.  self._process.start() 
  6.  File "F:Pythonpystalllibmultiprocessingprocess.py", line 105, in start 
  7.  self._popen = self._Popen(self) 
  8.  File "F:Pythonpystalllibmultiprocessingcontext.py", line 322, in _Popen 
  9.  return Popen(process_obj) 
  10.  File "F:Pythonpystalllibmultiprocessingpopen_spawn_win32.py", line 65, in __init__ 
  11.  reduction.dump(process_obj, to_child) 
  12.  File "F:Pythonpystalllibmultiprocessing 
  13. eduction.py", line 60, in dump 
  14.  ForkingPickler(file, protocol).dump(obj) 
  15. _pickle.PicklingError: Can't pickle <function <lambda> at 0x00000202D1921E18>: attribute lookup <lambda> on __main__ failed 

task_master.py进程发送完任务后,开始等待result队列的结果。现在启动task_worker.py进程:

  1. Connect to server 127.0.0.1... 
  2. Traceback (most recent call last): 
  3.  File "F:/Python/untitled/xianchengjincheng/work.py", line 24, in <module> 
  4.  m.connect() 
  5.  File "F:Pythonpystalllibmultiprocessingmanagers.py", line 489, in connect 
  6.  conn = Client(self._address, authkey=self._authkey) 
  7.  File "F:Pythonpystalllibmultiprocessingconnection.py", line 487, in Client 
  8.  c = SocketClient(address) 
  9.  File "F:Pythonpystalllibmultiprocessingconnection.py", line 614, in SocketClient 
  10.  s.connect(address) 
  11. ConnectionRefusedError: [WinError 10061] 由于目标计算机积极拒绝,无法连接。 

看到没,结果都出错了,我们好好分析一下到底哪出错了。。。

错误分析

在task_master.py的报错提示中,我们知道它说lambda错误,这是因为序列化不支持匿名函数,所以我们得修改代码,重新对queue用QueueManager进行封装放到网络中。

  1. # 把两个Queue都注册到网络上, callable参数关联了Queue对象 
  2. QueueManager.register('get_task_queue',callable=return_task_queue)  
  3. QueueManager.register('get_result_queue',callable=return_result_queue) 

其中task_queue和result_queue是两个队列,分别存放任务和结果。它们用来进行进程间通信,交换对象。

因为是分布式的环境,放入queue中的数据需要等待Workers机器运算处理后再进行读取,这样就需要对queue用QueueManager进行封装放到网络中,这是通过上面的2行代码来实现的。我们给return_task_queue的网络调用接口取了一个名get_task_queue,而return_result_queue的名字是get_result_queue,方便区分对哪个queue进行操作。task.put(n)即是对task_queue进行写入数据,相当于分配任务。而result.get()即是等待workers机器处理后返回的结果。

值得注意 在windows系统中你必须要写IP地址,而其他操作系统比如linux操作系统则就不要了。

  1. # windows需要写ip地址 
  2. manager = QueueManager(address=('127.0.0.1', 5000), authkey=b'abc') 

修改后的代码

在task_master.py中修改如下:

  1. #!/user/bin/pytthon 
  2. # -*- coding:utf-8 -*- 
  3. # @Time: 2018/3/3 16:46 
  4. # @Author: lichexo 
  5. # @File: task_master.py 
  6. # task_master.py 
  7. import random,time,queue 
  8. from multiprocessing.managers import BaseManager 
  9. from multiprocessing import freeze_support 
  10. task_queue = queue.Queue() # 发送任务的队列: 
  11. result_queue = queue.Queue() # 接收结果的队列: 
  12. class QueueManager(BaseManager): # 从BaseManager继承的QueueManager: 
  13.  pass 
  14. # windows下运行 
  15. def return_task_queue(): 
  16.  global task_queue 
  17.  return task_queue # 返回发送任务队列 
  18. def return_result_queue (): 
  19.  global result_queue 
  20.  return result_queue # 返回接收结果队列 
  21. def test(): 
  22.  # 把两个Queue都注册到网络上, callable参数关联了Queue对象,它们用来进行进程间通信,交换对象 
  23.  #QueueManager.register('get_task_queue', callable=lambda: task_queue) 
  24.  #QueueManager.register('get_result_queue', callable=lambda: result_queue) 
  25.  QueueManager.register('get_task_queue', callable=return_task_queue) 
  26.  QueueManager.register('get_result_queue', callable=return_result_queue) 
  27.  # 绑定端口5000, 设置验证码'abc': 
  28.  #manager = QueueManager(address=('', 5000), authkey=b'abc') 
  29.  # windows需要写ip地址 
  30.  manager = QueueManager(address=('127.0.0.1', 5000), authkey=b'abc') 
  31.  manager.start() # 启动Queue: 
  32.  # 获得通过网络访问的Queue对象: 
  33.  task = manager.get_task_queue() 
  34.  result = manager.get_result_queue() 
  35.  for i in range(10): # 放几个任务进去: 
  36.  n = random.randint(0, 10000) 
  37.  print('Put task %d...' % n) 
  38.  task.put(n) 
  39.  # 从result队列读取结果: 
  40.  print('Try get results...') 
  41.  for i in range(10): 
  42.  # 这里加了异常捕获 
  43.  try: 
  44.  r = result.get(timeout=5) 
  45.  print('Result: %s' % r) 
  46.  except queue.Empty: 
  47.  print('result queue is empty.') 
  48.  # 关闭: 
  49.  manager.shutdown() 
  50.  print('master exit.') 
  51. if __name__=='__main__': 
  52.  freeze_support() 
  53.  print('start!') 
  54.  test() 

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读