内容

模拟 map reduce,使用多个进程模拟多个计算机,统计一个文件中的词频。进程间的通信使用 unix domain socket (参考 Unix domain socket 简介 - sparkdev - 博客园 (cnblogs.com))进行,接口的调用以 rpc 的方式。

  • 实验详情见

https://pdos.csail.mit.edu/6.824/labs/lab-mr.html

实验除了进程间通信的 unix domain socket 需要熟悉一下 api 之外,总的来说比较简单就不做逻辑上的分析了。我认为有两个值得注意的地方:

  1. 任务的多种状态
  2. map 和 reduce 需要是状态无关的纯函数