数据本地性
-
如何优化MapReduce作业以提高数据本地性?
MapReduce 数据本地性是指将计算任务分配给离数据最近的节点,以减少数据传输时间,提高计算效率。在准备 MapReduce 样例初始数据时,应尽量将数据存储在执行任务的节点附近,以提高数据本地性。
MapReduce 数据本地性是指将计算任务分配给离数据最近的节点,以减少数据传输时间,提高计算效率。在准备 MapReduce 样例初始数据时,应尽量将数据存储在执行任务的节点附近,以提高数据本地性。