如何使用YARN命令提交MapReduce作业并同步执行录制控制命令?


MapReduce 提交到 YARN 的命令
为了将 MapReduce 程序提交到 YARN 上运行,您需要使用yarn 命令,以下是一个详细的步骤和命令示例:
步骤 1: 准备 MapReduce 程序
确保您的 MapReduce 程序已经编写完毕,并且编译成了可执行的 JAR 文件。
步骤 2: 提交到 YARN
使用以下命令将 MapReduce 程序提交到 YARN:

yarn jar <jarfile> [mainclass] [args…]

如何使用YARN命令提交MapReduce作业并同步执行录制控制命令?


<jarfile> 是您的 MapReduce 程序的 JAR 文件路径。[mainclass] 是包含 main 方法的类名。[args...] 是传递给 main 方法的参数。
示例
假设您的 MapReduce 程序的 JAR 文件名为mymapreduceprogram.jar,主类名为com.example.MyMapper,并且您想要传递一些参数给程序。

yarn jar mymapreduceprogram.jar com.example.MyMapper arg1 arg2 arg3

录制控制命令
如果您想要记录这个提交命令以便将来重复执行或分析,可以使用以下命令:

yarn jar mymapreduceprogram.jar com.example.MyMapper arg1 arg2 arg3 > submitlog.txt 2>&1

如何使用YARN命令提交MapReduce作业并同步执行录制控制命令?


这里:> 用于将命令的输出重定向到文件submitlog.txt2>&1 用于将标准错误也重定向到相同的文件。
这样,所有的输出(包括标准输出和标准错误)都会被记录到submitlog.txt 文件中,方便后续查看和分析。

原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1135860.html

本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。

(0)
未希新媒体运营
上一篇 2024-10-03 07:35
下一篇 2024-10-03 07:36

相关推荐

  • 如何通过设置任务优先级来优化mapreduce yarn包中提交的MapReduce作业效率?

    在YARN(Yet Another Resource Negotiator)环境中提交MapReduce任务时,可以通过设置任务的优先级来影响其在资源分配和调度过程中的优先级,以下是如何在提交MapReduce任务时设置任务优先级的详细步骤:步骤 1: 创建并配置MapReduce作业配置文件需要创建或修改Ma……

    2024-10-07
    09
  • 为什么无法通过ResourceManager Web UI页面的Tracking URL打开MapReduce作业信息?

    MapReduce 作业信息无法通过 ResourceManager Web UI 页面的 Tracking URL 打开的解决步骤1. 问题分析当通过 ResourceManager 的 Web UI 页面的 Tracking URL 无法打开 MapReduce 作业信息时,可能的原因包括网络问题、配置错误……

    2024-10-05
    022
  • 如何正确使用MapReduce提交YARN命令来控制任务录制?

    使用hadoop jar命令提交MapReduce作业,并通过D mapreduce.jobtracker.address参数指定Yarn资源管理器地址。

    2024-09-30
    015
  • 如何正确设置MapReduce作业的JSON输入格式?

    MapReduce是一种编程模型,用于处理和生成大数据集。它主要包括两个阶段:Map阶段和Reduce阶段。,,1. **Map阶段**:在这个阶段,输入数据被分成多个部分,每个部分由一个map任务处理。每个map任务都会将输入数据转换为一组键值对(keyvalue pairs)。如果输入是一个JSON文件,map任务可能会读取文件中的每个记录,并将其转换为一个键值对。,,2. **Shuffle和Sort阶段**:在Map阶段完成后,输出的键值对会被洗牌(shuffle)和排序(sort)。这意味着具有相同键的所有键值对都会被组合在一起,并且按键进行排序。,,3. **Reduce阶段**:在这个阶段,reduce任务会处理洗牌和排序后的键值对。对于每个唯一的键,reduce任务会合并所有相关的值,并生成最终的输出。如果任务是计算每个单词的出现次数,reduce任务会将所有相同的单词合并,并计算总数。,,4. **输出**:reduce任务的输出会被写入到HDFS或其他存储系统中,供后续分析或报告使用。,,MapReduce通过将大数据集分解成小块、并行处理这些小块、然后汇归纳果来简化大数据处理。这种模型非常适合于处理大量非结构化或半结构化数据。

    2024-09-28
    018

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

产品购买 QQ咨询 微信咨询 SEO优化
分享本页
返回顶部
云产品限时秒杀。精选云产品高防服务器,20M大带宽限量抢购 >>点击进入