清闲的帆船先生 潜水
  • 2发帖数
  • 2主题数
  • 0关注数
  • 0粉丝
开启左侧

大数据开发之Job提交换程源码和切片源码详解

[复制链接]
清闲的帆船先生 发表于 2021-8-18 10:24:44 来自手机 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
1.Job提交流程源码详解
waitForCompletion()
submit();
// 1创建连接
connect();
// 1)创建提交Job的署理
new Cluster(getConfiguration());
// (1)判断是本地yarn还是远程
initialize(jobTrackAddr, conf);
// 2 提交job
submitter.submitJobInternal(Job.this, cluster)
// 1)创建给集群提交数据的Stag路径
Path jobStagingArea = JobSubmissionFiles.getStagingDir(cluster, conf);
// 2)获取jobid ,并创建Job路径
JobID jobId = submitClient.getNewJobID();
// 3)拷贝jar包到集群
copyAndConfigureFiles(job, submitJobDir);
rUploader.uploadFiles(job, jobSubmitDir);
// 4)计算切片,生成切片规划文件
writeSplits(job, submitJobDir);
maps = writeNewSplits(job, jobSubmitDir);
input.getSplits(job);
// 5)向Stag路径写XML设置文件
writeConf(conf, submitJobFile);
conf.writeXml(out);
// 6)提交Job,返回提交状态
status = submitClient.submitJob(jobId, submitJobDir.toString(), job.getCredentials());

                               
登录/注册后可看大图

Job提交流程源码分析
2.FileInputFormat切片源码解析(input.getSplits(job))

                               
登录/注册后可看大图

文章转载链接:http://www.atguigu.com/jsfx/11482.html
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

猜你喜欢
在线客服邮箱
wxcy#wkgb.net

邮箱地址#换为@

Powered by 创意电子 ©2018-现在 专注资源实战分享源码下载站联盟商城