创意电子
标题:
大数据开发之Job提交换程源码和切片源码详解
[打印本页]
作者:
清闲的帆船先生
时间:
2021-8-18 10:24
标题:
大数据开发之Job提交换程源码和切片源码详解
1.Job提交流程源码详解
waitForCompletion()
submit();
// 1创建连接
connect();
// 1)创建提交Job的署理
new Cluster(getConfiguration());
// (1)判断是本地yarn还是远程
initialize(jobTrackAddr, conf);
// 2 提交job
submitter.submitJobInternal(Job.this, cluster)
// 1)创建给集群提交数据的Stag路径
Path jobStagingArea = JobSubmissionFiles.getStagingDir(cluster, conf);
// 2)获取jobid ,并创建Job路径
JobID jobId = submitClient.getNewJobID();
// 3)拷贝jar包到集群
copyAndConfigureFiles(job, submitJobDir);
rUploader.uploadFiles(job, jobSubmitDir);
// 4)计算切片,生成切片规划文件
writeSplits(job, submitJobDir);
maps = writeNewSplits(job, jobSubmitDir);
input.getSplits(job);
// 5)向Stag路径写XML设置文件
writeConf(conf, submitJobFile);
conf.writeXml(out);
// 6)提交Job,返回提交状态
status = submitClient.submitJob(jobId, submitJobDir.toString(), job.getCredentials());
登录/注册后可看大图
Job提交流程源码分析
2.FileInputFormat切片源码解析(input.getSplits(job))
登录/注册后可看大图
文章转载链接:http://www.atguigu.com/jsfx/11482.html
欢迎光临 创意电子 (https://wxcydz.cc/)
Powered by Discuz! X3.4