hadoop_book/hdfs/BPServiceActor详解.md
2024-07-28 20:16:53 +08:00

4.5 KiB
Raw Permalink Blame History

简介

BPServiceActor 主要在DataNode中用于和NameNode沟通的类。主要功能如下

  • 与 namenode 进行预注册握手。
  • 向 namenode 注册。
  • 定期向 namenode 发送心跳。
  • 处理从 namenode 收到的命令。

核心功能

BPServiceActor的入口函数为start函数当前类本身为runnable接口的实现类所以在start函数里面新建了BPServiceActor线程并且将其启动 所以其真实的启动函数为run()

在run函数里面主要做了连接NameNode并且注册当前DataNode的事。

与NameNode握手

首先要做的就是和NameNode建立连接核心代码如下

bpNamenode = dn.connectToNN(nnAddr);

建立连接之后需要做的就是获取获取版本信息并且检查版本信息如果单次获取失败会进行重试。失败之后每次的重试间隔为5s。

NamespaceInfo nsInfo = retrieveNamespaceInfo();
bpos.verifyAndSetNamespaceInfo(this, nsInfo);

到此与NameNode之间的握手结束。开始注册当前的DataNode到NameNode。

注册DataNode

DataNode注册核心逻辑

注册DataNode的核心函数是register

void register(NamespaceInfo nsInfo) throws IOException {
    // The handshake() phase loaded the block pool storage
    // off disk - so update the bpRegistration object from that info
    DatanodeRegistration newBpRegistration = bpos.createRegistration();

    LOG.info(this + " beginning handshake with NN");

    while (shouldRun()) {
        try {
            // 向NN注册DataNodde
            newBpRegistration = bpNamenode.registerDatanode(newBpRegistration);
            newBpRegistration.setNamespaceInfo(nsInfo);
            bpRegistration = newBpRegistration;
            break;
            // ... 省略部分异常处理
        }
    }

    if (bpRegistration == null) {
        throw new IOException("DN shut down before block pool registered");
    }

    // .. 省略 ..
    // reset lease id whenever registered to NN.
    // ask for a new lease id at the next heartbeat.
    fullBlockReportLeaseId = 0;

    // random short delay - helps scatter the BR from all DatanodeRegistration 
    // 定时汇报block块信息给NN
    scheduler.scheduleBlockReport(dnConf.initialBlockReportDelayMs, true);
}

NameNode 处理注册信息

NameNode处理DataNode的注册信息主要接口是在NameNodeRpcServer的ipc接口registerDatanode。 其主要的实现实在DatanodeManager中的函数registerDatanode。

主要实现如下:

// update cluster map
getNetworkTopology().remove(nodeS);
if(shouldCountVersion(nodeS)) {
    decrementVersionCount(nodeS.getSoftwareVersion());
}
nodeS.updateRegInfo(nodeReg);

nodeS.setSoftwareVersion(nodeReg.getSoftwareVersion());
nodeS.setDisallowed(false); // Node is in the include list

// resolve network location
if(this.rejectUnresolvedTopologyDN) {
    nodeS.setNetworkLocation(resolveNetworkLocation(nodeS));
    nodeS.setDependentHostNames(getNetworkDependencies(nodeS));
} else {
    nodeS.setNetworkLocation(
            resolveNetworkLocationWithFallBackToDefaultLocation(nodeS));
    nodeS.setDependentHostNames(
            getNetworkDependenciesWithDefault(nodeS));
}
getNetworkTopology().add(nodeS);
resolveUpgradeDomain(nodeS);

// also treat the registration message as a heartbeat
heartbeatManager.register(nodeS);
incrementVersionCount(nodeS.getSoftwareVersion());
startAdminOperationIfNecessary(nodeS);
success = true;

主要做了下面两件事:

  • 更新节点信息,比如网络拓扑信息。
  • 在心跳管理里面注册当前节点。只要将节点信息添加到节点列表里面即可。

发送心跳

在DN和NN建立连接并且注册完成之后会定时向NN发送心跳信息。入口函数为offerService。在这个函数里面控制定时向NN发送心跳。 通过下面类似的方式计算是否需要发送心跳:

final boolean sendHeartbeat = scheduler.isHeartbeatDue(startTime);

心跳信息包含下面信息:

  • DataNode名称。
  • DataNode文件传输的端口。
  • DataNode的所有容量。
  • DataNode的可用容量。
  • 慢盘等信息上报。

心跳的响应类是HeartbeatResponse。主要包含下面信息

  • NN的Ha状态信息。如果NN的主备信息发生变化需要跟新DN中的NN信息。
  • NN发送给DN的所有命令。在offerService里面会将这些命令异步执行。
  • 滚动重启状态。
  • 最新的LeaseId。

如果NN主动要求DN进行块上报会在心跳里面触发块上报。

发送心跳的函数是sendHeartBeat