From 5a296ee76ed522dc4f032b4433e3f755d81cf86c Mon Sep 17 00:00:00 2001 From: zeekling Date: Mon, 10 Jun 2024 14:35:46 +0800 Subject: [PATCH] =?UTF-8?q?=E5=A2=9E=E5=8A=A0leaseManager?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- hdfs/leaseManager详解.md | 34 ++++++++++++++++++++++++++++++++++ 1 file changed, 34 insertions(+) create mode 100644 hdfs/leaseManager详解.md diff --git a/hdfs/leaseManager详解.md b/hdfs/leaseManager详解.md new file mode 100644 index 0000000..c75649b --- /dev/null +++ b/hdfs/leaseManager详解.md @@ -0,0 +1,34 @@ + +# 简介 + +HDFS作为一个分布式文件系统,只允许一个客户端同时对一个文件进行修改操作。租约就是为了实现独占的写操作的机制。 +HDFS租约的主要实现类是LeaseManager。 + +Lease 的使用场景如下: + +![lease_quest](https://pan.zeekling.cn/zeekling/hadoop/namenode/lease_request.png) + +- 客户端在申请创建新的文件或者向文件追加都会先向NameNode申请获得inode或者最后一个块的信息 +- 在NameNode中FSNamesystem会调用recoverLeaseInternal检查文件是否是UnderConstruction,是UnderConstruction的前提下,在leaseManager中是否这个client已经持有租约,如果有则抛出已经持有租约的异常 +- 再检查文件的原来的租约持有者的的租约是否超过了软限制,如果超过了软限制则执行租约恢复internalReleaseLease进行租约恢复。 +- 因为在文件是UnderConstruction前提下检查,文件必定有一个租约持有者,所以,直接抛出已经有另一个租约持有者的异常。 +- 如果文件不是在UnderConstruction状态,则直接为这个发起请求的客户端构造租约,加入到LeaseManager的租约维护的集合中。 +- 在NameNode中租约持有者DFSClient并不是DFSClient类,而是clientName,他的生成规则如下 +```java +# 其中dfsClientConf.taskId是mapreduce.task.attempt.id 配置获取默认为NONMAPREDUCE +clientName = "DFSClient_" + dfsClientConf.taskId + "_" + DFSUtil.getRandom().nextInt() + "_" + Thread.currentThread().getId(); +``` + +## leaseManager + +- 软限制 & 硬限制 + + - 软限制是能容忍的客户端刷新租约的最长时间限制,为60s不可更改,如果客户端的租约超过60s未更新,则其他客户端请求文件就可以执行租约恢复操作 + - 硬限制就是namenode能容忍的文件最长不放开租约的时间,在超过软限制后,并没有客户端请求更改文件导致没有触发租约恢复,那么只能等待LeaseManager的周期线程检查这个超过这个时限的租约强制进行租约恢复。恢复的角色也会变成namenode。 + +- LeaseManager 主要用户租约的管理,其实就是保存 用户 + 文件 + 租约的集合,LeaseManager内部的集合有2个(Hadoop 3.3.1版本) + - leases:为一个map,记录clientName 对应的Lease。 + - leasesById:以路径字典序保存了文件的nodeId与租约的对应关系,用来其他类快速获取UnderConstruction的文件。 +- 用户为DFSClient 索引者一个租约,一个租约下面挂载了多个文件,也就是说一个客户端操作多个文件租约还是同一个。 +- 内部线程周期调度检查是否超出硬限制,如果超过硬限制,则将该租约下的所有文件都执行租约恢复,恢复的执行者为HDFS_NameNode。 +