一致性Hash | suisbuds

分布式缓存映射算法

传统hash取模

实现分布式系统的负载均衡, e.g. idx := ihash(kv.Key) % nReduce
node_number = hash(key) % N # 其中 N 为节点数。

问题在于，当系统出现故障或是扩容导致集群节点数量N变化，映射规则的变化将造成分布式缓存系统之前的缓存失效，引发缓存雪崩

一致性hash算法

优点

可扩展：新增或删除节点，数据存储改动很小，不会影响系统
负载均衡：hash值平均分配到nodes
当部分虚拟节点含大量数据时，通过虚拟节点分裂，而不是重新hash，从而避免数据在虚拟节点分布不均衡

流程

将对象和虚拟服务器放到hash环
顺时针查找对象hash值距离最近的服务器，并让服务器缓存该对象
节点变化时，只有少部分对象需要重新分配服务器缓存
引入虚拟节点映射实际服务器，解决负载不均衡问题

缓存映射

增加节点

减少节点

引入虚拟节点

一致性hash实现


// 采取依赖注入，可将crc32算法替换为自定义hash算法
type Hash func(data []byte) uint32

type Map struct {
	hash     Hash           // hash算法
	replicas int            // 虚拟节点倍数
	keys     []int          // hash环
	hashMap  map[int]string // 映射表，key是虚拟节点的hash值，value是真实节点名称
}

func New(replicas int, fn Hash) *Map {
	m := &Map{
		replicas: replicas,
		hash:     fn,
		hashMap:  make(map[int]string),
	}
	if m.hash == nil {
		m.hash = crc32.ChecksumIEEE
	}
	return m
}

func (m *Map) Add(keys ...string) {
	// 对每一个真实节点创建replicas个虚拟节点,名称：strconv.Itoa(i)+key
	for _, key := range keys {
		for i := 0; i < m.replicas; i++ {
			// 计算虚拟节点hash并添加到环
			hash := int(m.hash([]byte(strconv.Itoa(i) + key)))
			m.keys = append(m.keys, hash)
			// 建立映射关系
			m.hashMap[hash] = key
		}
	}
	// 环上hash排序
	sort.Ints(m.keys)
}

func (m *Map) Get(key string) string {
	if len(key) == 0 {
		return ""
	}
	// 计算key的hash值,并找到虚拟节点映射的hash（因为是环，采用取余算法）
	hash := int(m.hash([]byte(key)))
	index := sort.Search(len(m.keys), func(i int) bool {
		return m.keys[i] >= hash
	})
	// 映射得真实节点
	return m.hashMap[m.keys[index%len(m.keys)]]
}

cover
id: 107066422
画师：异sj绘