컴퓨터/이론: 개발
HashMap 동작원리 및 충돌해결
heepie
2020. 7. 15. 23:19
도입
이번 포스팅에서는 HashMap의 동작원리와 Hash 충돌해결에 대해 정리할 예정이다.
개념
HashMap은 Key-Value가 1:1로 맵핑되는 자료구조이다. 맵핑으로 인해 삽입, 삭제, 검색이 평균적으로 O(1)인 자료구조이다.
원리
Key는 Object를 지원하기 때문에 완전한 해시 함수(perfect hash functions)가 아니다.
(hashCode() 결과 자료형은 int ∴32비트 정수 자료형으로 2의 32승까지 표현 가능, 그러나 Object는 더 많은 경우의 수 포함)
아래와 같이 hashing으로 hash값 가공
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
// http://hg.openjdk.java.net/jdk8/jdk8/jdk/file/687fd7c7986d/src/share/classes/java/util/HashMap.java#l336
∴ HashKey 충돌 가능성 존재
이를 해결하기 위해 내부적으로 Node 2차원 배열 table 존재
transient Node<K,V>[] table;
// http://hg.openjdk.java.net/jdk8/jdk8/jdk/file/687fd7c7986d/src/share/classes/java/util/HashMap.java#l395
충돌 시, Seperate Chainning 방법으로 현재 Value의 다음 Value를 연결하는 방식으로 해결
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null); // 새로운 Node 생성해 연결
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
// http://hg.openjdk.java.net/jdk8/jdk8/jdk/file/687fd7c7986d/src/share/classes/java/util/HashMap.java#l641
그럼에도 불구하고 최악의 경우는 O(n)이 될 수 있다.
do {
if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
// http://hg.openjdk.java.net/jdk8/jdk8/jdk/file/687fd7c7986d/src/share/classes/java/util/HashMap.java#l580
#HashMap #면접