HashMap工作原理

最近参与公司的实习生招聘工作,面试了几位实习生,我有一道每次面试都必问的题目【HasmMap的工作原理】,但很遗憾,至今还没遇到令我完全满意的回答。今天这篇文章就来回答下HashMap相关的面试题。

1. 什么是HashMap?

java.util.HashMap是Java语言标准库中的一个容器类,主要用来存储键值对。是数据结构中哈希表在Java语言的一个实现。

哈希表是数据结构中的一个概念,可以存储n个元素,取元素的时间复杂度为O(1).

一般情况下,从n个元素中查找一个元素,时间复杂度为O(n). 为何哈希表能有O(1)的时间复杂度?

因为元素在存储时已经大致确定了位置,查找的时候可以定位到对应的位置,因此时间复杂度为O(1).

2. HashMap中的数据结构

HashMap使用数组+链表的方式实现。

数组的作用主要是定位元素位置。

链表的作用是解决哈希冲突问题。遇到hash值相等的key,就把相应键值使用链表的方式全部保存下来。

3. put操作

put方法定义

public V put(K key, V value)

put操作执行过程:

a. 计算key的hashcode

b. 根据hashcode计算出需要将该键值对存储的位置-即桶的位置

c. 找到桶的位置后,如果桶未被占用,则存入该键值对;若桶中已有数据,则需要遍历桶中数据,并且比较key的equals方法。遇到key相同的,则用新的value,把旧值替换掉(put操作会将旧值覆盖掉)。若没找到,则将该键值对存储在链表的末尾。

4. get操作

get方法定义

public V get(Object key)

get操作执行过程:

a. 计算key的hashcode

b. 根据hashcode,定位该元素所在桶的位置

c. 若桶为空,则返回null;若桶不空,则遍历桶中数据,比较key的equals方法,若遇到相同的元素,则返回对于的value中;没遇到,则返回null

5. 什么样的类型可以作为HashMap的key?

a. 重写hashCode() 和 equals() 方法

HashMap在get/put数据时,需要调用hashCode() 和 equals() 方法,因此只有重写了hashCode() 和 equals() 方法的类,才可以作为HashMap的key。

(hashCode相同,对象不一定相等;对象相等,则hashCode必然相同)

b. 不可变性

不可变性也是必要的,若元素可变,则相应hashCode也会发生变化,调用get()方法时,可能找不到相应的value,甚至可能找到错误的value。

6. 如何计算数组下标

在JDK1.8之前的版本中,是通过key的hashCode()进行hashing,然后将( n-1 & hash)来确定数组下标,即桶的位置。

在JDK1.8版本,将hash值的高16位与低16位进行异或

JDK 1.8:

(h = key.hashCode()) ^ (h >>>16)

这样做的目的主要是为了减少哈希冲突的可能性。特别是数据量较小时,旧的计算方式哈希冲突的可能比较大。

7. HashMap的两个重要概念

容量(Capacity),即HashMap中数组的大小,也是桶的个数

负载因子(load factor),也成装载因子 = hashmap中实际保存键值对个数 / hashmap中数组的大小

随着HashMap中元素个数的增多,负载因子增大。如果不做额外的处理,则桶中的链表会越来越长,因此HashMap就无法保证取元素时O(1)的时间复杂度。因此,必须要调整HashMap中数组的大小

HashMap中定义的默认负载因子大小为0.75,当负载因子大于该值时,将对数组进行扩容

8. HashMap其他面试题

HashMap与HashTable区别:Hashtable中加入了锁,线程安全;HashMap线程不安全。也正因为Hashtable中加入了锁,导致性能上要差于HashMap。

ConcurrentHashMap:HashMap、Hashtable在性能和安全性上的一个折中方案。实现原理是ConcurrentHashMap中将Map划分为多个子Map,子Map分别加锁。对一个子Map加锁以后,不影响对其他子Map的访问。

9. 为什么要面试这道题目

a. 考察求职者技术水平.

我一把把这道题目作为第一道面试题来考察求职者。根据回答情况,能大致推测到求职者的水平,方便后续的面试。

零级水平:完全不知道。(当然,这种可能性很少。毕竟HashMap是非常常用的一个工具类)

一级水平:可以回答HashMap的时间复杂度,容量,装载因子等概念

二级水平:回答出get/put操作的完整过程。(多数求职者都没能完整的回答这个问题。能完全回答出这个问题,说明求职者对哈希的思想有完整的理解,而且很可能阅读过HashMap的源码 - 要想写好代码,首先要阅读优秀源代码的习惯)

三级水平:回答出hashCode,equals作用,不可变性,线程安全的Map(基本上满足公司实习生的要求,可以发offer了)

b. 考察求职者表达能力

能够把一件复杂的事情讲的清晰易懂,是件了不起的能力。(笔者在这方面能力有所欠佳)


注:

HashMap中其实允许null作为key,因为在get/put操作时都会对null值做特殊的处理。

本文主要是从哈希表的角度来讲述HashMap,因此这些细节问题并未涉及。