20162325 2017-2018-2 《程序设计与数据结构》第11周学习总结

教材关键概念摘要


在哈希方法中,元素保存在哈希表中,其在表中的位置由哈希函数确定。

两个元素或关键字映射到表中同一个位置的情形,称为冲突。

将每个元素映射到表中唯一位置的哈希函数称为理想哈希函数。

抽取仅适用元素值或关键字中的一部分来计算保存元素的位置。

在移位折叠方法中,将关键字的各部分加在一起计算下标。

将字符串中各字符按二进制格式进行处理,长度依赖方法和平方取中方法也适用于字符串。

虽然Java为所有的对象提供了hashcode方法,最好还是为特定的类定义一个具体的哈希函数。

处理冲突的链式方法,将哈希表看成是集合的表而不是各独立单元的表。

处理冲突的开放地址方法,即在表中寻找不同于该元素 初次哈希到的另一个开放的位置。

装载因子是哈希表扩展之前,表中允许的最大占有百分比。

哈希方法


HashCode是返回对象的哈希码。跟HashMap和Hashtable没多大关系。

HashTable是方法是同步的,HashMap不是。

HashMap中可以存在一条key或value为空的记录,Hashtable不可以。

HashTable继承自Dictionary,HashMap继承自Map接口。

HashCode

在Java中,哈希码代表对象的特征。

  例如对象 String str1 = “aa”, str1.hashCode= 3104

  String str2 = “bb”, str2.hashCode= 3106

  String str3 = “aa”, str3.hashCode= 3104

  根据HashCode由此可得出str1!=str2,str1==str3

  哈希码产生的依据:哈希码并不是完全唯一的,它是一种算法,让同一个类的对象按照自己不同的特征尽量的有不同的哈希码,但不表示不同的对象哈希码完全不同。也有相同的情况,看程序员如何写哈希码的算法。

  下面给出几个常用的哈希码的算法。

  1:Object类的hashCode.返回对象的内存地址经过处理后的结构,由于每个对象的内存地址都不一样,所以哈希码也不一样。

  2:String类的hashCode.根据String类包含的字符串的内容,根据一种特殊算法返回哈希码,只要字符串内容相同,返回的哈希码也相同。

  3:Integer类,返回的哈希码就是Integer对象里所包含的那个整数的数值,例如Integer i1=new Integer(100),i1.hashCode的值就是100 。由此可见,2个一样大小的Integer对象,返回的哈希码也一样。

类 HashMap<K,V>

 java.lang.Object
java.util.AbstractMap<K,V>
java.util.HashMap<K,V>

类型参数:

K - 此映射所维护的键的类型

V - 所映射值的类型

基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和null 键。(除了非同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。

HashCode和HashMap之间的关系

import java.util.HashMap;
public class Test { //重写Equals不重写HashCode
static class Key {
private Integer id;
private String value; public Key(Integer id, String value) {
super();
this.id = id;
this.value = value;
}
@Override
public boolean equals(Object o) {
if(o == null || !(o instanceof Key)) {
return false;
}else {
return this.id.equals(((Key)o).id);
}
}
}
//重写Equals也重写HashCode
static class Key_ {
private Integer id;
private String value; public Key_(Integer id, String value) {
super();
this.id = id;
this.value = value;
}
@Override
public boolean equals(Object o) {
if(o == null || !(o instanceof Key_)) {
return false;
}else {
return this.id.equals(((Key_)o).id);
}
}
@Override
public int hashCode() {
return id.hashCode();
} }
public static void main(String[] args) {
//test hashcode
HashMap<Object, String> values = new HashMap<Object, String>(5);
Test.Key key1 = new Test.Key(1, "one");
Test.Key key2 = new Test.Key(1, "one");
System.out.println(key1.equals(key2));
values.put(key1, "value 1");
System.out.println(values.get(key2)); Test.Key_ key_1 = new Test.Key_(1, "one");
Test.Key_ key_2 = new Test.Key_(1, "one");
System.out.println(key_1.equals(key_2));
System.out.println(key_1 == key_2);
values.put(key_1, "value 1");
System.out.println(values.get(key_2));
}
}

由上述例子可见:

只重写了equasl方法的Key类 在用做Hash中的键值的时候 两个equasl为true的对象不能获取相应 的Value的

而重写了hashCode方法和equals方法的key_类 两个相等的对象 可以获取同一个Value的,这样更符合生活中 的逻辑

HashMap对象是根据Key的hashCode来获取对应的Vlaue 因而两个HashCode相同的对象可以获取同一个Value

哈希函数


  • 实际中的Hash函数是指把一个大范围映射到一个小范围。把大范围映射到一个小范围的目的往往是为了节省空间,使得数据容易保存。除此以外,Hash函数往往应用于查找上。所以,在考虑使用Hash函数之前,需要明白它的几个限制:
  1. Hash的主要原理就是把大范围映射到小范围;所以,你输入的实际值的个数必须和小范围相当或者比它更小。不然冲突就会很多。
  2. 由于Hash逼近单向函数;所以,你可以用它来对数据进行加密。
  3. 不同的应用对Hash函数有着不同的要求;比如,用于加密的Hash函数主要考虑它和单项函数的差距,而用于查找的Hash函数主要考虑它映射到小范围的冲突率。
  • Hash函数应用的主要对象是数组(比如,字符串),而其目标一般是一个int类型。以下我们都按照这种方式来说明。

一般的说,Hash函数可以简单的划分为如下几类:

  1. 加法Hash;
  2. 位运算Hash;
  3. 乘法Hash;
  4. 除法Hash;
  5. 查表Hash;
  6. 混合Hash;

解决冲突


  

常用的解决hash冲突的方法

开放地址法

拉链法(链地址法)

多重散列法(再哈希法)

公共溢出区法

具体参见【java基础 10】hash算法冲突解决方法 - CSDN博客

从哈希表中删除元素


List

public class Demo {

    public static void main(String[] args) {
List<Object> obj = new ArrayList<Object>();
obj.add("a");
obj.add("b");
obj.add("c");
System.out.println("移除前:" + obj.toString());
Iterator<Object> it = obj.iterator();
for(int i=0; i<obj.size(); i++){
System.out.println(i);
Object name = it.next();
if("a".equals(name) || "b".equals(name)){
it.remove();
i--;
}
}
System.out.println("移除后: " + obj.toString()); }

Set

public class Demo {

    public static void main(String[] args) {
Set<Object> obj = new HashSet<Object>();
obj.add("a");
obj.add("b");
obj.add("c");
System.out.println("移除前:" + obj.toString());
Iterator<Object> it = obj.iterator();
for(int i=0; i<obj.size(); i++){
System.out.println(i);
Object name = it.next();
if("a".equals(name) || "b".equals(name)){
it.remove();
i--;
}
}
System.out.println("移除后: " + obj.toString()); }

API中的哈希表


  • 比较常用的有

    HashtableHashMapHashSetHashCode

教材学习中的问题和解决过程


  • 问题1:课堂测试题

七点不同

第一,继承的父类不同。

第二,线程安全性不同。

第三,是否提供contains方法第四,key和value是否允许null值。

第五,两个遍历方式的内部实现上不同。

第六,hash值不同。

第七,内部实现使用的数组初始化和扩容方式不同。

代码调试中的问题和解决过程


  • 问题1:JDK中有些方法、类被划了横杠

  • 解答:

代码托管


上周考试错题总结


  • 活动尚未结束

本周结对学习情况


  • 20162311
  • 结对学习内容

    - 如何画AOE网,求关键路径

其他(感悟、思考等,可选)


  • 这周的班级活动和口语考试占用了部分时间,再加上还有团队任务,时间上就很紧张,又是熬夜才完成的博客……然而明天还有当天截止的实验四,感觉有点吃不消。

学习进度条


代码行数(新增/累积) 博客量(新增/累积) 学习时间(新增/累积) 重要成长
目标 5000行 30篇 400小时
第一周 58/ 1/1 10/10
第二周 8/18
第三周 134/ 3/4 12/ 30
第四周 2/6 12/42
第五&六周 750/ 6595 5/11 24/66
第七周 764/7068 7/13 18/84
第八周 888/7956 9/15 20/104
第九周 475/8431 12/18 22/126
第十周 1429/9860 16/22 24/150
第十一周 977/10837 19/25 48/198
  • 计划学习时间: 23小时

  • 实际学习时间: 24小时

  • 改进情况:多思考,多总结

参考资料


最新文章

  1. sobel算子的一些细节
  2. js cookie存储方法
  3. 成为JavaGC专家(1)—深入浅出Java垃圾回收机制
  4. vim 图解常用快捷键操作
  5. tp 多语言支持
  6. Dialog样式
  7. Spring分布式事务实现
  8. 走向DBA[MSSQL篇] - 从SQL语句的角度提高数据库的访问性能(转)
  9. 【Linux安全】chattr命令锁定账户敏感文件
  10. [Angular 2] Using a Reducer to Change an Object&#39;s Property Inside an Array
  11. OpenStack安装部署管理中常见问题解决方法
  12. Opengl坐标转换
  13. PAT 个位数统计
  14. String Match
  15. UVA1203 Argus
  16. 路由器DHCP服务及DHCP中继
  17. Java - 28 Java 泛型
  18. 通过cgroup给docker的CPU和内存资源做限制
  19. REQUEST FORM 实例
  20. python-day47--mysql数据备份与恢复

热门文章

  1. oracle数据类型表
  2. 【C++】数组-整数从大到小排序
  3. 金蝶K3WISE常用数据表
  4. 使用IDEA进行打包
  5. Go 命令行总结
  6. ubuntu 安装chrome 和chromedriver
  7. CSDN博客专家申请成功
  8. JS中给函数参数添加默认值
  9. GitHub在线创建文件夹
  10. Owin 自定义中间件