字符串哈希算法(以ELFHash详解)

 

更多字符串哈希算法请参考:http://blog.csdn.net/AlburtHoffman/article/details/19641123

先来了解一下何为哈希:

哈希表是根据设定的哈希函数H(key)和处理冲突方法将一组关键字映射到一个有限的地址区间上,并以关键字在地址区间中的象作为记录在表中的存储位置,这种表称为哈希表或散列,所得存储位置称为哈希地址或散列地址。作为线性数据结构与表格和队列等相比,哈希表无疑是查找速度比较快的一种。
通过将单向数学函数(有时称为“哈希算法”)应用到任意数量的数据所得到的固定大小的结果。如果输入数据中有变化,则哈希也会发生变化。哈希可用于许多操作,包括身份验证和数字签名。也称为“消息摘要”。
 
简单解释:哈希(Hash)算法,即散列函数。它是一种单向密码体制,即它是一个从明文到密文的不可逆的映射,只有加密过程,没有解密过程。同时,哈希函数可以将任意长度的输入经过变化以后得到固定长度的输出。哈希函数的这种单向特征和输出数据长度固定的特征使得它可以生成消息或者数据。
 
个人心得:哈希就是用进行函数映射,用key对应此时的值,然后对这个值进行查询时直接对key的地址进行查看就好了,思想简单,用起来真的复杂。我们还是简单学一下ELFHash吧
// ELF Hash Function
2 unsigned int ELFHash(char *str)
3 {
4 unsigned int hash = 0;
5 unsigned int x = 0;
6
7 while (*str)
8 {
9 hash = (hash << 4) + (*str++);//hash左移4位,把当前字符ASCII存入hash低四位。
10 if ((x = hash & 0xF0000000L) != 0)
11 {
12 //如果最高的四位不为0,则说明字符多余7个,现在正在存第7个字符,如果不处理,再加下一个字符时,第一个字符会被移出,因此要有如下处理。
13 //该处理,如果最高位为0,就会仅仅影响5-8位,否则会影响5-31位,因为C语言使用的算数移位
14 //因为1-4位刚刚存储了新加入到字符,所以不能>>28
15 hash ^= (x >> 24);
16 //上面这行代码并不会对X有影响,本身X和hash的高4位相同,下面这行代码&~即对28-31(高4位)位清零。
17 hash &= ~x;
18 }
19 }
20 //返回一个符号位为0的数,即丢弃最高位,以免函数外产生影响。(我们可以考虑,如果只有字符,符号位不可能为负)
21 return (hash & 0x7FFFFFFF);
22 }

然后用一个例题实践一下吧吧,hdu1800

#include <bits/stdc++.h>
using namespace std; typedef unsigned int ui;
const int N = 7003, MOD = 7003;
int Hash[N], num[N];
int res;
int ELFhash(char *str)//思想就是一直杂糅,使字符之间互相影响
{
ui h = 0, g;
while(*str)
{
h = (h<<4) + *str++; //h左移4位,当前字符占8位,加到h中进行杂糅
if((g = h & 0xf0000000) != 0) //取h最左四位的值,若均为0,则括号中执行与否没区别,故不执行
{
h ^= g>>24; //用h的最左四位的值对h的右起5~8进行杂糅
h &= ~g;//清空h的最左四位
}
}
return h; //因为每次都清空了最左四位,最后结果最多也就是28位二进制整数,不会超int
}
void hash_table(char *str)
{
int k = ELFhash(str);
int t = k % MOD;
while(Hash[t] != k && Hash[t] != -1) t = (t + 1) % MOD;//开放地址法处理hash
if(Hash[t] == -1) num[t] = 1, Hash[t] = k;
else res = max(res, ++num[t]);
}
int main()
{
int n;
char str[100];
while(~ scanf("%d", &n))
{
getchar();
res = 1;
memset(Hash, -1, sizeof Hash);
for(int i = 1; i <= n; i++)
{
scanf("%s", str);
int j = 0;
while(str[j] == '0') j++;
hash_table(str + j);
}
printf("%d\n", res);
}
return 0;
}

最新文章

  1. IIS 出现如下错误:PageHandlerFactory-Integrated”
  2. Python文档
  3. WeakHashMap和HashMap的区别
  4. Linux配置邮箱发送(MUTT/MSMTPQ)
  5. AngularJS:实现动态添加输入控件功能(转)
  6. 解决浮层弹出如何加上datepicker,并且浮动在上面
  7. MVC小系列(十三)【全局异常处理与异常日志】
  8. 在tornado中使用celery实现异步任务处理之中的一个
  9. [Unity Shader]Shader前述
  10. Web Mining and Big Data 公开课学习笔记 ---lecture0
  11. 快速高效实现微信小程序图片上传与腾讯免费5G存储空间的使用
  12. 298. Binary Tree Longest Consecutive Sequence最长连续序列
  13. Java学习笔记之——if条件语句和三目运算符
  14. 单细胞文献分析 Quantitative single-cell rna-seq with unique molecular identifers
  15. kotlin 安装 使用
  16. 2 python介绍
  17. easyui------dialog如何固定位置
  18. URL的三类编码格式(JavaScript实现)
  19. MVC中重定向几种方法
  20. 12.php中无比坑爹的构造函数。

热门文章

  1. js中有哪几种函数?
  2. Java的Properties类使用
  3. bluemix部署(一)简单测试,搭建样本flask程序。
  4. 2.10 C++利用构造函数限制对象的创建
  5. js 变量的声明能提升 初始化不会提升
  6. 《深入分析Java Web技术内幕》读书笔记 - 第1章 深入Web请求过程
  7. connection reset 分析解决(转载)
  8. xampp 忘记密码的处理方式.
  9. selenium 自动化安装火狐谷歌插件
  10. 微信公众号开发遇到simplexml_load_string 未定义