【数据结构】回顾散列表

1.散列表(hash table)的实现成为散列(hashing),是一种以常数平均时间执行输入、删除和查找的技术。但是那些需要元素间任何排序信息的数操作将不会得到有效的支持

2.散列函数示例

int hash(const string & key,int tableSize)
{
    int hashVal=0;
    for(int i=0;i<key.length();i++)
        hashVal=37*hashVal+key[i];
    hashVal %= tableSize;
    if(hashVal<0)
        hashVal+=tableSize;
    return hashVal;

3.散列表是由键值对来提供动力的,因此如果在值相同而键不同的情况下就会发生冲突。那么解决冲突的办法,有一种叫做分离链接法(separate chaining),它将散列到同一个值得所有元素都保留到一个链表中。

分离链接散列表的类构架:

template <typename Hashedobj>
class HashTable
{
public:
    explicit HashTable(int size=101);
    bool contains(const Hashedobj & x) const;

    void makeEmpty();
    void insert(const Hashedobj & x);
    void remove(const Hashedobj & x);

private:
    vector<list<Hashedobj>> theLists;
    int currentSize;

    void rehash();
    int myhash(const Hashedobj & x) const;
};

int hash(const string & key);
int hash(int key);
int myhash(const Hashedobj & x) const
{
    int hashVal=hash(x);
    hashVal %= theLists.size();
    if(hashVal<0)
        hashVal+=theLists.size();
    return hashVal;
}

4.分离链接散列表的insert函数

bool insert(const Hashedobj & x)
{
    list<Hashedobj> & whichList=theLists[myhash(x)];
    if(find(whichList.begin(),whichList.end(),x)!=whichList.end())
        return false;
    whichList.push_back(x);

    if(++currentSize>theLists.size())
        rehash();
    return true;
}

5.分离链接散列表算法的缺点是使用了一些链表,由于给新单元分配地址需要时间,因此这就导致算法的速度有些减慢,同时算法实际上还要求第二种数据结构的实现。因此探测散列表就应运而生。它又包含了3种探测方式。

线性探测

平方探测

双散列

6.如果散列表已经不足以来存放你的数据,那么可以考虑使用可扩散列(extendible hashing)。

7.对于分散链接散列法,虽然装填因子不大时性能并不明显降低,但装填因子还是应该接近于1.对于探测散列,除非完全不可避免,否则装填因子不应该超过0.5.如果用线性探测,那么性能随着装填因子接近于1而急速下降。再扩散运算可以通过使表增长和收缩来保持合理的装填因子。


感谢您的访问,希望对您有所帮助。

欢迎大家关注或收藏、评论或点赞。

为使本文得到斧正和提问,转载请注明出处:
http://blog.csdn.net/nomasp

相关文章

【啊哈!算法】算法3:最常用的排序——快速排序       ...
匿名组 这里可能用到几个不同的分组构造。通过括号内围绕的正...
选择排序:从数组的起始位置处开始,把第一个元素与数组中其...
public struct Pqitem { public int priority; ...
在编写正则表达式的时候,经常会向要向正则表达式添加数量型...
来自:http://blog.csdn.net/morewindows/article/details/6...