一、LRU Cache
1.1 什么是LRU Cache
LRU是Least Recently Used的缩写,意思是最近最少使用,它是一种Cache替换算法。 什么是Cache?狭义的Cache指的是位于CPU和主存间的快速RAM, 通常它不像系统主存那样使用
DRAM技术,而使用昂贵但较快速的SRAM技术。 广义上的Cache指的是位于速度相差较大的两种
硬件之间, 用于协调两者数据传输速度差异的结构。除了CPU与主存之间有Cache, 内存与硬盘
之间也有Cache,乃至在硬盘与网络之间也有某种意义上的Cache── 称为Internet临时文件夹或网络内容缓存等。
1.2 LRU Cache的设计思路
Cache的容量有限,因此当Cache的容量用完后,而又有新的内容需要添加进来时, 就需要挑选并舍弃原有的部分内容,从而腾出空间来放新内容。LRU Cache 的替换原则就是将最近最少使用的内容替换掉。其实,LRU译成最久未使用会更形象, 因为该算法每次替换掉的就是一段时间内最久没有使用过的内容。
我们通过一道OJ题来引入:
问题的关键就是底层要如何设计才能达到get和put都达到O(1)的时间复杂度??
实现LRU Cache的方法和思路很多,但是要保持高效实现O(1)的put和get,那么使用双向链表和哈希表的搭配是最高效和经典的。使用双向链表是因为双向链表可以实现任意位置O(1)的插入和删除,使用哈希表是因为哈希表的增删查改也是O(1)。
那么用双向带头链表,我们可以让链表的尾部的数据充当最近最少使用的,而平时的新增以及更新都放到链表头部去。但是这样还会存在一个问题就是,我们要插入是O(1),但是我们要将使用过的节点更新后放到头部的时候,我们没有办法直接O(1)找到需要挪动的节点,需要去遍历获取,那么复杂度就是O(N)了
所以破局点就在于如果快速找到key对应的节点在list中的存储位置。
平时我们想要快速找到一个元素在数组中的位置,我们会去存储元素(K)和数组下标(V)的映射关系,但是现在存储数据的不是数组而是链表,那么我们想要知道他的对应数据的位置,我们就可以在哈希表中存迭代器!!然后key对应的value只存在list中
二、LRU Cache的模拟实现
2.1 底层结构的设计
template<class K,class V>
class LRUCache
{
public:
private:
typedef typename list<pair<K,V>>::iterator iterator;//迭代器 方便我们快速在链表找到这个节点 取模版的内嵌类型要加typename
unordered_map<K, iterator> _hashMap;//哈希 存k以及对应的迭代器 做到查找和更新是O(1)
list<pair<K,V>> _LRUList;//list去存value
size_t _capacity;
};
哈希表中存的是key和list的迭代器。
2.2 默认构造
LRUCache(size_t capacity=10) //默认开10个
:_capacity(capacity)
{}
2.3 get
//看看能否找到这个数据 找到就返回他对应的value
V get(const K& key)
{
auto ret = _hashMap.find(key);
if (ret != _hashMap.end()) //如果找到了 就返回对应关键字对应的value
{
iterator it = ret->second;//拿到对应的迭代器
//因为被使用过了,所以将迭代器放到最前面去
//方案1:erase一下,但是迭代器会失效,所以需要更新一下然后放到最前面去
// int value=it->second;
// _LRUList.push_front(make_pair(key, value));
//_LRUList.erase(it);
//_hashMap[key] = _LRUList.begin();//换了个迭代器,所以要更新一下
//return value;//第一个second拿到迭代器,第二个second拿到的是value
//方案2:转移过去void splice (const_iterator position, list& x, const_iterator i);
_LRUList.splice(_LRUList.begin(), _LRUList, it); //被转移的位置 被转移的对象 想转移的迭代器
return it->second;//第一个second拿到迭代器,第二个second拿到的是value
}
else return V();//没找到,返回默认构造
}
splice 可以将节点转移到指定位置的前面
如果不用这个函数,那就先删掉然后再继续在头部造一个。
2.4 put
//如果没有,就是新增,放到头结点的位置 但是如果满了,要先删除最后一个 然后再头插
//如果有,就是更新,快速找到对应的位置,然后更新之后放到前面去
void put(const K& key, const V& value)
{
auto ret = _hashMap.find(key);
if (ret == _hashMap.end()) //没有->新增 满了要先删 没满就直接加
{
if (_capacity == _hashMap.size()) //不用链表的size是因为有的链表的遍历可能是O(N)
{
//删除一下尾节点
pair<K,V> back = _LRUList.back();
_LRUList.pop_back();
_hashMap.erase(back.first);//删除再哈希中的元素
}
//进行头插
_LRUList.push_front(make_pair(key, value));
_hashMap[key] = _LRUList.begin();
}
//这个时候就是更新
else
{
iterator it = ret->second;//拿到迭代器
it->second = value;//更新一下
//刚用过,所以迭代器往前移
_LRUList.splice(_LRUList.begin(), _LRUList, it);
}
}
如果没找到了就是新增->要先判断容量是否满了,如果满了要先删掉尾部的数据,以及对应位置在哈希表中的数据,然后再将新增的头插进去。
如果找到了就是更新(我们用哈希存迭代器的作用就体现出来了),我们可以通过哈希快速找到对应的迭代器,然后把他转移到前面去!!!
2.5 打印观察
直接遍历一下链表中的kv结构就可以判断我们LRUlist是否完成我们的要求
void Print()//打印LRU的情况 方便观察
{
for (auto& e : _LRUList) //e拿到的是pair类型
cout << "(" << e.first << "," << e.second << ")->";
cout << "nullptr" << endl;
}
2.6 测试代码
void test1()
{
LRUCache<string, string> L(5);
L.put("sort", "排序");
L.put("quick", "快速");
L.put("left", "左边");
L.put("right", "右边");
L.Print();
cout << L.get("sort")<<endl;//1,验证是否可以拿到对应的元素 2,拿到之后是否移到了最前面
cout << L.get("happy") << endl;
L.Print();
L.put("left", "(左边)");//验证更新
L.Print();
L.put("hello", "你好");
L.put("thank", "谢谢");
L.Print();
}
2.7 整体代码的实现
#pragma once
#include<iostream>
#include<list>
#include<unordered_map>
#include<string>
using namespace std;
//LRU Cache 最近最少使用缓存要被淘汰掉
//cache 一般用于速度不相同的两个介质之间(缓存) cpu 内存 磁盘
//局部性原理 我用了当前那块,可能我马上就要用相邻的那块
//put和get都必须是O(1) ->哈希表
//但是LRU Cache的精髓是选取最近最少用的 那么我们可以用一个链表 那么尾部的默认就是最近最少用的
//get的时候 如有有就返回,同时因为用过了,所以要将这个用过的放到最前面去。
//put有两种情况,一种是需要先看看关键字有没有,如果有的话就更新一下,然后放到头部去 如果没有的话,要看看是否满了,满了就得先删最后一个元素 然后将新的元素插入到头部去
template<class K,class V>
class LRUCache
{
public:
LRUCache(size_t capacity=10) //默认开10个
:_capacity(capacity)
{}
//看看能否找到这个数据 找到就返回他对应的value
V get(const K& key)
{
auto ret = _hashMap.find(key);
if (ret != _hashMap.end()) //如果找到了 就返回对应关键字对应的value
{
iterator it = ret->second;//拿到对应的迭代器
//因为被使用过了,所以将迭代器放到最前面去
//方案1:erase一下,但是迭代器会失效,所以需要更新一下然后放到最前面去
// int value=it->second;
// _LRUList.push_front(make_pair(key, value));
//_LRUList.erase(it);
//_hashMap[key] = _LRUList.begin();//换了个迭代器,所以要更新一下
//return value;//第一个second拿到迭代器,第二个second拿到的是value
//方案2:转移过去void splice (const_iterator position, list& x, const_iterator i);
_LRUList.splice(_LRUList.begin(), _LRUList, it); //被转移的位置 被转移的对象 想转移的迭代器
return it->second;//第一个second拿到迭代器,第二个second拿到的是value
}
else return V();//没找到,返回默认构造
}
//如果没有,就是新增,放到头结点的位置 但是如果满了,要先删除最后一个 然后再头插
//如果有,就是更新,快速找到对应的位置,然后更新之后放到前面去
void put(const K& key, const V& value)
{
auto ret = _hashMap.find(key);
if (ret == _hashMap.end()) //没有->新增 满了要先删 没满就直接加
{
if (_capacity == _hashMap.size()) //不用链表的size是因为有的链表的遍历可能是O(N)
{
//删除一下尾节点
pair<K,V> back = _LRUList.back();
_LRUList.pop_back();
_hashMap.erase(back.first);//删除再哈希中的元素
}
//进行头插
_LRUList.push_front(make_pair(key, value));
_hashMap[key] = _LRUList.begin();
}
//这个时候就是更新
else
{
iterator it = ret->second;//拿到迭代器
it->second = value;//更新一下
//刚用过,所以迭代器往前移
_LRUList.splice(_LRUList.begin(), _LRUList, it);
}
}
void Print()//打印LRU的情况 方便观察
{
for (auto& e : _LRUList) //e拿到的是pair类型
cout << "(" << e.first << "," << e.second << ")->";
cout << "nullptr" << endl;
}
private:
typedef typename list<pair<K,V>>::iterator iterator;//迭代器 方便我们快速在链表找到这个节点 取模版的内嵌类型要加typename
unordered_map<K, iterator> _hashMap;//哈希 存k以及对应的迭代器 做到查找和更新是O(1)
list<pair<K,V>> _LRUList;//list去存value
size_t _capacity;
};
void test1()
{
LRUCache<string, string> L(5);
L.put("sort", "排序");
L.put("quick", "快速");
L.put("left", "左边");
L.put("right", "右边");
L.Print();
cout << L.get("sort")<<endl;//1,验证是否可以拿到对应的元素 2,拿到之后是否移到了最前面
cout << L.get("happy") << endl;
L.Print();
L.put("left", "(左边)");//验证更新
L.Print();
L.put("hello", "你好");
L.put("thank", "谢谢");
L.Print();
}
原文链接:https://blog.csdn.net/weixin_51142926/article/details/138825447
此处评论已关闭