我应该在Memcache中存储数组还是单个项目?

问题描述

| 现在,我们正在Memcache上存储一些查询结果。经过更多调查后,我发现许多人将每个单独的项目保存在Memcache中。这样做的好处是,他们可以在任何其他请求下从Memcache获取这些项目。 存储数组
$key = \'page.items.20\';
if( !( $results = $memcache->get($key) ) )
{
    $results = $con->execute(\'SELECT * FROM table LEFT JOIN .... LIMIT 0,20\')->fetchAll();
    $memcache->save($results,$key,3600);
}
...
优点: 更轻松 缺点: 如果我更改单个项目,则必须删除所有缓存(这可能很麻烦) 我可以得到重复的结果(在不同的查询中使用相同的项目) 与 存放每件物品
$key = \'page.items.20\';
if( !( $results_ids = $memcache->get($key) ) )
{
    $results = $con->execute(\'SELECT * FROM table LEFT JOIN .... LIMIT 0,20\')->fetchAll();

    $results_ids = array();
    foreach ( $results as $result )
    {
        $results_ids[] = $result[\'id\'];
        // if doesn\'t exist,save individual item
        $memcache->add($result,\'item\'.$result[\'id\'],3600);
    }

    // save results_ids 
    $memcache->save($results_ids,3600);
}
else
{
    $results = $memcache->multi_get($results_ids);
    // get elements which are not cached
    ...
}
... 
优点: 我没有在Memcache上两次存储相同的项目 更容易使几个查询的结果无效(只是我们更改的项目) 缺点: 更复杂的业务逻辑。 你怎么看?每种方式还有其他优点或缺点吗? 一些链接 发布说明Memcached列表中的第二种方法 Memcached组中的线程     

解决方法

        获取统计信息并尝试计算点击率或可能的改进(如果您缓存完整的查询而不是在MC中抓取单个项目)。对此类代码进行概要分析对于实际了解您的理论如何应用也很有帮助。 这取决于查询的作用。如果您有一组用户,然后想与其中一些朋友争夺“十大音乐亲和力”,那么两个缓存都值得: -每个朋友(实际上是网站的每个用户) -每个用户的前10个查询(空间比CPU时间便宜) 但是总的来说,值得在MC中存储所有经常使用的实体(在同一代码执行中,在随后的请求中或在其他用户的使用中)。然后,诸如CPU或资源密集型查询和数据处理之类的事情要么由MC-them要么委托它们进行异步处理。作业而不是实时进行(例如,排名前10位的网站用户不需要实时进行,可以每小时或每天进行更新)。 当然要考虑到,如果您存储和MC单个实体,则必须从数据库中删除所有参照完整性,以便能够单独或成组地重复使用它们。     ,        这个问题是主观和争论的。 这取决于您的使用模式。如果您不断按ID拉取各个节点,请分别存储每个节点。 另外,请注意,无论哪种情况,除了前20个列表之外,存储列表都无济于事。如果以前20个不再有效的方式插入/更新/删除节点,则可能会结束最多需要冲洗下20个,依此类推。 最后,请记住,这是一个缓存。如果您使用的是高速缓存,那么您将做出以下基本声明:如果您要输出的数据有些陈旧,则没什么大不了的。     ,        内存缓存将数据存储在特定大小的块中,如下面的链接中所述。 http://code.google.com/p/memcached/wiki/NewUserInternals 如果您在memcached中的数据分布较大,则较大大小的块的数量将减少,因此,即使其他块大小的可用空间不足,最近使用最少的算法也会将数据推出。最近最少使用的算法适用于各个块。 您可以根据memcached中的数据大小分布来决定选择哪种实现。