更多奇怪的MySQL行为-查询优化帮助

问题描述

|| 我们有一个中央登录名,用于支持多个网站。为了存储用户的数据,我们有一个“ 0”表来存储每个用户帐户,然后是每个站点的“ 1”表以获取特定于站点的信息。我们还有一个简单的“ 2”表来存储用户间的连接。 我们注意到,一个将表连接到主键“ 3”上的查询正在缓慢执行。我希望那里的一些sql专家可以解释为什么它使用
WHERE
搜索users_site1表并建议我们如何对其进行优化。这是缓慢的查询和解释结果:
MysqL> explain select a.username,a.first_name,a.last_name,a.organization_name,a.organization,a.city,a.state,a.zip,a.country,a.profile_photo,a.facebook_id,a.twitter_id,u.reviews from accounts a join users_site1 u ON a.user_id=u.user_id where a.user_id IN (select cid2 from connections where cid1=10001006 AND type=\"MM\" AND status=\"A\") OR a.user_id IN (select cid1 from connections where cid2=10001006 AND type=\"MM\" AND status=\"A\") order by RAND() LIMIT 4;
+----+--------------------+-------------+--------+-------------------+---------+---------+-----------------------+-------+----------------------------------------------+
| id | select_type        | table       | type   | possible_keys     | key     | key_len | ref                   | rows  | Extra                                        |
+----+--------------------+-------------+--------+-------------------+---------+---------+-----------------------+-------+----------------------------------------------+
|  1 | PRIMARY            | u           | ALL    | PRIMARY           | NULL    | NULL    | NULL                  | 79783 | Using where; Using temporary; Using filesort |
|  1 | PRIMARY            | a           | eq_ref | PRIMARY           | PRIMARY | 4       | exampledb.u.user_id |     1 |                                              |
|  3 | DEPENDENT SUBQUERY | connections | ref    | PRIMARY,cid1,cid2 | cid2    | 6       | const,const           |     2 | Using where                                  |
|  2 | DEPENDENT SUBQUERY | connections | ref    | PRIMARY,cid2 | cid1    | 6       | const,const           |     1 | Using where                                  |
+----+--------------------+-------------+--------+-------------------+---------+---------+-----------------------+-------+----------------------------------------------+
4 rows in set (0.00 sec)
这是每个表的定义:
CREATE TABLE `accounts` (
  `user_id` int(9) unsigned NOT NULL AUTO_INCREMENT,`username` varchar(40) DEFAULT NULL,`facebook_id` bigint(15) unsigned DEFAULT NULL,`facebook_username` varchar(30) DEFAULT NULL,`password` varchar(20) DEFAULT NULL,`profile_photo` varchar(100) DEFAULT NULL,`first_name` varchar(40) DEFAULT NULL,`middle_name` varchar(40) DEFAULT NULL,`last_name` varchar(40) DEFAULT NULL,`suffix_name` char(3) DEFAULT NULL,`organization_name` varchar(100) DEFAULT NULL,`organization` tinyint(1) unsigned DEFAULT NULL,`address` varchar(200) DEFAULT NULL,`city` varchar(40) DEFAULT NULL,`state` varchar(20) DEFAULT NULL,`zip` varchar(10) DEFAULT NULL,`province` varchar(40) DEFAULT NULL,`country` int(3) DEFAULT NULL,`latitude` decimal(11,7) DEFAULT NULL,`longitude` decimal(12,`phone` varchar(20) DEFAULT NULL,`sex` char(1) DEFAULT NULL,`birthday` date DEFAULT NULL,`about_me` varchar(2000) DEFAULT NULL,`activities` varchar(300) DEFAULT NULL,`website` varchar(100) DEFAULT NULL,`email` varchar(150) DEFAULT NULL,`referrer` int(4) unsigned DEFAULT NULL,`referredid` int(9) unsigned DEFAULT NULL,`verify` int(6) DEFAULT NULL,`status` char(1) DEFAULT \'R\',`created` datetime DEFAULT NULL,`verified` datetime DEFAULT NULL,`activated` datetime DEFAULT NULL,`network` datetime DEFAULT NULL,`deleted` datetime DEFAULT NULL,`logins` int(6) unsigned DEFAULT \'0\',`api_logins` int(6) unsigned DEFAULT \'0\',`last_login` datetime DEFAULT NULL,`last_update` datetime DEFAULT NULL,`private` tinyint(1) unsigned DEFAULT NULL,`ip` varchar(20) DEFAULT NULL,PRIMARY KEY (`user_id`),UNIQUE KEY `username` (`username`),KEY `facebook_id` (`facebook_id`),KEY `status` (`status`),KEY `state` (`state`)
);

CREATE TABLE `users_site1` (
  `user_id` int(9) unsigned NOT NULL,`facebook_publish` tinyint(1) unsigned DEFAULT NULL,`facebook_checkin` tinyint(1) unsigned DEFAULT NULL,`facebook_offline` varchar(300) DEFAULT NULL,`twitter_id` varchar(60) DEFAULT NULL,`twitter_secret` varchar(50) DEFAULT NULL,`twitter_username` varchar(20) DEFAULT NULL,`type` char(1) DEFAULT \'M\',`session` varchar(60) DEFAULT NULL,`api_session` varchar(60) DEFAULT NULL,PRIMARY KEY (`user_id`)
);

CREATE TABLE `connections` (
  `cid1` int(9) unsigned NOT NULL DEFAULT \'0\',`cid2` int(9) unsigned NOT NULL DEFAULT \'0\',`cid3` int(9) unsigned NOT NULL DEFAULT \'0\',`type` char(2) NOT NULL,`status` char(1) NOT NULL,`updated` datetime DEFAULT NULL,PRIMARY KEY (`cid1`,`cid2`,`type`,`cid3`),KEY `cid1` (`cid1`,`type`),KEY `cid2` (`cid2`,`type`)
);
    

解决方法

而不是“ 7”,您应该使用另一个联接:
select 
a.username,a.first_name,a.last_name,a.organization_name,a.organization,a.city,a.state,a.zip,a.country,a.profile_photo,a.facebook_id,a.twitter_id,u.reviews 
from accounts a 
join users_site1 u ON a.user_id=u.user_id 
join ( select cid2 as id from connections 
       where cid1=10001006 AND type=\"MM\" AND status=\"A\"
       union
       select cid1 as id from connections
       where cid2=10001006 AND type=\"MM\" AND status=\"A\" ) c
on a.user_id = c.id
order by RAND() LIMIT 4;
    ,您是否尝试删除
order by RAND()
并再次运行? 我的结果如下:
+----+--------------------+-------------+----------------+-------------------+---------+---------+------------------+------+----------------------------------------------+
| id | select_type        | table       | type           | possible_keys     | key     | key_len | ref              | rows | Extra                                        |
+----+--------------------+-------------+----------------+-------------------+---------+---------+------------------+------+----------------------------------------------+
|  1 | PRIMARY            | a           | ALL            | PRIMARY           | NULL    | NULL    | NULL             | 2    | Using where; Using temporary; Using filesort |
|  1 | PRIMARY            | u           | ALL            | PRIMARY           | NULL    | NULL    | NULL             | 2    | Using where; Using join buffer               |
|  3 | DEPENDENT SUBQUERY | connections | index_subquery | PRIMARY,cid1,cid2 | PRIMARY | 14      | func,const,const | 1    | Using where                                  |
|  2 | DEPENDENT SUBQUERY | connections | ref            | PRIMARY,cid2 | PRIMARY | 14      | const,func,const | 1    | Using where                                  |
+----+--------------------+-------------+----------------+-------------------+---------+---------+------------------+------+----------------------------------------------+
    ,无论如何,我都不是MySQL专家,但我多次参与了高性能应用程序的优化,尽管我更多地是在优化过程的实现端,而不是寻找需要优化的东西。 我看到的第一个问题是子查询似乎有效,但是使用where子句运行第一个查询的方式:... where a.user_id IN(选择cid2 ...)或a.user_id IN(从..中选择cid1)。 。)在我非常谦逊的观点中是表现杀手。 我会尝试优化性能的第一件事,请考虑尝试合并分解,将您的请求拆分为2个甚至3个查询。代码不太漂亮,但是数据库将能够更有效地工作。在一个查询中完成所有操作会更好,这是一个神话。 这能给你带来什么?缓存将更有效,如果使用MyISam表,则当查询中的表较少时,锁定策略更为有效,并且可以减少冗余的行访问。如果您可以从using where得到您的主要查询(如果分解则将是最后一个查询);使用临时;使用文件排序,您将获得更快的响应。 使用SHOW SESSION STATUS和FLUSH状态来分析您尝试的不同选项,也可以通过在查询中添加SQL_NO_CACHE来禁用缓存以获得对您尝试的不同选项的真实比较,即SELSECT SQL_NO_CACHE a.username ...等。 分析和测量结果是确定性能提升的唯一方法。不幸的是,这一步骤经常被忽略。 祝好运!