mysql中EXISTS与IN用法比较

1、使用方式：（1）EXISTS用法select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b where a.projectId = b.id)上面这条SQL的意思就是：以ucsc_project_batch为主表查询batchName...

槐月十九

52527人浏览 · 2018-08-28 15:59:42

槐月十九 · 2018-08-28 15:59:42 发布

1、使用方式：

（1）EXISTS用法

select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b where a.projectId = b.id)

上面这条SQL的意思就是：以ucsc_project_batch为主表查询batchName与projectId字段，其中projectId字段存在于ucsc_project表中。

EXISTS 会对外表ucsc_project_batch进行循环查询匹配，它不在乎后面的内表子查询的返回值是什么，只在乎有没有存在返回值，存在返回值，则条件为真，该条数据匹配成功，加入查询结果集中；如果没有返回值，条件为假，丢弃该条数据。

例如我们这里改变一下子查询的查询返回字段，并不影响外查询的查询结果：

select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.companyId,b.name from ucsc_project b where a.projectId = b.id)

（2）IN用法

select a.batchName,a.projectId from ucsc_project_batch a where a.projectId in (select b.id from ucsc_project b)

上面这条SQL的查询结果与刚才的EXISTS的结果一样，查询的意思也一样。

2、注意点：

（1）EXISTS写法需要注意子查询中的条件语句一般需要带上外查询的表做关联，不然子查询的条件可能会一直为真，或者一直为假，外查询的表进行循环匹配的时候，要么全部都查询出来，要么一条也没有。

select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b)

比如上述这种写法，由于ucsc_project 表存在值，子查询的条件一直为真，ucsc_project_batch 每条数据进行循环匹配的时候，都能匹配成功，查询出来的结果就成为了ucsc_project_batch整张表数据。

select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b where b.id is null)

这种写法，子查询肯定查不到结果，所以子查询的条件为假，外查询的每条数据匹配失败，整个查询结果为空

（2）IN语句在mysql中没有参数个数的限制，但是mysql中SQL语句有长度大小限制，整段最大为4M

（3）EXISTS的子查询语句不在乎查询的是什么，只在乎有没有结果集存在，存在则整个子查询可以看作一个条件为真的语句，不然就是一个条件为假的语句

（4）IN语句对于子查询的返回字段只能由一个，不然会报错：

select a.batchName,a.projectId from ucsc_project_batch a where a.projectId in (select b.id,b.companyId from ucsc_project b)

[Err] 1241 - Operand should contain 1 column(s)

3、场景选择

外查询表大，子查询表小，选择IN；外查询表小，子查询表大，选择EXISTS；若两表差不多大，则差不多。

（1）IN中的SQL查询只会查询一次，然后把结果集存在临时文件中，然后再与外层查询sql进行匹配，其中外查询与子查询都可以使用索引

select a.batchName,a.projectId from ucsc_project_batch a where a.projectId in (select b.id from ucsc_project b)

等价于：

$result = [];
$ucsc_project_batch = "select a.batchName,a.projectId from ucsc_project_batch a";
$ucsc_project  = "select b.id from ucsc_project b";
for($i = 0;$i < $ucsc_project_batch .length;$i++){
    for($j = 0;$j < $ucsc_project .length;$j++){
        if($ucsc_project_batch [$i].projectId== $ucsc_project [$j].id){
            $result[] = $ucsc_project_batch [$i];
            break;
        }
    }
}

（2）EXISTS会对外查询的表ucsc_project_batch 进行循环匹配，执行ucsc_project_batch.length次，其中子查询可以使用索引，外查询全表扫描

select a.batchName,a.projectId from ucsc_project_batch a where EXISTS (select b.id from ucsc_project b where a.projectId = b.id)

等价于：

$result = [];
$ucsc_project_batch = "select a.batchName,a.projectId from ucsc_project_batch a ";
for ($i = 0; $i < $ucsc_project_batch . length; $i++) {
    if (exists($ucsc_project_batch [$i] . projectId)) {//执行select b.id from ucsc_project b where a.projectId=b.id                               
        $result[] = $ucsc_project_batch [$i];
    }
}

通过两个的伪代码分析可知：子查询的表大的时候，使用EXISTS可以有效减少总的循环次数来提升速度；当外查询的表大的时候，使用IN可以有效减少对外查询表循环遍历来提升速度。