前言
在数据迁移中或者处理数据中,我们经常需要比较两个表,以便在一个表中标识另一个表中没有相应记录的记录。
例如,我们有一个新的数据库,其架构与旧数据库不同。我们的任务是将所有数据从旧数据库迁移到新数据库,并验证数据是否正确迁移。
要检查数据,我们必须比较两个表,一个在新数据库中,一个在旧数据库中,并标识不匹配的记录。
环境
系统环境
Distributor ID: Deepin
Description: Deepin 20 Beta
Release: 20 Beta
Codename: n/a
Linux version : 5.3.0-3-amd64 (debian-kernel@lists.debian.org)
Gcc version: 8.3.0 (Debian 8.3.0-6)
软件信息
version :
mysql Ver 8.0.20 for Linux on x86_64 (MySQL Community Server - GPL)
正文
假设有两个表:table1
和table2
。使用以下步骤比较两个表,并确定不匹配的记录。
原理
首先,使用UNION语句来组合两个表中的行; 仅包含需要比较的列。返回的结果集用于比较。
SELECT table1.pk, table1.c1
FROM table1
UNION ALL
SELECT table2.pk, table2.c1
FROM table2
第二步,根据需要比较的主键和列分组记录。如果需要比较的列中的值相同,则COUNT(*)
返回2
,否则COUNT(*)
返回1
。
请参阅以下查询:
SELECT pk, c1
FROM
(
SELECT table1.pk, table1.c1
FROM table1
UNION ALL
SELECT table2.pk, table2.c1
FROM table2
) t
GROUP BY pk, c1
HAVING COUNT(*) = 1
ORDER BY pk
如果比较中涉及的列中的值相同,则不返回任何行。
看不懂上面的原理没有关系,请接下来看下下面的例子:
例子
首先,创建具有相似结构的2
个表:
use test;
CREATE TABLE table1(
idd int auto_increment primary key,
name varchar(255)
);
CREATE TABLE table2(
idd int auto_increment primary key,
name varchar(255),
note varchar(255)
);
其次,在table1
和table2
表中插入一些数据:
INSERT INTO table1(name)
VALUES('row 1'),('row 2'),('row 3');
INSERT INTO table2(name,note)
SELECT name, 'data migration'
FROM table1;
查看
mysql> select * from table1;
+----+-------+
| idd | name |
+----+-------+
| 1 | row 1 |
| 2 | row 2 |
| 3 | row 3 |
+----+-------+
3 rows in set (0.00 sec)
mysql> select * from table2;
+----+-------+----------------+
| idd | name | note |
+----+-------+----------------+
| 1 | row 1 | data migration |
| 2 | row 2 | data migration |
| 3 | row 3 | data migration |
+----+-------+----------------+
3 rows in set (0.00 sec)
第三,比较两个表的idd
和name
列的值:
SELECT idd,name
FROM (
SELECT idd, name FROM table1
UNION ALL
SELECT idd,name FROM table2
) tbl
GROUP BY idd, name
HAVING count(*) = 1
ORDER BY idd;
结果:
Empty set (0.01 sec)
没有行返回,因为没有不匹配的记录。
第四,在table2表中插入一行:
INSERT INTO table2(name,note)
VALUES('4 row new ','new');
第五步,执行查询以再次比较两个表中的name列的值。新行是不匹配的行将会返回。
SELECT idd,name
FROM (
SELECT idd, name FROM table1
UNION ALL
SELECT idd,name FROM table2
) tbl
GROUP BY idd, name
HAVING count(*) = 1
ORDER BY idd;
结果
+----+-----------+
| idd | name |
+----+-----------+
| 4 | 4 row new |
+----+-----------+
1 row in set (0.00 sec)
在本教程中,您已经学习了如何根据特定列比较两个表以找到不匹配的记录。