MySQL Compares Different Data Between Two Tables

前言

在数据迁移中或者处理数据中，我们经常需要比较两个表，以便在一个表中标识另一个表中没有相应记录的记录。

例如，我们有一个新的数据库，其架构与旧数据库不同。我们的任务是将所有数据从旧数据库迁移到新数据库，并验证数据是否正确迁移。

要检查数据，我们必须比较两个表，一个在新数据库中，一个在旧数据库中，并标识不匹配的记录。

环境

系统环境

Distributor ID:	Deepin
Description:	Deepin 20 Beta
Release:	20 Beta
Codename:	n/a
Linux version :     5.3.0-3-amd64 (debian-kernel@lists.debian.org)
Gcc version:        8.3.0 (Debian 8.3.0-6)

软件信息

version : 	
     mysql  Ver 8.0.20 for Linux on x86_64 (MySQL Community Server - GPL)

正文

假设有两个表：table1和table2。使用以下步骤比较两个表，并确定不匹配的记录。

原理

首先，使用UNION语句来组合两个表中的行; 仅包含需要比较的列。返回的结果集用于比较。

SELECT table1.pk, table1.c1
FROM table1
UNION ALL
SELECT table2.pk, table2.c1
FROM table2

第二步，根据需要比较的主键和列分组记录。如果需要比较的列中的值相同，则COUNT(*)返回2，否则COUNT(*)返回1。

请参阅以下查询：

SELECT pk, c1
FROM
 (
   SELECT table1.pk, table1.c1
   FROM table1
   UNION ALL
   SELECT table2.pk, table2.c1
   FROM table2
)  t
GROUP BY pk, c1
HAVING COUNT(*) = 1
ORDER BY pk

如果比较中涉及的列中的值相同，则不返回任何行。

看不懂上面的原理没有关系，请接下来看下下面的例子：

例子

首先，创建具有相似结构的2个表：

use test;
CREATE TABLE table1(
 idd int auto_increment primary key,
    name varchar(255) 
);

CREATE TABLE table2(
 idd int auto_increment primary key,
    name varchar(255),
    note varchar(255)
);

其次，在table1和table2表中插入一些数据：

INSERT INTO table1(name)
VALUES('row 1'),('row 2'),('row 3');

INSERT INTO table2(name,note)
SELECT name, 'data migration'
FROM table1;

查看

mysql> select * from table1;
+----+-------+
| idd | name |
+----+-------+
|  1 | row 1 |
|  2 | row 2 |
|  3 | row 3 |
+----+-------+
3 rows in set (0.00 sec)

mysql> select * from table2;
+----+-------+----------------+
| idd | name | note           |
+----+-------+----------------+
|  1 | row 1 | data migration |
|  2 | row 2 | data migration |
|  3 | row 3 | data migration |
+----+-------+----------------+
3 rows in set (0.00 sec)

第三，比较两个表的idd和name列的值：

SELECT idd,name
FROM (
    SELECT idd, name FROM table1
    UNION ALL
    SELECT idd,name FROM table2
) tbl
GROUP BY idd, name
HAVING count(*) = 1
ORDER BY idd;

结果：

Empty set (0.01 sec)

没有行返回，因为没有不匹配的记录。

第四，在table2表中插入一行：

INSERT INTO table2(name,note)
VALUES('4 row new ','new');

第五步，执行查询以再次比较两个表中的name列的值。新行是不匹配的行将会返回。

SELECT idd,name
FROM (
    SELECT idd, name FROM table1
    UNION ALL
    SELECT idd,name FROM table2
) tbl
GROUP BY idd, name
HAVING count(*) = 1
ORDER BY idd;

结果

+----+-----------+
| idd | name     |
+----+-----------+
|  4 | 4 row new |
+----+-----------+
1 row in set (0.00 sec)

在本教程中，您已经学习了如何根据特定列比较两个表以找到不匹配的记录。

"MySQL比较两个表之间的不同数据"

前言

环境

系统环境

软件信息

正文

原理

例子

后记

CATALOG

FEATURED TAGS

FRIENDS