多条件筛选重复记录
这是我给网友的问题做的例子,有点新,发上来供参考
问题:
有一个ACCESS数据库,库中的基本结构如下表
地区编码(Rid) 姓名(name 性别(sex) 年龄(age) 登记日期(date) 登记编码
11010206 张三 男 12 2009-11-2 R10
11010206 李四 男 15 2009-10-2 R11
11010206 王五 女 19 2007-08-07 A98
11010206 赵六 女 78 1999-1-3 C11
11010207 刘八 男 22 1970-1-4 S11
11010207 赵四 女 45 1970-5-5 S12
要进行数据库的查重操作(计算机初步筛选可以重复,再人工复查),要把重复记录用一个sql筛选出来,重复记录的定义为:
地区编码相同 并且 姓名相同(姓名相同定义为姓名完全一样或相差一个字)并且 性别、登记编码、年龄、登记时间这些变量中任2个相同(年龄相差10岁、登记时间相差6个月就认为相同);
(1)地区编码相同这个条件是必须的;
(2)姓名的条件也是必须成立的!
(3)第三个条件是:性别、登记编码、年龄、登记日期中两个及两个以上条件成立,才筛选出来;
条件1 条件2 和条件3 是“和”的关系,只有条件1 和条件2成立时,不要筛选出来,只有条件1、2、3同时成立时才筛选出来。
举个例子:
下面这两条记录,乡镇编码相同 且 姓名相同(差一个字认为相同) 且 性别和年龄相同 (年龄差三岁)
地区编码(Rid) 姓名(name) 性别(sex) 年龄(age) 登记日期(date) 登记编码
11010206 张三 男 12 2009-11-2 R10
11010206 张三丰 男 15 2002-10-2 R11
点击下载此附件