北京 | 上海 | 天津 | 重庆 | 广州 | 深圳 | 珠海 | 汕头 | 佛山 | 中山 | 东莞 | 南京 | 苏州 | 无锡 | 常州 | 南通 | 扬州 | 徐州 | 杭州 | 温州 | 宁波 | 台州 | 福州 | 厦门 | 泉州 | 龙岩 | 合肥 | 芜湖 | 成都 | 遂宁 | 长沙 | 株洲 | 湘潭 | 武汉 | 南昌 | 济南 | 青岛 | 烟台 | 潍坊 | 淄博 | 济宁 | 太原 | 郑州 | 石家庄 | 保定 | 唐山 | 西安 | 大连 | 沈阳 | 长春 | 昆明 | 兰州 | 哈尔滨 | 佳木斯 | 南宁 | 桂林 | 海口 | 贵阳 | 西宁 | 乌鲁木齐 | 包头 |
我有多个表,其中存在一对多的关系,甚至多对多的关系,在进行多表查询时,会出现很多重复记录,我目前常用的方法是GROUP BY或者FIRST等,但我的表有海量数据,用这些方法就非常慢,我记得之前一个朋友告诉过我一个方法,可以忽略重复记录,而且速度很快,但我忘记了,有谁知道吗?
比如:
张三 男 喜欢吃青菜
张三 男 喜欢吃牛肉
张三 男 喜欢吃羊肉
李四 女 喜欢吃青菜
张三 男 喜欢吃米饭
李四 女 喜欢吃馒头
我需要得到的结果:
张三 男 喜欢吃牛肉(喜欢吃什么,随便取哪条记录)
李四 女 喜欢吃馒头(喜欢吃什么,随便取哪条记录)
或者,得到下面的结果也行:
张三 男
李四 女
关键是要速度,GROUP BY ,FIRST,LAST等方法我都试过了。我的表有几千万,几亿条记录。