JS专题之数组去重

栏目: JavaScript · 发布时间: 6年前

内容简介：数组去重在日常开发中的使用频率还是较高的，也是网上随便一抓一大把的话题，所以，我写这篇文章目的在于归纳和总结，既然很多人都在提的数组去重，自己到底了解多少呢。又或者是如果自己在开发中遇到了去重的需求，自己能想到更好的解决方案吗。这次我们来理一理怎么做数组去重才能做得最合适，既要考虑兼容性，也要考虑性能和代码的优雅。我的学习路径是模仿冴羽(github: mqyqingfeng)的学习方式，感谢像冴羽这样优秀的人在前面领跑，我不想光看不做，所以多实践多输出，希望未来能走出我自己的路。

前言

数组去重在日常开发中的使用频率还是较高的，也是网上随便一抓一大把的话题，所以，我写这篇文章目的在于归纳和总结，既然很多人都在提的数组去重，自己到底了解多少呢。又或者是如果自己在开发中遇到了去重的需求，自己能想到更好的解决方案吗。

这次我们来理一理怎么做数组去重才能做得最合适，既要考虑兼容性，也要考虑性能和代码的优雅。

我的学习路径是模仿冴羽(github: mqyqingfeng)的学习方式，感谢像冴羽这样优秀的人在前面领跑，我不想光看不做，所以多实践多输出，希望未来能走出我自己的路。

一、入门方案

function unique(origin) {
    var result = [];
    for(var i = 0; i < origin.length; i++) {
        var arrayItem = origin[i];

        for(var j= 0; j< result.length; j++) {
            var resultItem = result[j];
            
            // 如果在结果数组循环中找到了该元素，则跳出循环，进入下一个源数组元素的判断
            if(resultItem === arrayItem) {
                break;
            }
        }
        
        // 如果把结果数组循环完都没有找到该元素，就将该元素压入结果数组中
        if(j === result.length) {
            result.push(arrayItem);
        }
    }
    return result;
}

var array = ['a', 'b', 'c', '1', 0, 'c', 1, '', 1, 0];
console.log(unique(array));  // ["a", "b", "c", "1", 0, 1, ""]

以上代码是最简单实现数组去重的方式，优点在于兼容性极好，缺点就是两次 for 循环，时间复杂度为 O(n^2)，性能较差。

二、数组的 indexOf 属性

数组中的 indexOf 属性是 ES5 的规范，只有 IE8 及更早版本不支持该方法。相对来说，如果你不需要兼容 IE8 的话，尽量用 indexOf 来判断一个元素是否在数组中。

function unique(origin){
    var result = [];
    for(var i = 0; i< origin.length; i++) {
        var item = origin[i];
        if(result.indexOf(item) === -1) {
            result.push(item);
        }
    }
    return result;
}

三、数组的 filter 属性

数组的 filter() 方法创建一个新的数组，新数组中的元素是通过检查指定数组中符合条件的所有元素。

filter 的回调有三个参数，其中第三个参数是当前元素属于的数组对象，这样我们可以继续利用 indexOf 属性啦。

function unique(origin) {
    var result = origin.filter(function (item, index, array){
        // 获取元素在源数组的位置，只返回那些索引等于当前元素索引的值。
        return array.indexOf(item) === index;
    });
    return result;
}

filter 兼容到 IE9, 这种方法没有 for 循环，主要利用了 filter 和 indexOf 属性，所以代码相对比较优雅。

四、利用 Object 的 key value

function unique(origin) {
    var result = [];
    var hashTable = {};
    for(var i = 0; i< origin.length; i++) {
        // 如果键对应的值，为真，意味着对象的键中已经有重复的键了。
        if(!hashTable[origin[i]]) {
        // 将元素作为对象的键，默认键对应的值为 true, 
            hashTable[origin[i]] = true;
            
            // 如果对象中没有这个键，则将这个元素放入结果数组中去。
            result.push(origin[i]);
        }
    }
    return result;
}

这种方案的事件复杂度为 O(n), 但是对象的键，默认是字符串类型，这意味着什么呢，数字 1 和字符串 '1'，在键中是相等的，所以，上面这种方法不适合字符串和数字混合的去重。

所以我们将元素的类型也放入对象的键中：

function unique(origin) {
    var result = [];
    var hashTable = {};
    for(var i = 0; i< origin.length; i++) {
        var current = origin[i];
        // 字符串拼接元素的类型和元素
        var key = typeof(current) + current;
        if(!hashTable[key]) {
            hashTable[key] = true;
            result.push(current);
        }
    }
    return result;
}

五、数组的 sort 方法

function unique(origin) {
    return origin.concat.sort().filter(function(item, index, array) {
        // !index 表示第 0 个元素应该被返回。
        return !index || item !== origin[index-1]
    })
}

function unique(array) {
    array.sort(); // 排序字符串
    array.sort(function(a, b) {
        return a-b; // 排序数字
    })
    
    for(let i=0; i<array.length; i++) {
        if(array[i] === array[i+1]) {
            array.splice(i, 1);
            i--; // 应该将前一个数删除，而不是删除后一个数。是因为元素被删除之后，后面元素的索引会迁移，所以要 i--;
        }
    }
    return array;
}

sort 方法的优点在于利用了排序，返回后一个和前一个不相等的元素。比较简洁和直观。缺点在于改变了元素的本来的排序位置。

六、ES6 Set

ES6 提供了新的数据结构 Set,它类似于数组，但是成员的值都是唯一的，没有重复的值。向 Set 加入值的时候，不会发生类型转变，所以 5 和 '5' 是两个不同的值。Set内部判断两个值是否相同，用的是类似于 "==="的算法，但是区别是，在set内部认为NaN 等于 NaN ；

Set 可以转换为数组，所以很容易实现去重

function unique(origin) {
    return Array.from(new Set(origin));
}

七、ES6 Map

ES6 新增了 Map 数据结果，通过 has 和 set 方法就能很方便的对前面的 object key value 方案进行优化。

function unique(origin){
    const map = new Map()
    return origin.filter((item) => !map.has(item) && map.set(item, true))
}

八、类型判断

一些常见的数据类型是 === 和 indexOf 是无法检测的，举个例子：

console.log({} === {})  // false;

console.log(NaN === NaN)  // false;

console.log(/a/ === /a/);  // false;

console.log(1 === new String('1'))  // false;

var arr = [NaN];
console.log(arr.indexOf(NaN)); // -1

所以在判断的时候，如果数据里有 NaN 和对象时要避免使用 indexOf 和 === ;

前面 Set 那里说过了，所以 Set 方法是可以去重 NaN的。

总结

数据去重在网上已经看烦了，但还是想专门写一篇文章来实践和总结，能在工作中多几个思路也是极好的。感谢那些热爱分享和喜欢输出的人。

欢迎关注我的个人公众号“谢南波”，专注分享原创文章。

JS专题之数组去重

掘金专栏 JavaScript 系列文章

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

颠覆医疗

[美]埃里克·托普 / 张南、魏薇、何雨师 / 译言·东西文库／电子工业出版社 / 2014-1-20 / 55.00

“创造性破坏”是奥地利经济学家约瑟夫·熊彼特最著名的理论，当一个产业在革新之时，都需要大规模地淘汰旧的技术与生产体系，并建立起新的生产体系。电器之于火器、汽车之于马车、个人计算机之于照排系统，都是一次又一次的“创造性破坏”，旧的体系完全不复存在，新的体系随之取代。 “创造性破坏”已经深深地改变了我们的生活，在这个数字时代，我们身边的一切都被“数字化”了。只有一处，也许是由于其本身的根深蒂固，......一起来看看《颠覆医疗》这本书的介绍吧!

码农工具

JS专题之数组去重

前言

一、入门方案

二、数组的 indexOf 属性

三、数组的 filter 属性

四、利用 Object 的 key value

五、数组的 sort 方法

六、ES6 Set

七、ES6 Map

八、类型判断

总结

掘金专栏 JavaScript 系列文章

颠覆医疗

XML、JSON 在线转换

HEX CMYK 转换工具

HSV CMYK 转换工具