JavaScript系列--八种【数组去重】方法的总结

栏目: JavaScript · 发布时间: 6年前

内容简介：数组去重是一个老生常谈的问题，但是有时候会弹出点其他东西。这个方法是最常见的，最原始的方法。思路：双层循环方法，使用的是循环嵌套，外层是arr，里层是res，如果arr[i]的值等于res[j]的值，则跳出当前循环，如果都不等于，说明元素唯一，这时候j的值等于res的长度，根据这个判断，将值添加res中。

一、前言

数组去重是一个老生常谈的问题，但是有时候会弹出点其他东西。

二、双重循环

这个方法是最常见的，最原始的方法。

// 方法一：双重循环
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    // res 存结果
    var res = [];
    for(var i = 0, length = arr.length; i < length; i++){
        for(var j = 0, length2 = res.length; j < length2; j++){
            if(arr[i] === res[j]){
                break;
            }
        }
        if(j == length2){
            res.push(arr[i])
        }
    }
    return res;
}

unique(array);  //[1, "1", "2", 2]

思路：双层循环方法，使用的是循环嵌套，外层是arr，里层是res，如果arr[i]的值等于res[j]的值，则跳出当前循环，如果都不等于，说明元素唯一，这时候j的值等于res的长度，根据这个判断，将值添加res中。

优点：兼容性好

缺点：时间复杂度o(n2)

三、indexOf方法

思路：使用indexOf简化内层循环。

// 方法二：indexOf简化内层循环
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    // res 存结果
    var res = [];
    for(var i = 0, length = arr.length; i < length; i++){
       var current = arr[i];
       if(res.indexOf(current) === -1){
           res.push(current);
       }
    }
    return res;
}

unique(array);   //[1, "1", "2", 2]

优点：时间复杂度降低

缺点：有的浏览器不支持indexOf方法，时间复杂度o(n2)

四、排序后去重

思路：使用快排sort将数组排序，这样相同的值会被排在一起，只需要判断当前元素与上一个元素是否相同，相同说明重复，不同就添加进res中。

// 方法三：排序后去重
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    // res 存结果
    var res = [];
    var sortedArray = arr.concat().sort();
    console.log(sortedArray, '-=-=-=-=-=-=')
    var current;
    for(var i = 0, length = sortedArray.length; i < length; i++){
        // 如果是第一个元素 或者是相邻元素不相同
       if(!i || current !== sortedArray[i]){
           res.push(sortedArray[i]);
       }
       current = sortedArray[i];
    }
    return res;
}

unique(array);   //[1, "1", 1, "2", 2]

优点：已经排好序的数组去重，这种方法效率高于使用 indexOf，时间复杂度o(n)

缺点：已经修改数组的顺序，同时存在去重不彻底

注意：sort函数默认排序是 Unicode，srot方法默认可是能给字母实现排序。突然发现了sort在排序的时候存在一个隐式转换，会把要排序的对象转换成字符串，sort排序的时候1和'1'是相同的，然后根据unicode比较大小，所以出现了[1, "1", 1, "2", 2]这种情况。

注意：数组进行了 array.concat()操作之后，其实是复制出来一份原有的数组，复制出来的新数组不会影响到原有数组。

五、使用ES5的filter

思路：使用filter简化外层循环

1、使用indexOf简化内层循环

// 方法四：filter + indexOf
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    // res 存结果
    var res = arr.filter(function(item, index, arr){
        return arr.indexOf(item) === index;
    })
    return res;
}

unique(array);   //[1, "1", "2", 2]

2、排序去重的方法

// 方法四：filter + sort
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    // res 存结果
    var res = arr.concat().sort().filter(function(item, index, arr){
        return !index ||  item !==arr[index -1]
    })
    return res;
}

unique(array);   //[1, "1", 1, "2", 2]

上面已经讲到了sort排序时候存在一个隐式转换。

优点：很简洁，思维也比较巧妙，直观易懂，使用filter简化外层循环

缺点：不支持 IE9 以下的浏览器，时间复杂度o(n*2)

六、Object键值对的问题

思路：利用一个空的Object对象，把数组的值存成Object的key，比如就是Object[value] = true;循环判断的时候，如果Object[value]存在，说明这个值重复了。

// 方法五：Object键值对
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    // obj 存对象
    var obj= {};
    var res = arr.filter(function(item, index, arr){
        if(obj.hasOwnProperty(item)) return false;
        else {
            return obj[item] = true;
        }
    })
    return res;
}

unique(array);   //[1, "2"]

然后我们发现1和'1'是不同的，但是这种方法会判断为是同一个值，因为键值对中只能是字符串，会进行一个隐式转换。和sort排序时候的转换是一样的，可以通过typeof item+ item，拼成字符串作为key的值避免这个问题

// 优化
function unique(arr){
    // obj 存对象
    var obj= {};
    var res = arr.filter(function(item, index, arr){
        if(obj.hasOwnProperty(typeof item + item)) return false;
        else {
            return obj[typeof item + item] = true;
        }
    })
    return res;
}

unique(array);   //[1, "1", "2", 2]

优点：hasOwnProperty是对象的属性存在性检查方法。对象的属性可以基于hash表实现，因此对属性的方法的时间复杂度达到O(1)；filter是数组迭代的方法，内部是一个for循环，复杂度O(n)。总的时间复杂度O(n)。

缺点：不兼容IE9以下浏览器

七、reduce高阶函数

includes() 方法用来判断一个数组是否包含一个指定的值，根据情况，如果包含则返回 true，否则返回false。

// 方法六：reduce高阶函数
var array = [1,1,'1','2','1',1,2]
function unique(arr){
    let newArr = arr.reduce((pre,cur)=>{
        if(!pre.includes(cur)){
            return pre.concat(cur)
        }else{
            return pre
        }
    },[]);
    return newArr;
}
console.log(unique(array));// [1, "1", "2", 2]

优点：高阶函数的高级用法。

缺点：兼容性问题，对象数组不能使用includes方法来检测。includes区分大小写

八、ES6的Set数据结构

只能说ES6标准越来越好，可以使用Set数据结构，ES6中提供了set数据结构，类似于数组，成员值都是唯一的，没有重复的。

// 方法七：ES6的set
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    return Array.from(new Set(arr));
}

unique(array);   //[1, "1", "2", 2]

还可以用扩展运算符...

// 优化
var array = [1,1,'1','2','1',1,2]

function unique(arr){
    return  [...new Set(arr)];
}

unique(array);   //[1, "1", "2", 2]

再写简单点

// 再优化
var array = [1,1,'1','2','1',1,2]

const unique = arr => [...new Set(arr)];

unique(array);   //[1, "1", "2", 2]

优点：ES6语法简单高效。

缺点：兼容性问题，加上使用babel编译不是问题。

九、ES6的Map数据结构

// 方法八：ES6的Map + filter
var array = [1,1,'1','2','1',1,2];

function unique(arr){
    var current = new Map();
    var res = arr.filter(function(item, index, arr){
        if(current.has(item)){
            return false;
        }else{
            return current.set(item, 1);
        }
    })
    return res;
}

unique(array);   //[1, "1", "2", 2]

思路：使用map的方法set和has，用has方法来判断是否存在这个key，如果没有值将map中存一个key-value。

注意：最新的ES6规范引入了新的数据类型Map，为了解决对象中的键只能是字符串的问题，其实其他基本数据类型是可以作为键的。

优点：ES6语法简单高效。

缺点：兼容性问题，加上使用babel编译不是问题。

十、特殊数据类型比较

var str1 = '1';
var str2 = new String('1');

console.log(str1 == str2); // true
console.log(str1 === str2); // false

console.log(null == null); // true
console.log(null === null); // true

console.log(undefined == undefined); // true
console.log(undefined === undefined); // true

console.log(NaN == NaN); // false
console.log(NaN === NaN); // false

console.log(/a/ == /a/); // false
console.log(/a/ === /a/); // false

console.log({} == {}); // false
console.log({} === {}); // false

看个栗子1

var arr = [1, 2, NaN];
arr.indexOf(NaN); // -1

原因：indexOf底层还是使用 === 来进行判断的，因为NAN === NAN结果是false，使用indexOf还是查不到NAN这个元素。

再看个栗子2

function unique(array) {
   return Array.from(new Set(array));
}
console.log(unique([NaN, NaN])) // [NaN]

Set中，NAN === NAN是false，但是这两个元素是重复的

十一、后话

在对数组去重的性能进行优化，然后想了半天也只写出来了Object键值对的性能，找不到其他既能判断引用类型，性能又稳定在n^2之内的方式？

自己回答一下：

目前时间复杂度到O(n)的方法：

（1）Object键值对，实质是hasOwnProperty的hash表。

（2）ES6的set，map的数据结构

（3）reduce高阶函数

【注：我是saucxs，也叫songEagle，松宝写代码，文章首发于sau交流学习社区（ https://www.mwcxs.top ），关注我们每天阅读更多精彩内容】

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Java程序员修炼之道

[英] Benjamin J. Evans、[荷兰] Martijn Verburg / 吴海星 / 人民邮电出版社 / 2013-7 / 89.00元

本书分为四部分，第一部分全面介绍Java 7 的新特性，第二部分探讨Java 关键编程知识和技术，第三部分讨论JVM 上的新语言和多语言编程，第四部分将平台和多语言编程知识付诸实践。从介绍Java 7 的新特性入手，本书涵盖了Java 开发中最重要的技术，比如依赖注入、测试驱动的开发和持续集成，探索了JVM 上的非Java 语言，并详细讲解了多语言项目，特别是涉及Groovy、Scala 和Cl......一起来看看《Java程序员修炼之道》这本书的介绍吧!

码农工具

JavaScript系列--八种【数组去重】方法的总结

一、前言

二、双重循环

三、indexOf方法

四、排序后去重

五、使用ES5的filter

1、使用indexOf简化内层循环

2、排序去重的方法

六、Object键值对的问题

七、reduce高阶函数

八、ES6的Set数据结构

九、ES6的Map数据结构

十、特殊数据类型比较

十一、后话

Java程序员修炼之道

UNIX 时间戳转换

RGB HSV 转换

HEX HSV 转换工具

JavaScript系列--八种【数组去重】方法的总结

一、前言

二、双重循环

三、indexOf方法

四、 排序 后去重

五、使用ES5的filter

1、使用indexOf简化内层循环

2、排序去重的方法

六、Object键值对的问题

七、reduce高阶函数

八、ES6的Set数据结构

九、ES6的Map数据结构

十、特殊数据类型比较

十一、后话

Java程序员修炼之道

UNIX 时间戳转换

RGB HSV 转换

HEX HSV 转换工具

四、排序后去重