迷人的算法-排列组合

栏目: 编程工具 · 发布时间: 5年前

内容简介:最近工作中碰到一个需求:我们的数据表有多个维度,任意多个维度组合后进行 group by 可能会产生一些”奇妙”的反应,由于不确定怎么组合,就需要将所有的组合都列出来进行尝试。抽象一下就是从一个集合中取出任意元素,形成唯一的组合。如要求如下:

需求

最近工作中碰到一个需求:我们的数据表有多个维度,任意多个维度组合后进行 group by 可能会产生一些”奇妙”的反应,由于不确定怎么组合,就需要将所有的组合都列出来进行尝试。

抽象一下就是从一个集合中取出任意元素,形成唯一的组合。如 [a,b,c] 可组合为 [a]、[b]、[c]、[ab]、[bc]、[ac]、[abc]

要求如下:

  • 组合内的元素数大于 0 小于等于 数组大小;
  • 组合内不能有重复元素,如 [aab] 是不符合要求的组合;
  • 组合内元素的位置随意,即 [ab] 和 [ba] 视为同一种组合;

看到这里,就应该想到高中所学习的排列组合了,同样是从集合中取出元素形成一个另一个集合,如果集合内元素位置随意,就是 组合 ,从 b 个元素中取 a 个元素的组合有

种。而如果要求元素顺序不同也视为不同集合的话,就是排列,从 m 个元素取 n 个元素的排列有

种。

我遇到的这个需求就是典型的组合,用公式来表示就是从元素个数为 n 的集合中列出

种组合。

转载随意,文章会持续修订,请注明来源地址: https://zhenbianshu.github.io

文中算法用 Java 实现。

从排列到组合-穷举

对于这种需求,首先想到的当然是穷举。由于排列的要求较少,实现更简单一些,如果我先找出所有排列,再剔除由于位置不同而重复的元素即可。假设需要从 [A B C D E] 五个元素中取出所有组合,那么我们先找出所有元素的全排列,然后再将类似 [A B] 和 [B A] 两种集合去重。

我们又知道

,那么我们先考虑一种情况 假设是

蛮力穷举

首先我们将所有组合都列出来,然后过滤掉有重复元素的集合,那么我们的程序就得这么写:

private static Set<Set<String>> exhaustion() {
        List<String> m = Arrays.asList("a", "b", "c", "d", "e");
        Set<Set<String>> result = new HashSet<>();
        int count = 3;
        for (int a = 1; a < m.size(); a++) {
            for (int b = 0; b < m.size(); b++) {
                for (int c = 0; c < m.size(); c++) {
                    Set<String> tempCollection = new HashSet<>();
                    tempCollection.add(m.get(a));
                    tempCollection.add(m.get(b));
                    tempCollection.add(m.get(c));
                    // 如果三个元素中有重复的会被 Set 排重,导致 Set 的大小不为 3
                    if (tempCollection.size() == count) {
                        result.add(tempCollection);
                    }
                }
            }
        }

        return result;
    }

对于结果组合的排重,我借用了 Java 中 HashSet 的两个特性:

  • 元素无序性,Set[A B] 和 Set[B A] 都会被表示成 Set[A B]。
  • 元素唯一性,被同时表示为 Set[A B] 的多个元素只会保留一个。

可以注意得到,上面程序中 count 参数是写死的,如果需要取出 4 个元素的话就需要四层循环嵌套了,这时候只好使用递归来帮助穷举。

从排列到组合-递归分治

穷举毕竟太过暴力,我们来通过分治思想来重新考虑一下这个问题:

分治思想

由于组合内元素的不可重复性,每次从集合内取出一个元素后,集合内的可用元素就要少 1。

还是从 5 个元素中取 3 个元素的示例:

  • 第一次取,从 5 个元素中取 1 个元素,产生了 5 种只包含一个元素的集合,这时候我们只需要考虑怎么从剩下的四个元素中取到 2 个,此时的公式为
  • 第二次取,我们拿着这 5 种只有一个元素的集合,从各自剩余的 4 个元素中再取出 1 个元素,此时我们只需要考虑怎么从剩下的三个元素中再取一个,此时的公式为
  • 第三次取,我们拿着这些包含两个元素的集合,从各自剩余的 3 个元素中再取出一个元素,即可获取到所有的组合。

不管一共要取多少个元素,最终都会归结成只取 1 个。

代码实现

而用代码实现如下:

public class Combination {

    public static void main(String[] args) {
        List<String> m = Arrays.asList("a", "b", "c", "d", "e");
        int n = 5;

        Set<Set<String>> combinationAll = new HashSet<>();
        for (int c = 1; c <= n; c++) {
            combinationAll.addAll(combination(m, new ArrayList<>(), c));
        }

        System.out.println(combinationAll);
    }

    private static Set<Set<String>> combination(List<String> remainEle, List<String> tempCollection, int fetchCount) {
        if (fetchCount == 1) {
            Set<Set<String>> eligibleCollections = new HashSet<>();
            // 在只差一个元素的情况下,遍历剩余元素为每个临时集合生成多个满足条件的集合
            for (String ele : remainEle) {
                Set<String> collection = new HashSet<>(tempCollection);
                collection.add(ele);
                eligibleCollections.add(collection);
            }
            return eligibleCollections;
        }

        fetchCount--;
        Set<Set<String>> result = new HashSet<>();
        // 差多个元素时,从剩余元素中取出一个,产生多个临时集合,还需要取 count-- 个元素。
        for (int i = 0; i < remainEle.size(); i++) {
            List<String> collection = new ArrayList<>(tempCollection);
            List<String> tempRemain = new ArrayList<>(remainEle);
            collection.add(tempRemain.remove(i));
            result.addAll(combination(tempRemain, collection, fetchCount));
        }
        return result;
    }
}

从形式上来看,跟上面的递归穷举差距不大,毕竟递归是分治思想的一种实现。

位运算

思想

代码实现

小结


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据结构 Python语言描述

数据结构 Python语言描述

[美] Kenneth A. Lambert 兰伯特 / 李军 / 人民邮电出版社 / 2017-12-1 / CNY 69.00

在计算机科学中,数据结构是一门进阶性课程,概念抽象,难度较大。Python语言的语法简单,交互性强。用Python来讲解数据结构等主题,比C语言等实现起来更为容易,更为清晰。 《数据结构 Python语言描述》第1章简单介绍了Python语言的基础知识和特性。第2章到第4章对抽象数据类型、数据结构、复杂度分析、数组和线性链表结构进行了详细介绍,第5章和第6章重点介绍了面向对象设计的相关知识、......一起来看看 《数据结构 Python语言描述》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具