十个惊人的Scala集合操作函数

栏目: Scala · 发布时间: 5年前

内容简介:当我操作我们先从动作函数(action function)开始。在序列中查找最大或最小值是一个极常见的需求,较常用于面试问题和算法。还记得 Java 中的代码行吗?如下:问题:怎么在 List 中找到最大/最小值呢?

当我操作 Scala 集合时,我一般会进行两类操作:转换操作(transformation )和行动操作(actions)(有些人喜欢叫他为聚合操作)。第一种操作类型将集合转换为另一个集合,第二种操作类型返回某些类型的值。

本文我将集中介绍几个日常工作必备的 Scala 集合函数,如转换函数和聚合函数。文章最后,我会展示如何结合这些函数以解决具体问题。

最大值和最小值

我们先从动作函数(action function)开始。在序列中查找最大或最小值是一个极常见的需求,较常用于面试问题和算法。还记得 Java 中的代码行吗?如下:

int [] arr = { 11 , 2 , 5 , 1 , 6 , 3 , 9 };
 
int to = arr.length - 1 ;
int max = arr[ 0 ];
 
for ( int i = 0 ; i < to; i++) {
   if (max < arr[i+ 1 ])
     max = arr[i+ 1 ];
}
 
System.out.println(max);

问题:怎么在 List 中找到最大/最小值呢?

Scala 推荐了一个很赞的解决方案:

val numbers = Seq( 11 , 2 , 5 , 1 , 6 , 3 , 9 )
numbers.max //11
numbers.min //1

但实际操作的数据更加复杂。下面我们介绍一个更高级的例子,其中包含一个书的序列(查看源代码案例)。

case class Book(title : String, pages : Int)
 
val books = Seq(
  Book( "Future of Scala developers" , 85 ),
  Book( "Parallel algorithms" , 240 ),
  Book( "Object Oriented Programming" , 130 ),
  Book( "Mobile Development" , 495 )
)
 
//Book(Mobile Development,495)
books.maxBy(book = > book.pages)
 
//Book(Future of Scala developers,85)
books.minBy(book = > book.pages)

如上所示, minBymaxBy 方法解决了复杂数据的问题。你只需选择决定数据最大或最小的属性。

Filter

你过滤过集合吗?比如,筛选价格大于10美元的条目,或挑选年龄在24岁以下员工等,所有这些操作属于过滤。

让我们举例说明:过滤一个数字 List,只获取奇数的元素。

val numbers = Seq( 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 )
numbers.filter(n = > n % 2 == 0 )

然后加大难度,我想获取页数大于120页的书。

val books = Seq(
  Book( "Future of Scala developers" , 85 ),
  Book( "Parallel algorithms" , 240 ),
  Book( "Object Oriented Programming" , 130 ),
  Book( "Mobile Development" , 495 )
)
 
books.filter(book = > book.pages > = 120 )

实际上,过滤是一个转换类型的方法,但是比运用 min 和  max 方法简单。

还有一个与 filter 类似的方法是  filterNot 。它的名字就体现了它的作用。如果你还是不了解它的实际用途,你可以在一个示例中,用  filterNot 替换 filter 方法。

Flatten O_o

我想大多数朋友都没听说过这个功能。其实它很好理解,我们来举例说明:

val abcd = Seq( 'a' , 'b' , 'c' , 'd' )
val efgj = Seq( 'e' , 'f' , 'g' , 'h' )
val ijkl = Seq( 'i' , 'j' , 'k' , 'l' )
val mnop = Seq( 'm' , 'n' , 'o' , 'p' )
val qrst = Seq( 'q' , 'r' , 's' , 't' )
val uvwx = Seq( 'u' , 'v' , 'w' , 'x' )
val yz   = Seq( 'y' , 'z' )
 
val alphabet = Seq(abcd, efgj, ijkl, mnop, qrst, uvwx, yz)
 
// List(a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z)
alphabet.flatten

当有一个集合的集合,然后你想对这些集合的所有元素进行操作时,就会用到 flatten。

欧拉图函数(Euler Diagram函数)

不要紧张!接下来的操作大家都熟知:差集、交集和并集。以下示例能很好地解释 Euler Diagram 函数:

val num 1 = Seq( 1 , 2 , 3 , 4 , 5 , 6 )
val num 2 = Seq( 4 , 5 , 6 , 7 , 8 , 9 )
 
//List(1, 2, 3)
num 1 .diff(num 2 )
 
//List(4, 5, 6)
num 1 .intersect(num 2 )
 
//List(1, 2, 3, 4, 5, 6, 4, 5, 6, 7, 8, 9)
num 1 .union(num 2 )

上述示例中的 union 保留了重复的元素。如果我们不需要重复怎么办?这时可以使用  distinct 函数:

//List(1, 2, 3, 4, 5, 6, 7, 8, 9)
num 1 .union(num 2 ).distinct

下面是上述功能的图示:

十个惊人的Scala集合操作函数

map列表元素

map 是 Scala 集合最常用的一个函数。它的功能十分强大:

val numbers = Seq( 1 , 2 , 3 , 4 , 5 , 6 )
 
//List(2, 4, 6, 8, 10, 12)
numbers.map(n = > n * 2 )
 
val chars = Seq( 'a' , 'b' , 'c' , 'd' )
 
//List(A, B, C, D)
chars.map(ch = > ch.toUpper)

map 函数的逻辑是遍历集合中的元素并对每个元素调用函数。你也可以不调用任何函数,保持返回元素本身,但这样  map 无法发挥作用,因为你在映射过后得到的是同样的集合。

flatMap

我很难具体说明 flatMap 的使用场合,因为很多不同的情况下都会用到  flatMap 。如果大家仔细观察,就会发现  flatMap 是由下列这两个函数组成的:map & flatten

现在,假设我们想知道字母表中的大写字母和小写字母的排列情况:

val abcd = Seq( 'a' , 'b' , 'c' , 'd' )
 
//List(A, a, B, b, C, c, D, d)
abcd.flatMap(ch = > List(ch.toUpper, ch))

因为这篇文章是关于集合功能的介绍,所以此处略过 Future 和 Option 的示例。

对整个集合进行条件检查

有一个场景大家都知道,即确保集合中所有元素都要符合某些要求,如果有哪怕一个元素不符合条件,就需要进行一些处理:

val numbers = Seq( 3 , 7 , 2 , 9 , 6 , 5 , 1 , 4 , 2 )
 
//ture
numbers.forall(n = > n < 10 )
 
//false
numbers.forall(n = > n > 5 )

而 forall 函数就是为处理这类需求而创建的。

对集合进行分组

你是否尝试过将一个集合按一定的规则拆分成两个新的集合?比如,我们把某个集合拆分成偶数集和奇数集,partition 函数可以帮我们做到这一点:

val numbers = Seq( 3 , 7 , 2 , 9 , 6 , 5 , 1 , 4 , 2 )
 
//(List(2, 6, 4, 2), List(3, 7, 9, 5, 1))
numbers.partition(n = > n % 2 == 0 )

Fold?

另一个流行的操作是 fold 。 在 Scala 的上下文中,通常可以考虑  foldLeft 和  foldRight 。他们是从不同的方面做同样的工作:

val numbers = Seq( 1 , 2 , 3 , 4 , 5 )
 
//15
numbers.foldLeft( 0 )((res, n) = > res + n)

在第一对括号中,我们放一个起始值。 在第二对括号中,我们定义需要对数字序列的每个元素执行的操作。 第一步,n = 0,然后它根据序列元素变化。

另一个关于 foldLeft 的例子,计算字符数:

val words = Seq( "apple" , "dog" , "table" )
 
//13
words.foldLeft( 0 )((resultLength, word) = > resultLength + word.length)

您最喜欢的函数

经过了上面一系列的列举,从Scala集合找到你最喜欢的函数是很酷的(cool)。请大家在评论中写下它,并提供其使用的例子。

最近我通过了一个编译测试,任务的内容是:给你一个String S,你需要找到包含大写和小写字符,但不包含数字的最长子字符串。

比如: dP4knqw1QAp

答案: QAp

那么我们如何使用Scala集合函数来解决这个问题呢:

def theLongest(s : String) : String = {
  s.split ( "[0-9]" )
   .filter ( _ .exists (ch = > ch.isUpper))
   .filter ( _ .exists (ch = > ch.isLower))
   .maxBy ( _ .length)
}

上面的函数解决了这个问题。如果输入字符串不包含任何合适的子字符串,将会抛出 UnsupportedOperationException

总结

Scala具有令人难以置信的强大的集合API,你可以利用它做很多的事情。 此外,相同的事情可以以不同的方式进行,例如: 上面的欧拉函数例子。 Scala的API是很丰富的,我们需要很多时间和练习来学习它。

原文原文:10 amazing scala collection functions

本博客文章除特别声明,全部都是原创!
转载本文请加上:转载自过往记忆(https://www.iteblog.com/)
本文链接: 【十个惊人的Scala集合操作函数】(https://www.iteblog.com/archives/1946.html)


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

自品牌

自品牌

陈为、孙郁婷 / 机械工业出版社 / 2015-9-7 / 39

移动互联网来势汹涌,让品牌重新回到人的时代。微信旗帜鲜明地宣示,“再小的个体也有自己的品牌”。《自品牌:个人如何玩转移动互联网时代》作者历经一年,深度访谈10位嘉宾,挖掘其品牌与商业成功密码。吴晓波、雕爷、罗永浩、鬼脚七、马佳佳……这些商业新浪潮中的探路者与领军者,要么是传统领域的老将,要么是新领域里的先锋,但都能以新媒体为载体,构建个人品牌,打造商业生态,抓住互联网的时代红利,顺风而起,顺势而为......一起来看看 《自品牌》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具