go基础库之将字符串分解为单词

栏目: Go · 发布时间: 5年前

内容简介:将字符串分解为单词可能很棘手。首先,确定单词是什么,以及分隔符是什么,以及是否有任何空格或任何其他字符。做出这些决定后,你可以从strings包中选择适当的功能。

将字符串分解为单词可能很棘手。首先,确定单词是什么,以及分隔符是什么,以及是否有任何空格或任何其他字符。做出这些决定后,你可以从strings包中选择适当的功能。

将字符串分解为单词

Golang 版本

1.12.1

前言

将字符串分解为单词可能很棘手。首先,确定单词是什么,以及分隔符是什么,以及是否有任何空格或任何其他字符。做出这些决定后,你可以从strings包中选择适当的功能。

实现

  1. 创建文件 whitespace.go ,代码如下:

    package main
    
    import (
    	"fmt"
    	"strings"
    )
    
    const refString = "Mary had a little lamb"
    
    func main() {
    
    	words := strings.Fields(refString)
    	for idx, word := range words {
    		fmt.Printf("Word %d is: %s\n", idx, word)
    	}
    
    }
    
    $ go run whitespace.go
    单词 0 是: Mary
    单词 1 是: had
    单词 2 是: a
    单词 3 是: little
    单词 4 是: lamb
    
  2. 创建文件 anyother.go ,代码如下:

    package main
    
    import (
    	"fmt"
    	"strings"
    )
    
    const refString = "Mary_had a little_lamb"
    
    func main() {
    
    	words := strings.Split(refString, "_")
    	for idx, word := range words {
    		fmt.Printf("单词 %d 是: %s\n", idx, word)
    	}
    
    }
    
    $ go run anyother.go
    单词 0 是: Mary
    单词 1 是: had a little
    单词 2 是: lamb
    
  3. 创建文件 specfunction.go ,代码如下:

    package main
    
    import (
    	"fmt"
    	"strings"
    )
    
    const refString = "Mary*had,a%little_lamb"
    
    func main() {
    
    	// 为字符串中的每个符文调用splitFunc。如果符文等于“*%,_”中的任何字符,则拆分refString
    	splitFunc := func(r rune) bool {
    		return strings.ContainsRune("*%,_", r)
    	}
    
    	words := strings.FieldsFunc(refString, splitFunc)
    	for idx, word := range words {
    		fmt.Printf("单词 %d 是: %s\n", idx, word)
    	}
    
    }
    
    $ go run specfunction.go
    单词 0 是: Mary
    单词 1 是: had
    单词 2 是: a
    单词 3 是: little
    单词 4 是: lamb
    
  4. 创建文件 regex.go ,代码如下:

    package main
    
    import (
    "fmt"
    "regexp"
    )
    
    const refString = "Mary*had,a%little_lamb"
    
    func main() {
    
    	words := regexp.MustCompile("[*,%_]{1}").Split(refString, -1)
    	for idx, word := range words {
    		fmt.Printf("单词 %d 是: %s\n", idx, word)
    	}
    
    }
    
    $ go run regex.go
    单词 0 是: Mary
    单词 1 是: had
    单词 2 是: a
    单词 3 是: little
    单词 4 是: lamb
    

原理

将字符串分割成单词的最简单形式是将任何空格作为分隔符。其中空格由 unicode 包中的 IsSpace 函数定义:

‘\t’, ‘\n’, ‘\v’, ‘\f’, ‘\r’, ‘ ‘, U+0085 (NEL), U+00A0 (NBSP).

如前所述, string 包的 Fields 函数可用于空格字符分割句子。步骤1涵盖了第一个简单的案例。

如果需要其他分隔符,则使用 Split 函数。在步骤2中讨论了用另一个分隔符进行分割。请注意,字符串中的空格被省略了。

如果需要一个更复杂的函数来决定是否在给定的位置拆分字符串, FieldsFunc 可以为你提供帮助。该函数的一个参数是使用给定字符串的符文并返回 true (如果该字符串在该点应该分割)的函数。这个选项包含在步骤3中。

正则表达式是示例中提到的最后一个选项。 Regexp 包的 Regexp 结构体包含 Split 方法,其工作方式与您所期望的一样。它将字符串分割到匹配组的位置。此方法在步骤4中使用。

延伸

strings 包还提供各种 SplitXXX 功能,可以帮助你实现更具体的任务。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

计算机算法

计算机算法

霍罗威茨 / 机械工业 / 2006-1 / 55.00元

本书是计算机算法在设计与分析方面的一本经典著作。书中介绍了算法和算法性能的基本知识,基本的数据结构知识,重点讨论了不同的算法设计策略,研究了下界理论等,提供了计算机算法的设计技术和有效的算法分析,以及大量的详细实例和实际应用。同时,对NP难和NP完全问题能否有效求解进行了分析。本书还汇聚了各种随机算法与并行算法的充分比较。   本书为读者提供了当前流行的对象设计语言C++的实现版本,适合作为......一起来看看 《计算机算法》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试