内容简介:一个字符串是一个不可改变的字节序列。字符串可以包含任意的数据,但是通常是用来包含人类可读的文本。使用`反引号括起来,没有转义操作。应用:HTML模板、JSON面值、命令行提示信息等。
一个字符串是一个不可改变的字节序列。字符串可以包含任意的数据,但是通常是用来包含人类可读的文本。
-
len()返回字符串字节数目(不是rune数)。
-
通过索引可以访问某个字节值,索引大于等于0小于len(str)。越界会panic。索引不是不是对应的字符而是对应的字节,因为有有非ASCII的UTF8字符有多个字节。
s := "hello, world" fmt.Println(len(s)) // "12" 英文字符占一个字节 fmt.Println(s[0], s[7]) // "104 119" ('h' and 'w')
-
字符串截取与链接
fmt.Println(s[:5]) // "hello" fmt.Println(s[7:]) // "world" fmt.Println(s[:]) // "hello, world" fmt.Println("hi" + s[5:]) //hi world
-
比较
1 字符串可以用==和<进行比较。通过逐个字节比较完成的,因此比较的结果是字符串自然编码的顺序。
2 原生字符
使用`反引号括起来,没有转义操作。
应用:HTML模板、JSON面值、命令行提示信息等。
-
编码
1 Unicode让我们可以通过Unicode码点输入特殊的字符。有两种形式:\uhhhh对应16bit的码点值,\Uhhhhhhhh对应32bit的码点值,其中h是一个十六进制数字,每一个对应码点的UTF8编码。以下表示相同字符:
"世界" "\xe4\xb8\x96\xe7\x95\x8c" "\u4e16\u754c" "\U00004e16\U0000754c"
2 对于小于256码点值可以写在一个十六进制转义字节中,例如'\x41'对应字符'A',但是对于更大的码点则必须使用\u或\U转义形式。因此,'\xe4\xb8\x96'并不是一个合法的rune字符,虽然 这三个字节对应一个有效的UTF8编码的码点。
参见 Unicode官网
3 字符串长度用utf8.RuneCountInString(s)
rune
1 Unicode码点对应 Go 语言中的rune整数类型。
2 因为 rune大小一致,所以支持数组索引和方便切割。
string与[]rune转换
r := []rune("你好 world!") fmt.Printf("%x\n", r) // "[4f60 597d 20 77 6f 72 6c 64 21]" fmt.Println(string(r)) // "你好 world" } fmt.Println(string(65)) // "A", not "65" 整形字符串输出为unicode码点的utf8字符串。 fmt.Println(string(0x4eac)) // "京"
对字符串操作的4个包bytes、strings、strconv、unicode包
- bytes包操作[]byte。因为字 符串是只读的,因此逐步构创建字符串会导致很多分配和复制。使用 bytes.Buffer类型会更高。
- strings包提供切割,索引,前缀,查找替换等功能。
- strconv包提供了布尔型、整型数、浮点数和对应字符串的相互转换,还提供了双引号转义相 关的转换。
- unicode包提供了IsDigit、IsLetter、IsUpper和IsLower等类似功能,它们用于给字符分类。
字符串与数字转换
- 将一个整数转为字符串
x := 123 fmt.Println(strconv.Itoa(x)) // "123"
- 将一个字符串解析为整数
x, err := strconv.Atoi("123") // x is an int y, err := strconv.ParseInt("123", 10, 64)
- FormatInt和FormatUint函数可以用不同的进制来格式化数字:
fmt.Println(strconv.FormatInt(int64(23), 2)) //将64转换成2进制
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。