介绍rune前先看看下面代码的输出结果:
package main import "fmt" func main() { var str = "hello 你好" fmt.Println("len(str):", len(str)) }
结果:
len(str): 12
上面的字符串明明只有8个字符,但是输出为12!
这跟golangstring类型的实现有关:
golang中string类型是byte数组实现的,中文字符在unicode下占2个字节,在utf-8编码下占3个字节,而golang默认编码正好是utf-8。
所以**len(str)**输出的是字节的长度,一个汉字3个字节,最终结果就是12个字节。
rune
golang中rune是int32的别名,几乎在所有方面等同于int32,它用来区分字符值和整数值。
golang中的 unicode/utf8 提供了用utf-8 获取长度的方法 utf8.RuneCountInString(),
package main import ( "fmt" "unicode/utf8" ) func main() { var str = "hello 你好" //golang中string底层是通过byte数组实现的,座椅直接求len 实际是在按字节长度计算 所以一个汉字占3个字节算了3个长度 fmt.Println("len(str):", len(str)) //以下两种都可以得到str的字符串长度 //golang中的unicode/utf8包提供了用utf-8获取长度的方法 fmt.Println("RuneCountInString:", utf8.RuneCountInString(str)) //通过rune类型处理unicode字符 fmt.Println("rune:", len([]rune(str))) }
结果:
len(str): 12 RuneCountInString: 8 rune: 8