程序开发 · 2023年11月8日

bytes.Split() 如何处理从 UTF-8 字符串转换而来的字节?

当前位置: > > > > bytes.Split() 如何处理从 UTF-8 字符串转换而来的字节?

来源:stackoverflow
2024-04-20 23:15:45
0浏览
收藏

偷偷努力,悄无声息地变强,然后惊艳所有人!哈哈,小伙伴们又来学习啦~今天我将给大家介绍《bytes.Split() 如何处理从 UTF-8 字符串转换而来的字节?》,这篇文章主要会讲到等等知识点,不知道大家对其都有多少了解,下面我们就一起来看一吧!当然,非常希望大家能多多评论,给出合理的建议,我们一起学习,一起进步!

问题内容

$ cat main.go 
#!/usr/bin/env gorun
// vim: set noexpandtab tabstop=2:

package main

import (
    "fmt"
    "os"
    "bytes"
)

func main() {
    fmt.Printf("%q\n", bytes.Split([]byte(os.Args[1]), []byte(os.Args[2])))
}
$ ./main.go 程序 ''
["程" "序"]

我希望 main.go 每个 utf-8 字符打印多个字节。但它只打印两个utf-8字符

有人可以帮我理解为什么会这样吗?谢谢。

解决方案

如果 sep 为空,则 Split 在每个 UTF-8 序列后进行分割。

—。

因此,尽管 bytes.Split 确实允许您在任意点进行分割并将 UTF-8 序列分开,但使用 []byte("") 分隔符调用它不会这样做。

今天关于《bytes.Split() 如何处理从 UTF-8 字符串转换而来的字节?》的内容介绍就到此结束,如果有什么疑问或者建议,可以在公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!