网易首页 > 网易号 > 正文 申请入驻

Golang 语言怎么高效使用字符串?

0
分享至

介绍

在 Golang 语言中,string 类型的值是只读的,不可以被修改。如果需要修改,通常的做法是对原字符串进行截取和拼接操作,从而生成一个新字符串,但是会涉及内存分配和数据拷贝,从而有性能开销。本文我们介绍在 Golang 语言中怎么高效使用字符串。

字符串的数据结构

在 Golang 语言中,字符串的值存储在一块连续的内存空间,我们可以把存储数据的内存空间看作一个字节数组,字符串在 runtime 中的数据结构是一个结构体 stringStruct,该结构体包含两个字段,分别是指针类型的 str 和整型的 len。字段 str 是指向字节数组头部的指针值,字段 len 的值是字符串的长度(字节个数)。

我们通过示例代码,比较一下字符串和字符串指针的性能差距。我们定义两个函数,分别用 和 作为函数的参数。

output:

阅读上面这段代码,我们可以发现使用字符串作为参数,和使用字符串指针作为参数,它们的性能基本相同。

虽然字符串的值并不是具体的数据,而是一个指向存储字符串数据的内存地址的指针和一个字符串的长度,但是字符串仍然是值类型。

字符串是只读的,不可修改

在 Golang 语言中,字符串是只读的,它不可以被修改。

阅读上面这段代码,我们将字符串类型的变量 str 转换为字节切片类型,并赋值给变量 byteSlice,使用索引下标修改 byteSlice 的值,打印结果仍未发生改变。

因为字符串转换为字节切片,Golang 编译器会为字节切片类型的变量重新分配内存来存储数据,而不是和字符串类型的变量共用同一块内存空间。

可能会有读者想到用指针修改字符串类型的变量存储在内存中的数据。

阅读上面这段代码,我们可以发现在代码中尝试通过指针修改 string 类型的 str 变量的存储在内存中的数据,结果引发了 signal SIGBUS 运行时错误,从而证明 string 类型的变量是只读的。

我们已经知道字符串在 runtime 中的结构体包含两个字段,指向存储数据的内存地址的指针和字符串的长度,因为字符串是只读的,字符串被赋值后,它的数据和长度都不会被修改,所以读取字符串的长度,实际上就是读取字段 len 的值,复杂度是 O(1)。

在字符串比较时,因为字符串是只读的,不可修改的,所以只要两个比较的字符串的长度 len 的值不同,就可以判断这两个字符串不相同,不用再去比较两个字符串存储的具体数据。

如果 len 的值相同,再去判断两个字符串的指针是否指向同一块内存,如果 len 的值相同,并且指针指向同一块内存,则可以判断两个字符串相同。但是如果 len 的值相同,而指针不是指向同一块内存,那么还需要继续去比较两个字符串的指针指向的字符串数据是否相同。

字符串拼接

在 Golang 语言中,关于字符串拼接有多种方式,分别是:

  • 使用操作符
  • 使用
  • fmt.Sprintf
  • 使用
  • bytes.Buffer
  • 使用
  • strings.Join
  • 使用
  • strings.Builder

其中使用操作符是最易用的,但是它不是最高效的,一般使用场景是用于已知需要拼接的字符串的长度。

使用 拼接字符串,性能是最差的,但是它可以格式化,所以一般使用场景是需要格式化拼接字符串。

fmt.Sprintf

使用 和使用 的性能比较接近,性能最高的字符串拼接方式是使用 。

bytes.Buffer

strings.Join

strings.Builder

我准备对 的字符串拼接方式多费些笔墨。

strings.Builder

Golang 语言标准库 strings 中的 Builder 类型,用于在 Write 方法中有效拼接字符串,它减少了数据拷贝和内存分配。

Builder 结构体中包含两个字段,分别是 addr 和 buf,字段 addr 是指针类型,字段 buf 是字节切片类型,但是它的值仍然不允许被修改,但是字节切片中的值可以被拼接或者被重置。

Builder 提供了一系列 Write* 拼接方法,这些方法可以用于把新数据拼接到已存在的数据的末尾,同时如果字节切片的容量不够用,可以自动扩容。需要注意的是,只要触发扩容,就会涉及内存分配和数据拷贝。自动扩容规则和切片的扩容规则相同。

除了自动扩容,还可以手动扩容,Builder 提供的 Grow 方法,可以根据 int 类型的传参,扩充字节数量。因为扩容操作,会涉及内存分配和数据拷贝,所以调用 Grow 方法手动扩容时,Golang 也做了优化,如果当前字节切片的容量剩余字节数小于或等于传参的值, Grow 方法将不会执行扩容操作。手动扩容规则是原字节切片容量的 2 倍加上传参的值。

Builder 类型还提供了一个重置方法 Reset,它可以将 Builder 类型的变量重置为零值。被重置后,原字节切片将会被垃圾回收。

在了解完上述 Builder 的介绍后,相信读者已对 Builder 有了初步认识。下面我们通过代码看一下预分配字节数量和未分配字节数量的区别:

阅读上面这段代码,可以发现调用 Grow 方法,预分配字节数量比未预分配字节数量的字符串拼接效率高。我们在可以预估字节数量的前提下,尽量使用 Grow 方法预先分配字节数量。

注意:第一,Builder 类型的变量在被调用之后,不可以再被复制,否则会引发 panic。第二,因为 Builder 类型的值不是完全不可修改的,所以使用者需要注意并发安全的问题。
字符串和字节切片互相转换

因为切片类型除了只能和 nil 做比较之外,切片类型之间是无法做比较操作的。如果我们需要对切片类型做比较操作,通常的做法是先将切片类型转换为字符串类型。但是因为 string 类型是只读的,不可修改的,所以转换操作会涉及内存分配和数据拷贝。

为了提升转换的性能,唯一的方法就是减少或者避免内存分配的开销。在 Golang 语言中,运行时对二者的互相转换也做了优化,感兴趣的读者可以阅读 runtime 中的相关源码:

/usr/local/go/src/runtime/string.go

但是,我们还可以继续优化,实现零拷贝的转换操作,从而避免内存分配的开销,提升转换效率。

先阅读 reflect 中 StringHeader 和 SliceHeader 的数据结构:

阅读上面这段代码,我们可以发现 StringHeader 和 SliceHeader 的字段只缺少一个表示容量的字段 Cap,二者都有指向存储数据的字节数组的指针和长度。我们只需要通过使用 获取内存地址,就可以实现在原内存空间修改数据,避免了内存分配和数据拷贝的开销。

unsafe.Pointer

因为 StringHeader 比 SliceHeader 缺少一个表示容量的字段 Cap,所以通过 将 转换为 没有问题,但是反之就不行了。我们需要补上一个 Cap 字段,并且将字段 Len 的值作为字段 Cap 的默认值。

阅读上面这段代码,我们可以发现通过使用 把字符串转换为字节切片,可以做到零拷贝,str 和 str2 共用同一块内存,无需新分配一块内存。但是需要注意的是,转换后的字节切片仍然不能修改,因为在 Golang 语言中字符串是只读的,通过索引下标修改会引发 panic。

总结

本文我们介绍了怎么高效使用 Golang 语言中的字符串,先是介绍了字符串在 runtime 中的数据结构,然后介绍了字符串拼接的几种方式,字符串与字节切片零拷贝互相转换,还通过示例代码证明了字符串在 Golang 语言中是只读的。更多关于字符串的操作,读者可以阅读标准库 strings 和 strconv 了解更多内容。

原文链接:https://mp.weixin.qq.com/s/Na5hQiuggifsHOEnw-2oXA

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
F1加拿大二练:阿隆索全场最快,维斯塔潘仅排18,诺里斯垫底

F1加拿大二练:阿隆索全场最快,维斯塔潘仅排18,诺里斯垫底

懂球帝
2024-06-08 06:08:46
湖南:小伙捧鲜花表白女技师,做足疗一见钟情,网友:长得很哇塞

湖南:小伙捧鲜花表白女技师,做足疗一见钟情,网友:长得很哇塞

百晓史
2024-06-02 09:09:36
EUV光刻机反转来了!荷兰ASML正式宣布,外媒:台积电情况突变了

EUV光刻机反转来了!荷兰ASML正式宣布,外媒:台积电情况突变了

疯狂小菠萝
2024-06-06 22:11:38
刚刚,安徽一正厅级干部任上被查!一周前还在调研

刚刚,安徽一正厅级干部任上被查!一周前还在调研

凤凰网安徽
2024-06-07 17:36:24
不要再被骗了,这才是川岛芳子的真实照片!

不要再被骗了,这才是川岛芳子的真实照片!

功标青史
2024-06-07 10:58:43
妈妈为送考穿上旗袍减重25斤,双向奔赴的努力,却引来各种嘲讽

妈妈为送考穿上旗袍减重25斤,双向奔赴的努力,却引来各种嘲讽

北方青木
2024-06-07 12:58:37
张兰撕开大S真面目:抢救不是因为生孩子!汪小菲的爆料被证实

张兰撕开大S真面目:抢救不是因为生孩子!汪小菲的爆料被证实

娱乐贴士站
2024-06-07 18:12:46
最新!碧桂园杨惠妍:普通老百姓买一套房,很多都投入了一辈子的积蓄,必须保交房

最新!碧桂园杨惠妍:普通老百姓买一套房,很多都投入了一辈子的积蓄,必须保交房

每日经济新闻
2024-06-06 17:31:18
菲方称中国海警“阻止菲撤离生病人员” 现场图片揭开事实真相

菲方称中国海警“阻止菲撤离生病人员” 现场图片揭开事实真相

环球时报国际
2024-06-07 18:49:32
一步到位!华为突然官宣,6月7日,重大升级!

一步到位!华为突然官宣,6月7日,重大升级!

心在途中
2024-06-06 15:43:09
实探搬迁风暴中的周大福深圳工厂:裁员早有征兆,原本五六百人的工厂现在剩下几十个人

实探搬迁风暴中的周大福深圳工厂:裁员早有征兆,原本五六百人的工厂现在剩下几十个人

华夏时报
2024-06-07 11:01:11
《庆余年2》:悬空庙一战,二皇子到底看见什么?吓得脸色惨白

《庆余年2》:悬空庙一战,二皇子到底看见什么?吓得脸色惨白

子芫伴你成长
2024-06-07 23:20:45
国足刚战平泰国,伊万就点燃第一把火,王大雷领衔三国脚遭弃用?

国足刚战平泰国,伊万就点燃第一把火,王大雷领衔三国脚遭弃用?

罗掌柜体育
2024-06-07 12:21:01
俄罗斯核潜艇将罕见访问古巴,古方强调“未携带核武器”

俄罗斯核潜艇将罕见访问古巴,古方强调“未携带核武器”

澎湃新闻
2024-06-07 11:22:31
徐超,被查!

徐超,被查!

鲁中晨报
2024-06-07 10:35:04
从朝鲜归来,有些大实话不得不讲!

从朝鲜归来,有些大实话不得不讲!

李砍柴
2024-04-21 23:53:00
AI改AI!国内两大AI互改对方的湖南高考作文,结局出乎意料

AI改AI!国内两大AI互改对方的湖南高考作文,结局出乎意料

潇湘晨报
2024-06-07 16:37:06
最伟大的科学家,一生证明“神”的存在?留下神秘手稿,有何发现

最伟大的科学家,一生证明“神”的存在?留下神秘手稿,有何发现

光头哥的头
2024-01-17 17:47:07
原上海市委副书记陈至立书法,笔墨结字质而不野,被网友推崇备至

原上海市委副书记陈至立书法,笔墨结字质而不野,被网友推崇备至

花小猫的美食日常
2024-06-08 07:35:06
美国的渗透开始奏效,扶持的内鬼纷纷在华露头,专家:全部铲除!

美国的渗透开始奏效,扶持的内鬼纷纷在华露头,专家:全部铲除!

小lu侃侃而谈
2024-06-02 21:40:53
2024-06-08 09:36:49
马哥Linux云计算
马哥Linux云计算
知识萃取精华,赋能技术人生
93文章数 1055关注度
往期回顾 全部

科技要闻

6家大模型抢答高考作文,谁是你心中的Top1

头条要闻

牛弹琴:普京积极出招 向美国后院派出最危险核潜艇

头条要闻

牛弹琴:普京积极出招 向美国后院派出最危险核潜艇

体育要闻

优势在我?中国足球有自己的节奏

娱乐要闻

汤唯抵达巴黎将担任奥运火炬手

财经要闻

身陷退市股的投资者:我的钱瞬间没了

汽车要闻

2.0T混动售20.98万元起 福特蒙迪欧运动版上市

态度原创

手机
亲子
本地
时尚
公开课

手机要闻

传骁龙8 Gen4 Adreno 830 GPU将采用改进的内存压缩算法以提高利用率和性能

亲子要闻

萌娃和爸爸斗智斗勇,最后竟然是小宝宝赢了。网友直呼这个小朋友太聪明了。

本地新闻

我和我的家乡|踏浪营口,心动不止一夏!

接下来几个月,比看赛事更有意思的是......

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版