博客 / 詳情

返回

為什麼説Go的字符串類型不能修改

在接觸Go這麼語言,可能你經常會聽到這樣一句話。對於字符串不能修改,可能你很納悶,日常開發中我們對字符串進行修改也是很正常的,為什麼又説Go中的字符串不能進行修改呢?

本文就來通過實際案例給大家演示,為什麼Go中的字符串不能進行修改。

在演示這個問題之前,我們先對字符串類型的基礎知識做個大致的演示,這樣便於大家對問題的進一步瞭解。

本文已收錄Gitee、Github。分享Go、PHP、MySQL、Redis等等技術乾貨。推薦訪問Gitee,速度快並且能夠正常解析文檔中的圖片文件。

字符串定義

字符串是一種用來表示字符的數據類型。在使用時,使用" "將字符內容包含起來。例如下面的形式:

package main

import "fmt"

func main() {
    var str string = "Hello World!"
}

在Go中,字符串通常有三種定義方式:

// 第一種(全量定義)
var 變量名稱 string = "字符串內容"
// 類型推導
var 變量名稱 = "字符串內容"
// 短標記(只適用於局部變量)
變量名稱 := "字符串內容"
字符串的定義,其實也可以通過字節的方式。這裏羅列的方式是最為常見的方式。

字符串的組成

Go中的字符串符合Unicode標準,並且採用UTF-8編碼。字符串底層其實也是由byte組成(後面會仔細講解)。通過下面的示例,打印查看具體的字節內容:

s := "Hello World!"
for _, v := range s {
    fmt.Print(v)
    fmt.Print("\t")
}
// 72 101 108 108 111 32 87 111 114 108 100 33
上面代碼打印的內容,就是每一個字符所表示的字節碼。

字符串不能修改

通過上面的大致演示,我們對字符串有一個基本的瞭解。對於字符串不能修改,可能你很納悶,日常開發中我們對字符串進行重新賦值也是很正常的,為什麼又説Go中的字符串不能進行修改呢?

其實這裏要糾正這個説話,對於字符串修改並不等價於重新賦值。開發中常用的方式,其實是一種重新賦值的概念。

str := "Hello World!"
// 重新賦值
str = "Hello Go!"
// 字符串修改
str[0] = "I"
通常聽到的不能修改,其實就是指的上面代碼的第二種方式。並且通過這種方式修改會報錯::cannot assign to s[0] (value of type byte)

迴歸正題,為什麼Go中的字符串不能通過下標的方式來進行修改呢?
這是因為Go中的字符串的數據結構體是由一個指針和長度組成的結構體,該指針指向的一個切片才是真正的字符串值。Go中源碼有這樣一段定義:

type stringStruct struct {
    str unsafe.Pointer // 指向一個byte類型的切片指針
    len int // 字符串的長度
}

正是因為底層是一個[]byte類型的切片,當我們使用下標的方式去修改值,這時候將一個字符內容賦值給byte類型,肯定是不允許的。但是我們可以通過下標的方式去訪問對應的byte值。

fmt.Println(s[0]) // output:72

那我們要想通過下標的方式去修改值該怎麼辦呢?這時候,就需要通過切片的方式來定義,然後在轉成字符串。

package main

import (  
    "fmt"
)

func main() {  
     s1 := []byte{72, 101, 108, 108, 111, 32, 87, 111, 114, 108, 100, 33}
    fmt.Println(string(s1))
    // 將"H"修改為l
    s1[0] = 108
    fmt.Println(string(s1))
}
// output:
Hello World!
lello World!

字符串的賦值

上面分析了為什麼字符串不能使用下標去賦值,回過來解答一下日常開發中的賦值方式。

package main

import (  
    "fmt"
)

func main() {
    // 聲明一個字符串,並給與初始值
    s := "Hello World!"
    // 對變量 s 進行重新賦值
    s := "Hello Go!"
}

那為什麼這種場景下又可以給字符串重新賦值呢?
這是因為,在Go的底層其實是新創建了一個[]byte{}類型的切片,將變量s中的指針指向了新的內存空間地址(也就是這裏的Hello Go!)。原有的Hello World!內存空間會隨着垃圾回收機制被回收掉。

為什麼這麼設計

可能大家都會考慮到,為什麼一個普通的字符串要設計這麼複雜,還需要使用指針。暫時沒找到官方文檔的説明,

  1. 個人猜想,當遇到一個非常長的字符時,這樣做使得string變得非常輕量,可以很方便的進行傳遞而不用擔心內存拷貝。雖然在Go中,不管是引用類型還是值類型參數傳遞都是值傳遞。但指針明顯比值傳遞更節省內存。
user avatar yinggaozhen 頭像 xushuhui 頭像 beverly0 頭像 mudeshu 頭像 astraw99 頭像 zhujiu 頭像
6 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.