Go 入门指南 Go 入门指南
文档 GitHub
译者 GitHub
文档 GitHub
译者 GitHub
  • 前言
  • 学习 Go 语言

    • 第1章:Go 语言的起源,发展与普及

      • 1.1 起源与发展
      • 1.2 语言的主要特性与发展的环境和影响因素
    • 第2章:安装与运行环境

      • 2.1 平台与架构
      • 2.2 Go 环境变量
      • 2.3 在 Linux 上安装 Go
      • 2.4 在 Mac OS X 上安装 Go
      • 2.5 在 Windows 上安装 Go
      • 2.6 安装目录清单
      • 2.7 Go 运行时 (runtime)
      • 2.8 Go 解释器
    • 第3章:编辑器、集成开发环境与其它工具

      • 3.1 Go 开发环境的基本要求
      • 3.2 编辑器和集成开发环境
      • 3.3 调试器
      • 3.4 构建并运行 Go 程序
      • 3.5 格式化代码
      • 3.6 生成代码文档
      • 3.7 其它工具
      • 3.8 Go 性能说明
      • 3.9 与其它语言进行交互
  • 语言的核心结构与技术

    • 第4章:基本结构和基本数据类型

      • 4.1 文件名、关键字与标识符
      • 4.2 Go 程序的基本结构和要素
      • 4.3 常量
      • 4.4 变量
      • 4.5 基本类型和运算符
      • 4.6 字符串
      • 4.7 strings 和 strconv 包
      • 4.8 时间和日期
      • 4.9 指针
    • 第5章:控制结构
      • 5.1 if-else 结构
      • 5.2 测试多返回值函数的错误
      • 5.3 switch 结构
      • 5.4 for 结构
      • 5.5 break 与 continue
      • 5.6 标签与 goto
    • 第6章:函数(function)
      • 6.1 介绍
      • 6.2 函数参数与返回值
      • 6.3 传递变长参数
      • 6.4 defer 和追踪
      • 6.5 内置函数
      • 6.6 递归函数
      • 6.7 将函数作为参数
      • 6.8 闭包
      • 6.9 应用闭包:将函数作为返回值
      • 6.10 使用闭包调试
      • 6.11 计算函数执行时间
      • 6.12 通过内存缓存来提升性能
    • 第7章:数组与切片
      • 7.1 声明和初始化
      • 7.2 切片
      • 7.3 For-range 结构
      • 7.4 切片重组 (reslice)
      • 7.5 切片的复制与追加
      • 7.6 字符串、数组和切片的应用
    • 第8章:Map
      • 8.1 声明、初始化和 make
      • 8.2 测试键值对是否存在及删除元素
      • 8.3 for-range 的配套用法
      • 8.4 map 类型的切片
      • 8.5 map 的排序
      • 8.6 将 map 的键值对调
    • 第9章:包(package)
      • 9.1 标准库概述
      • 9.2 regexp 包
      • 9.3 锁和 sync 包
      • 9.4 精密计算和 big 包
      • 9.5 自定义包和可见性
      • 9.6 为自定义包使用 godoc
      • 9.7 使用 go install 安装自定义包
      • 9.8 自定义包的目录结构、go install 和 go test
      • 9.9 通过 Git 打包和安装
      • 9.10 Go 的外部包和项目
      • 9.11 在 Go 程序中使用外部库
    • 第10章:结构(struct)与方法(method)

      • 10.1 结构体定义
      • 10.2 使用工厂方法创建结构体实例
      • 10.3 使用自定义包中的结构体
      • 10.4 带标签的结构体
      • 10.5 匿名字段和内嵌结构体
      • 10.6 方法
      • 10.7 类型的 String() 方法和格式化描述符
      • 10.8 垃圾回收和 SetFinalizer
    • 第11章:接口(interface)与反射(reflection)

      • 11.1 接口是什么
      • 11.2 接口嵌套接口
      • 11.3 类型断言:如何检测和转换接口变量的类型
      • 11.4 类型判断:type-switch
      • 11.5 测试一个值是否实现了某个接口
      • 11.6 使用方法集与接口
      • 11.7 第一个例子:使用 Sorter 接口排序
      • 11.8 第二个例子:读和写
      • 11.9 空接口
      • 11.10 反射包
      • 11.11 Printf() 和反射
      • 11.12 接口与动态类型
      • 11.13 总结:Go 中的面向对象
      • 11.14 结构体、集合和高阶函数
  • Go 高级编程

    • 第12章:读写数据

      • 12.1 读取用户的输入
      • 12.2 文件读写
      • 12.3 文件拷贝
      • 12.4 从命令行读取参数
      • 12.5 用 buffer 读取文件
      • 12.6 用切片读写文件
      • 12.7 用 defer 关闭文件
      • 12.8 使用接口的实际例子:fmt.Fprintf
      • 12.9 JSON 数据格式
      • 12.10 XML 数据格式
      • 12.11 用 Gob 传输数据
      • 12.12 Go 中的密码学
    • 第13章:错误处理与测试

      • 13.1 错误处理
      • 13.2 运行时异常和 panic
      • 13.3 从 panic 中恢复 (recover)
      • 13.4 自定义包中的错误处理和 panicking
      • 13.5 一种用闭包处理错误的模式
      • 13.6 启动外部命令和程序
      • 13.7 Go 中的单元测试和基准测试
      • 13.8 测试的具体例子
      • 13.9 用(测试数据)表驱动测试
      • 13.10 性能调试:分析并优化 Go 程序
    • 第14章:协程 (goroutine) 与通道 (channel)

      • 14.1 并发、并行和协程
      • 14.2 协程间的信道
      • 14.3 协程的同步:关闭通道-测试阻塞的通道
      • 14.4 使用 select 切换协程
      • 14.5 通道、超时和计时器(Ticker)
      • 14.6 协程和恢复 (recover)
      • 14.7 新旧模型对比:任务和 worker
      • 14.8 惰性生成器的实现
      • 14.9 实现 Futures 模式
      • 14.10 复用
      • 14.11 限制同时处理的请求数
      • 14.12 链式协程
      • 14.13 在多核心上并行计算
      • 14.14 并行化大量数据的计算
      • 14.15 漏桶算法
      • 14.16 对 Go 协程进行基准测试
      • 14.17 使用通道并发访问对象
    • 第 15 章:网络、模板与网页应用

      • 15.1 tcp 服务器
      • 15.2 一个简单的 web 服务器
      • 15.3 访问并读取页面数据
      • 15.4 写一个简单的网页应用
      • 15.5 确保网页应用健壮
      • 15.6 用模板编写网页应用
      • 15.7 探索 template 包
      • 15.8 精巧的多功能网页服务器
      • 15.9 用 rpc 实现远程过程调用
      • 15.10 基于网络的通道 netchan
      • 15.11 与 websocket 通信
      • 15.12 用 smtp 发送邮件
  • 实际应用

    • 第16章:常见的陷阱与错误

      • 16.1 误用短声明导致变量覆盖
      • 16.2 误用字符串
      • 16.3 发生错误时使用 defer 关闭一个文件
      • 16.4 何时使用 new() 和 make()
      • 16.5 不需要将一个指向切片的指针传递给函数
      • 16.6 使用指针指向接口类型
      • 16.7 使用值类型时误用指针
      • 16.8 误用协程和通道
      • 16.9 闭包和协程的使用
      • 16.10 糟糕的错误处理
    • 第17章:模式

      • 17.1 逗号 ok 模式
      • 17.2 defer 模式
      • 17.3 可见性模式
      • 17.4 运算符模式和接口
    • 第18章:出于性能考虑的实用代码片段

      • 18.1 字符串
      • 18.2 数组和切片
      • 18.3 映射
      • 18.4 结构体
      • 18.5 接口
      • 18.6 函数
      • 18.7 文件
      • 18.8 协程 (goroutine) 与通道 (channel)
      • 18.9 网络和网页应用
      • 18.10 其他
      • 18.11 出于性能考虑的最佳实践和建议
    • 第19章:构建一个完整的应用程序

      • 19.1 简介
      • 19.2 短网址项目简介
      • 版本 1 - 数据结构和前端界面
      • 19.4 用户界面:web 服务端
      • 版本 2 - 添加持久化存储
      • 版本 3 - 添加协程
      • 版本 4 - 用 JSON 持久化存储
      • 版本 5 - 分布式程序
      • 19.9 使用代理缓存
      • 19.10 总结和增强
    • 第20章:Go 语言在 Google App Engine 的使用

      • 20.1 什么是 Google App Engine?
      • 20.2 云上的 Go
      • 20.3 安装 Go App Engine SDK:为 Go 部署的开发环境
      • 20.4 建造你自己的 Hello world 应用
      • 20.5 使用用户服务和探索其 API
      • 20.6 处理窗口
      • 20.7 使用数据存储
      • 20.8 上传到云端
    • 第21章:实世界中 Go 的使用

      • 21.1 Heroku:一个使用 Go 的高度可用一致数据存储
      • 21.2 MROffice:一个使用 Go 的呼叫中心网络电话 (VOIP) 系统
      • 21.3 Atlassian:一个虚拟机群管理系统
      • 21.4 Camilistore:一个可寻址内容存储系统
      • 21.5 Go 语言的其他应用

7.6 字符串、数组和切片的应用

7.6.1 从字符串生成字节切片

假设 s 是一个字符串(本质上是一个字节数组),那么就可以直接通过 c := []byte(s) 来获取一个字节的切片 c 。另外,您还可以通过 copy() 函数来达到相同的目的:copy(dst []byte, src string)。

同样的,还可以使用 for-range 来获得每个元素(Listing 7.13 — for_string.go):

package main

import "fmt"

func main() {
    s := "\u00ff\u754c"
    for i, c := range s {
        fmt.Printf("%d:%c ", i, c)
    }
}

输出:

0:ÿ 2:界

我们知道,Unicode 字符会占用 2 个字节,有些甚至需要 3 个或者 4 个字节来进行表示。如果发现错误的 UTF8 字符,则该字符会被设置为 U+FFFD 并且索引向前移动一个字节。和字符串转换一样,您同样可以使用 c := []int32(s) 语法,这样切片中的每个 int 都会包含对应的 Unicode 代码,因为字符串中的每次字符都会对应一个整数。类似的,您也可以将字符串转换为元素类型为 rune 的切片:r := []rune(s)。

可以通过代码 len([]int32(s)) 来获得字符串中字符的数量,但使用 utf8.RuneCountInString(s) 效率会更高一点。(参考 count_characters.go)

您还可以将一个字符串追加到某一个字节切片的尾部:

var b []byte
var s string
b = append(b, s...)

7.6.2 获取字符串的某一部分

使用 substr := str[start:end] 可以从字符串 str 获取到从索引 start 开始到 end-1 位置的子字符串。同样的,str[start:] 则表示获取从 start 开始到 len(str)-1 位置的子字符串。而 str[:end] 表示获取从 0 开始到 end-1 的子字符串。

7.6.3 字符串和切片的内存结构

在内存中,一个字符串实际上是一个双字结构,即一个指向实际数据的指针和记录字符串长度的整数(见图 7.4)。因为指针对用户来说是完全不可见,因此我们可以依旧把字符串看做是一个值类型,也就是一个字符数组。

字符串 string s = "hello" 和子字符串 t = s[2:3] 在内存中的结构可以用下图表示:

7.6.4 修改字符串中的某个字符

Go 语言中的字符串是不可变的,也就是说 str[index] 这样的表达式是不可以被放在等号左侧的。如果尝试运行 str[i] = 'D' 会得到错误:cannot assign to str[i]。

因此,您必须先将字符串转换成字节数组,然后再通过修改数组中的元素值来达到修改字符串的目的,最后将字节数组转换回字符串格式。

例如,将字符串 "hello" 转换为 "cello":

s := "hello"
c := []byte(s)
c[0] = 'c'
s2 := string(c) // s2 == "cello"

所以,您可以通过操作切片来完成对字符串的操作。

7.6.5 字节数组对比函数

下面的 Compare() 函数会返回两个字节数组字典顺序的整数对比结果,即 0 if a == b, -1 if a < b, 1 if a > b。

func Compare(a, b[]byte) int {
    for i:=0; i < len(a) && i < len(b); i++ {
        switch {
        case a[i] > b[i]:
            return 1
        case a[i] < b[i]:
            return -1
        }
    }
    // 数组的长度可能不同
    switch {
    case len(a) < len(b):
        return -1
    case len(a) > len(b):
        return 1
    }
    return 0 // 数组相等
}

7.6.6 搜索及排序切片和数组

标准库提供了 sort 包来实现常见的搜索和排序操作。您可以使用 sort 包中的函数 func Ints(a []int) 来实现对 int 类型的切片排序。例如 sort.Ints(arri),其中变量 arri 就是需要被升序排序的数组或切片。为了检查某个数组是否已经被排序,可以通过函数 IntsAreSorted(a []int) bool 来检查,如果返回 true 则表示已经被排序。

类似的,可以使用函数 func Float64s(a []float64) 来排序 float64 的元素,或使用函数 func Strings(a []string) 排序字符串元素。

想要在数组或切片中搜索一个元素,该数组或切片必须先被排序(因为标准库的搜索算法使用的是二分法)。然后,您就可以使用函数 func SearchInts(a []int, n int) int 进行搜索,并返回对应结果的索引值。

当然,还可以搜索 float64 和字符串:

func SearchFloat64s(a []float64, x float64) int
func SearchStrings(a []string, x string) int

您可以通过查看 官方文档 来获取更详细的信息。

这就是如何使用 sort 包的方法,我们会在第 11.7 节 对它的细节进行深入,并实现一个属于我们自己的版本。

7.6.7 append() 函数常见操作

我们在第 7.5 节提到的 append() 非常有用,它能够用于各种方面的操作:

  1. 将切片 b 的元素追加到切片 a 之后:a = append(a, b...)

  2. 复制切片 a 的元素到新的切片 b 上:

    b = make([]T, len(a))
    copy(b, a)
    
  3. 删除位于索引 i 的元素:a = append(a[:i], a[i+1:]...)

  4. 切除切片 a 中从索引 i 至 j 位置的元素:a = append(a[:i], a[j:]...)

  5. 为切片 a 扩展 j 个元素长度:a = append(a, make([]T, j)...)

  6. 在索引 i 的位置插入元素 x:a = append(a[:i], append([]T{x}, a[i:]...)...)

  7. 在索引 i 的位置插入长度为 j 的新切片:a = append(a[:i], append(make([]T, j), a[i:]...)...)

  8. 在索引 i 的位置插入切片 b 的所有元素:a = append(a[:i], append(b, a[i:]...)...)

  9. 取出位于切片 a 最末尾的元素 x:x, a = a[len(a)-1], a[:len(a)-1]

  10. 将元素 x 追加到切片 a:a = append(a, x)

因此,您可以使用切片和 append() 操作来表示任意可变长度的序列。

从数学的角度来看,切片相当于向量,如果需要的话可以定义一个向量作为切片的别名来进行操作。

如果您需要更加完整的方案,可以学习一下 Eleanor McHugh 编写的几个包:slices、chain 和 lists。

7.6.8 切片和垃圾回收

切片的底层指向一个数组,该数组的实际容量可能要大于切片所定义的容量。只有在没有任何切片指向的时候,底层的数组内存才会被释放,这种特性有时会导致程序占用多余的内存。

示例 函数 FindDigits() 将一个文件加载到内存,然后搜索其中所有的数字并返回一个切片。

var digitRegexp = regexp.MustCompile("[0-9]+")

func FindDigits(filename string) []byte {
    b, _ := ioutil.ReadFile(filename)
    return digitRegexp.Find(b)
}

这段代码可以顺利运行,但返回的 []byte 指向的底层是整个文件的数据。只要该返回的切片不被释放,垃圾回收器就不能释放整个文件所占用的内存。换句话说,一点点有用的数据却占用了整个文件的内存。

想要避免这个问题,可以通过拷贝我们需要的部分到一个新的切片中:

func FindDigits(filename string) []byte {
   b, _ := ioutil.ReadFile(filename)
   b = digitRegexp.Find(b)
   c := make([]byte, len(b))
   copy(c, b)
   return c
}

事实上,上面这段代码只能找到第一个匹配正则表达式的数字串。要想找到所有的数字,可以尝试下面这段代码:

func FindFileDigits(filename string) []byte {
   fileBytes, _ := ioutil.ReadFile(filename)
   b := digitRegexp.FindAll(fileBytes, len(fileBytes))
   c := make([]byte, 0)
   for _, bytes := range b {
      c = append(c, bytes...)
   }
   return c
}

练习 7.12 split_string.go

编写一个函数,要求其接受两个参数,原始字符串 str 和分割索引 i,然后返回两个分割后的字符串。

练习 7.13 string_split2.go

假设有字符串 str,那么 str[len(str)/2:] + str[:len(str)/2] 的结果是什么?

练习 7.14 string_reverse.go

编写一个程序,要求能够反转字符串,即将 "Google" 转换成 "elgooG"(提示:使用 []byte 类型的切片)。

如果您使用两个切片来实现反转,请再尝试使用一个切片(提示:使用交换法)。

如果您想要反转 Unicode 编码的字符串,请使用 []int32 类型的切片。

练习 7.15 Q29_uniq.go

编写一个程序,要求能够遍历一个字符数组,并将当前字符和前一个字符不相同的字符拷贝至另一个数组。

练习 7.16 bubblesort.go

编写一个程序,使用冒泡排序的方法排序一个包含整数的切片(算法的定义可参考 维基百科)。

练习 7.17 map_function.go

在函数式编程语言中,一个 map-function 是指能够接受一个函数原型和一个列表,并使用列表中的值依次执行函数原型,公式为:map ( F(), (e1,e2, . . . ,en) ) = ( F(e1), F(e2), ... F(en) )。

编写一个函数 mapFunc 要求接受以下 2 个参数:

  • 一个将整数乘以 10 的函数
  • 一个整数列表

最后返回保存运行结果的整数列表。

Last Updated:
Contributors: Mr.Fang
Prev
7.5 切片的复制与追加