深入理解 go reflect - 反射基本原理
反射概述
反射是这样一种机制,它是可以让我们在程序运行时(runtime)访问、检测和修改对象本身状态或行为的一种能力。
比如,从一个变量推断出其类型信息、以及存储的数据的一些信息,又或者获取一个对象有什么方法可以调用等。
反射经常用在一些需要同时处理不同类型变量的地方,比如序列化、反序列化、ORM
等等,如标准库里面的 json.Marshal。
反射基础 - go 的 interface 是怎么存储的?
在正式开始讲解反射之前,我们有必要了解一下 go
里的接口(interface)是怎么存储的。
关于这个问题,在我的另外一篇文章中已经做了很详细的讲解 go
interface 设计与实现, 这里不再赘述。但还是简单说一下,go
的接口是由两部分组成的,一部分是类型信息,另一部分是数据信息,如:
1 | var a = 1 |
对于这个例子,b 的类型信息是
int,数据信息是 1,这两部分信息都是存储在
b 里面的。b 的内存结构如下:
在上图中,b 的类型实际上是
eface,它是一个空接口,它的定义如下:
1 | type eface struct { |
也就是说,一个 interface{} 中实际上既包含了变量的类型信息,也包含了类型的数据。 正因为如此,我们才可以通过反射来获取到变量的类型信息,以及变量的数据信息。
反射对象 - reflect.Type 和 reflect.Value
知道了 interface{}
的内存结构之后,我们就可以开始讲解反射了。反射的核心是两个对象,分别是
reflect.Type 和 reflect.Value。 它们分别代表了
go 语言中的类型和值。我们可以通过 reflect.TypeOf 和
reflect.ValueOf 来获取到一个变量的类型和值。
1 | var a = 1 |
我们去看一下 TypeOf 和 ValueOf
的源码会发现,这两个方法都接收一个 interface{}
类型的参数,然后返回一个 reflect.Type 和
reflect.Value 类型的值。这也就是为什么我们可以通过
reflect.TypeOf 和 reflect.ValueOf
来获取到一个变量的类型和值的原因。
反射定律
在 go 官方博客中关于反射的文章 laws-of-reflection 中,提到了三条反射定律:
- 反射可以将
interface类型变量转换成反射对象。 - 反射可以将反射对象还原成
interface对象。 - 如果要修改反射对象,那么反射对象必须是可设置的(
CanSet)。
关于这三条定律,官方博客已经有了比较完整的阐述,感兴趣的可以去看一下官方博客的文章。这里简单阐述一下:
反射可以将
interface 类型变量转换成反射对象。
其实也就是上面的 reflect.Type 和
reflect.Value,我们可以通过 reflect.TypeOf 和
reflect.ValueOf 来获取到一个变量的反射类型和反射值。
1 | var a = 1 |
反射可以将反射对象还原成
interface 对象。
我们可以通过 reflect.Value.Interface 来获取到反射对象的
interface 对象,也就是传递给 reflect.ValueOf
的那个变量本身。 不过返回值类型是
interface{},所以我们需要进行类型断言。
1 | i := valueOfA.Interface() |
如果要修改反射对象,那么反射对象必须是可设置的(CanSet)。
我们可以通过 reflect.Value.CanSet
来判断一个反射对象是否是可设置的。如果是可设置的,我们就可以通过
reflect.Value.Set 来修改反射对象的值。
这其实也是非常场景的使用反射的一个场景,通过反射来修改变量的值。
1 | var x float64 = 3.4 |
那什么情况下一个反射对象是可设置的呢?前提是这个反射对象是一个指针,然后这个指针指向的是一个可设置的变量。
在我们传递一个值给 reflect.ValueOf
的时候,如果这个值只是一个普通的变量,那么 reflect.ValueOf
会返回一个不可设置的反射对象。
因为这个值实际上被拷贝了一份,我们如果通过反射修改这个值,那么实际上是修改的这个拷贝的值,而不是原来的值。
所以 go 语言在这里做了一个限制,如果我们传递进
reflect.ValueOf
的变量是一个普通的变量,那么在我们设置反射对象的值的时候,会报错。
所以在上面这个例子中,我们传递了 x
的指针变量作为参数。这样,运行时就可以找到 x 本身,而不是
x 的拷贝,所以就可以修改 x 的值了。
但同时我们也注意到了,在上面这个例子中,v.CanSet()
返回的是 false,而 v.Elem().CanSet() 返回的是
true。 这是因为,v 是一个指针,而
v.Elem()
是指针指向的值,对于这个指针本身,我们修改它是没有意义的,我们可以设想一下,
如果我们修改了指针变量(也就是修改了指针变量指向的地址),那会发生什么呢?那样我们的指针变量就不是指向
x 了, 而是指向了其他的变量,这样就不符合我们的预期了。所以
v.CanSet() 返回的是 false。
而 v.Elem().CanSet() 返回的是
true。这是因为 v.Elem() 才是 x
本身,通过 v.Elem() 修改 x
的值是没有问题的。
Elem 方法
不知道有多少读者和我一样,在初次使用 go 的反射的时候,被
Elem 这个方法搞得一头雾水。 Elem
方法的作用是什么呢?在回答这个问题之前,我们需要明确一点:reflect.Value
和 reflect.Type 这两个反射对象都有 Elem
方法,既然是不同的对象,那么它们的作用自然是不一样的。
reflect.Value 的 Elem 方法
reflect.Value 的 Elem
方法的作用是获取指针指向的值,或者获取接口的动态值。也就是说,能调用
Elem 方法的反射对象,必须是一个指针或者一个接口。
在使用其他类型的 reflect.Value 来调用 Elem
方法的时候,会 panic:
1 | var a = 1 |
对于指针很好理解,其实作用类似解引用。而对于接口,还是要回到
interface 的结构本身,因为接口里包含了类型和数据本身,所以
Elem 方法就是获取接口的数据部分(也就是 iface
或 eface 中的 data 字段)。
指针类型:
接口类型:
reflect.Type 的 Elem 方法
reflect.Type 的 Elem
方法的作用是获取数组、chan、map、指针、切片关联元素的类型信息,也就是说,对于
reflect.Type 来说, 能调用 Elem
方法的反射对象,必须是数组、chan、map、指针、切片中的一种,其他类型的
reflect.Type 调用 Elem 方法会
panic。
示例:
1 | t1 := reflect.TypeOf([3]int{1, 2, 3}) // 数组 [3]int |
需要注意的是,如果我们要获取 map 类型 key 的类型信息,需要使用
Key 方法,而不是 Elem 方法。
1 | m := make(map[string]string) |
Interface 方法
这也是非常常用的一个方法,reflect.Value 的
Interface
方法的作用是获取反射对象的动态值。
也就是说,如果反射对象是一个指针,那么 Interface
方法会返回指针指向的值。
简单来说,如果 var i interface{} = x,那么
reflect.ValueOf(x).Interface() 就是 i
本身,只不过其类型是 interface{} 类型。
Kind
说到反射,不得不提的另外一个话题就是 go 的类型系统,对于开发者来说,我们可以基于基本类型来定义各种新的类型,如:
1 | // Kind 是 int |
但是不管我们定义了多少种类型,在 go 看来都是下面的基本类型中的一个:
1 | type Kind uint |
也就是说,我们定义的类型在 go
的类型系统中都是基本类型的一种,这个基本类型就是 Kind。
也正因为如此,我们可以通过有限的
reflect.Type 的 Kind 来进行类型判断。
也就是说,我们在通过反射来判断变量的类型的时候,只需要枚举
Kind 中的类型,然后通过 reflect.Type 的
Kind 方法来判断即可。
Type 表示的是反射对象(Type 对象是某一个 Kind,通过 Kind() 方法可以获取 Type 的 Kind),Kind 表示的是 go 底层类型系统中的类型。
比如下面的例子:
1 | func display(path string, v reflect.Value) { |
我们在开发的时候非常常用的结构体,在 go 的类型系统中,通通都是
Struct这种类型的。
addressable
go 反射中最后一个很重要的话题是 addressable。在 go
的反射系统中有两个关于寻址的方法:CanAddr 和
CanSet。
CanAddr
方法的作用是判断反射对象是否可以寻址,也就是说,如果
CanAddr 返回 true,那么我们就可以通过
Addr 方法来获取反射对象的地址。 如果 CanAddr
返回 false,那么我们就不能通过 Addr
方法来获取反射对象的地址。对于这种情况,我们就无法通过反射对象来修改变量的值。
但是,CanAddr 是 true 并不是说
reflect.Value 一定就能修改变量的值了。
reflect.Value 还有一个方法 CanSet,只有
CanSet 返回
true,我们才能通过反射对象来修改变量的值。
那么 CanAddr 背后的含义是什么呢?它意味着我们传递给
reflect.ValueOf 的变量是不是可以寻址的。
也就是说,我们的反射值对象拿到的是不是变量本身,而不是变量的副本。
如果我们是通过 &v 这种方式来创建反射对象的,那么
CanAddr 就会返回 true, 反之,如果我们是通过
v 这种方式来创建反射对象的,那么 CanAddr
就会返回 false。
如果想更详细的了解可以参考一下鸟窝的这篇文章 go addressable 详解。
获取类型信息 - reflect.Type
概述
reflect.Type 是一个接口,它代表了一个类型。我们可以通过
reflect.TypeOf 来获取一个类型的 reflect.Type
对象。 我们使用 reflect.Type
的目的通常是为了获取类型的信息,比如类型是什么、类型的名称、类型的字段、类型的方法等等。
又或者最常见的场景:结构体中的 json 的
tag,它是没有语义的,它的作用就是为了在序列化的时候,生成我们想要的字段名。
而这个 tag 就是需要通过反射来获取的。
通用的 Type 方法
在 go 的反射系统中,是使用 reflect.Type
这个接口来获取类型信息的。reflect.Type
这个接口有很多方法,下面这些方法是所有的类型通用的方法:
1 | // Type 是 Go 类型的表示。 |
某些类型特定的 Type 方法
下面是某些类型特定的方法,对于这些方法,如果我们使用的类型不对,则会
panic:
1 | type Type interface { |
创建 reflect.Type 的方式
我们可以通过下面的方式来获取变量的类型信息(创建
reflect.Type 的方式):
获取值信息 - reflect.Value
概述
reflect.Value 是一个结构体,它代表了一个值。 我们使用
reflect.Value
可以实现一些接收多种类型参数的函数,又或者可以让我们在运行时针对值的一些信息来进行修改。
常常用在接收 interface{}
类型参数的方法中,因为参数是接口类型,所以我们可以通过
reflect.ValueOf 来获取到参数的值信息。
比如类型、大小、结构体字段、方法等等。
同时,我们可以对这些获取到的反射值进行修改。这也是反射的一个重要用途。
reflect.Value 的方法
reflect.Value 这个 Sreuct
同样有很多方法:具体可以分为以下几类:
- 设置值的方法:
Set*:Set、SetBool、SetBytes、SetCap、SetComplex、SetFloat、SetInt、SetLen、SetMapIndex、SetPointer、SetString、SetUint。通过这类方法,我们可以修改反射值的内容,前提是这个反射值得是合适的类型。CanSet 返回 true 才能调用这类方法 - 获取值的方法:
Interface、InterfaceData、Bool、Bytes、Complex、Float、Int、String、Uint。通过这类方法,我们可以获取反射值的内容。前提是这个反射值是合适的类型,比如我们不能通过complex反射值来调用Int方法(我们可以通过Kind来判断类型)。 - map
类型的方法:
MapIndex、MapKeys、MapRange、MapSet。 - chan
类型的方法:
Close、Recv、Send、TryRecv、TrySend。 - slice
类型的方法:
Len、Cap、Index、Slice、Slice3。 - struct
类型的方法:
NumField、NumMethod、Field、FieldByIndex、FieldByName、FieldByNameFunc。 - 判断是否可以设置为某一类型:
CanConvert、CanComplex、CanFloat、CanInt、CanInterface、CanUint。 - 方法类型的方法:
Method、MethodByName、Call、CallSlice。 - 判断值是否有效:
IsValid。 - 判断值是否是
nil:IsNil。 - 判断值是否是零值:
IsZero。 - 判断值能否容纳下某一类型的值:
Overflow、OverflowComplex、OverflowFloat、OverflowInt、OverflowUint。 - 反射值指针相关的方法:
Addr(CanAddr为true才能调用)、UnsafeAddr、Pointer、UnsafePointer。 - 获取类型信息:
Type、Kind。 - 获取指向元素的值:
Elem。 - 类型转换:
Convert。
Len也适用于slice、array、chan、map、string类型的反射值。
创建 reflect.Value 的方式
我们可以通过下面的方式来获取变量的值信息(创建
reflect.Value 的方式):
总结
reflect包提供了反射机制,可以在运行时获取变量的类型信息、值信息、方法信息等等。- go 中的
interface{}实际上包含了两个指针,一个指向类型信息,一个指向值信息。正因如此,我们可以在运行时通过interface{}来获取变量的类型信息、值信息。 reflect.Type代表一个类型,reflect.Value代表一个值。通过reflect.Type可以获取类型信息,通过reflect.Value可以获取值信息。- 反射三定律:
- 反射可以将
interface类型变量转换成反射对象。 - 反射可以将反射对象还原成
interface对象。 - 如果要修改反射对象,那么反射对象必须是可设置的(
CanSet)。
- 反射可以将
reflect.Value和reflect.Type里面都有Elem方法,但是它们的作用不一样:reflect.Type的Elem方法返回的是元素类型,只适用于 array、chan、map、pointer 和 slice 类型的reflect.Type。reflect.Value的Elem方法返回的是值,只适用于接口或指针类型的reflect.Value。
- 通过
reflect.Value的Interface方法可以获取到反射对象的原始变量,但是是interface{}类型的。 Type和Kind都表示类型,但是Type是类型的反射对象,Kind是 go 类型系统中最基本的一些类型,比如int、string、struct等等。- 如果我们想通过
reflect.Value来修改变量的值,那么reflect.Value必须是可设置的(CanSet)。同时如果想要CanSet为 true,那么我们的变量必须是可寻址的。 - 我们有很多方法可以创建
reflect.Type和reflect.Value,我们需要根据具体的场景来选择合适的方法。 reflect.Type和reflect.Value里面,都有一部分方法是通用的,也有一部分只适用于特定的类型。如果我们想要调用那些适用于特定类型的方法,那么我们必须先判断reflect.Type或reflect.Value的类型(这里说的是Kind),然后再调用。