Deltamaster Tech Center

Scala List的协变特性——泛型上界与下界

先做一个简化的List定义，List对象由head（第一个元素）和tail（除了第一个元素以外所有后续元素组成的List）组成。Nil是空List对象，由于不论List的泛型类型是什么，空List的含义和行为都没有区别，因此全局只需要存在一个空List对象即Nil。

trait List[+T] {
  def isEmpty: Boolean
  def head: T
  def tail: List[T]
}
 
class Cons[T](val head: T, val tail: List[T]) extends List[T] {
  def isEmpty = false
}
 
object Nil extends List[Nothing] {
  def isEmpty: Boolean = true
  def head: Nothing = throw new NoSuchElementException("Nil.head")
  def tail: Nothing = throw new NoSuchElementException("Nil.tail")
}

这样就完成了List的定义。我们可以通过下面的方式来定义List对象了。

1 2	`val` `x:` `List[String]` `=` `Nil` `val` `ages:` `List[Int]` `=` `new` `Cons(16,` `new` `Cons(22, Nil))`

首先让我们注意一下Nil的定义，Nil这个单例对象所属的类，继承自List[Nothing]，为什么可以将List[String]类型的x定义为这个对象？因为泛型类型T是协变的，而Nothing在Scala中是所有其他类的子类。所以List[Nothing]就是List[String]的子类，根据Liskov替换原则，这样的定义是合法的。

下面，我们要像List类增加一个prepend方法，用来生成一个新List，这个新List是在原List头部新增一个元素：

trait List[+T] {
  // omit other methods
  def prepend(elem: T): List[T] = new Cons(elem, this)
}

但是这样的做法是无法通过编译的。为什么？正如上一篇博客所解释的，协变类型不能作为方法的参数类型。而这样的prepend操作看似是非常符合常理的，那么是Scala的这个规则设定不合理吗？

我们再回想一下Liskov替换原则。如果Bird是Animal的子类，那么List[Bird]就是List[Animal]的子类，那么如果List[Animal]可以prepend一个Animal类型的实例，List[Bird]也可以prepend一个Animal类型的实例，可惜按照上面的定义是不可能的，因此违反了Liskov替换原则，这样的定义是错误的。

为了解决这个问题，我们需要引入泛型类型的下界的概念。

trait List[+T] {
  // omit other methods
  def prepend[U >: T](elem: U): List[U] = new Cons(elem, this)
}

这个定义的含义是，prepend方法接受一个类型为U的参数，U必须是T或T的父类（“>:”表示泛型类型的下界，而“<:”则相应地表示上界），返回类型则是List[U]。拿Animal和Bird的例子，再假设Chicken是Bird的子类，那么根据这种定义，List[Bird]可以prepend一个Animal的实例，返回List[Animal]，而prepend一个Chicken的实例并非不允许，而是U类型不会是Chicken，必须将U类型至少提升至Bird，所以prepend一个Chicken的实例，结果是返回List[Bird]。这样的定义满足Liskov替换原则，所有可以对List[Animal]进行的操作，都可以对List[Bird]进行。

接下来再举一个例子，假设BaldEagle和CrownEagle都是Aeroplane的子类，而BaldEagle和CrownEagle没有关系。那么List[BaldEagle]如果prepend一个CrownEagle的实例会是什么结果呢？类型U不能是CrownEagle，而必须被向上提升直到U是BaldEagle或者BaldEagle的父类，因此U将被提升到Aeroplane，所以结果将是返回List[Aeroplane]。

这样，可以容易地推断出Scala对于泛型上下界的规定。

协变类型可以作为泛型类型的下界
逆变类型可以作为泛型类型的上界

Scala函数的泛型特性——逆变与协变

在Scala（以及其他许多编程语言）中，函数也是对象，可以使用、定义其他对象的地方，也可以使用、定义函数。Scala中的函数，具有apply方法的类的实例，就可以当做函数来使用。其中apply接受的参数就是函数的参数，而apply的返回值就是函数的返回值。

首先给出一个接受一个参数的函数的泛型定义。

trait Function1[-T, +U] {
  def apply(x: T): U
}

这种函数接受一个参数，参数类型为泛型类型T，返回类型为泛型类型U。和其他支持泛型的语言一样，实际定义函数时T和U的类型会被确定下来，不过需要注意的是，这边的T之前有一个“-”，而U之前有一个“+”。

在这里引入关于这个符号的说明，在声明Scala的泛型类型时，“+”表示协变，而“-”表示逆变。

C[+T]：如果A是B的子类，那么C[A]是C[B]的子类。
C[-T]：如果A是B的子类，那么C[B]是C[A]的子类。
C[T]：无论A和B是什么关系，C[A]和C[B]没有从属关系。

根据Liskov替换原则，如果A是B的子类，那么能适用于B的所有操作，都适用于A。让我们看看这边Function1的定义，是否满足这样的条件。假设Bird是Animal的子类，那么看看下面两个函数之间是什么关系：

1 2	`def` `f1(x:` `Bird):` `Animal` `// instance of Function1[Bird, Animal]` `def` `f2(x:` `Animal):` `Bird` `// instance of Function1[Animal, Bird]`

在这里f2的类型是f1的类型的子类。为什么？

我们先看一下参数类型，根据Liskov替换原则，f1能够接受的参数，f2也能接受。在这里f1接受的Bird类型，f2显然可以接受，因为Bird对象可以被当做其父类Animal的对象来使用。

再看返回类型，f1的返回值可以被当做Animal的实例使用，f2的返回值可以被当做Bird的实例使用，当然也可以被当做Animal的实例使用。

所以我们说，函数的参数类型是逆变的，而函数的返回类型是协变的。

那么我们在定义Scala类的时候，是不是可以随便指定泛型类型为协变或者逆变呢？答案是否定的。通过上面的例子可以看出，如果将Function1的参数类型定义为协变，或者返回类型定义为逆变，都会违反Liskov替换原则，因此，Scala规定，协变类型只能作为方法的返回类型，而逆变类型只能作为方法的参数类型。类比函数的行为，结合Liskov替换原则，就能发现这样的规定是非常合理的。

这种函数的泛型特性对于函数式编程非常有用。尽管C++的泛型在语法层面上不支持协变与逆变，但在C++11的function<U(T)>中，返回类型U和参数类型T也同样遵循与Scala相同的协变与逆变规则。

Deltamaster Tech Center

Scala集合的构建——基于集合的数学定义

Scala List的协变特性——泛型上界与下界

Scala函数的泛型特性——逆变与协变

deltamaster

搜索

分类

标签云

RSS

功能

链接

最新评论

最新留言