张逸说

出口成张,逸派胡言

0%

Scala的面向对象与函数编程

很难说FP和OO孰优孰劣,应该依场景合理选择使用。倘若从这个角度出发,Scala就体现出好处了,毕竟它同时支持了OO和FP两种设计范式。

从设计角度看,我认为OO更强调对象的自治,即每个对象承担自己应该履行的职责。倘若在编码实现时能遵循“自治”原则,就不容易设计出贫血对象出来。FP则更强调函数的分治,即努力保证函数的纯粹性和原子性,对一个大问题进行充分地分解,分别治理,然后再利用函数的组合性完成职责的履行,即所谓“通过增量组合建立抽象”。

需求

我最近正在编写的一个需求场景,正好完美地展现了这两种不同范式的设计威力。我要实现的是一个条件表达式树的验证和解析,这棵树的节点分为两种类型:

  • Condition Group
  • Condition

Condition Group作为根节点,可以递归嵌套Condition Group和Condition,如下图所示:

对条件表达式树的验证主要是避免出现非法节点,例如不支持的操作符,不符合要求的条件值,不合理的递归嵌套,空节点等。若验证不通过则需要提供错误信息,并返回给前端400的BadRequest。解析时,必须保证节点是合规的,解析后的结果为满足SQL语法中where条件子句的字符串。

验证

针对表达式数的合规性验证,我选择了FP的实现方式。为何做出这样的选择?试剖析整个验证行为,可以分解为如下的验证逻辑:

  • 对表达式树的验证
    • 对当前Condition节点的验证
      • 对操作符的验证
      • 对条件值的验证
    • 对当前Condition Group节点的验证
      • 对逻辑操作符的验证
      • 对子条件Size的验证

可以看到,分解出来的处于同一层次的验证逻辑,彼此之间是完全正交的,获得的结果互相不受影响。同时,这些“原子”的验证逻辑又可以组合起来,形成更高粒度的正交的验证,例如对Condition和Condition Group的验证,彼此独立,组合起来却又可以形成对整个表达式树的验证。

考虑函数的side effect,应尽量做到无副作用,这更选择选择FP的方式,且Scala自身提供了Try[T]类型,可以避免在函数中抛出具有副作用的异常。Try[T]是一个Monad,可以支持for comprehension对函数进行组合。

由于验证逻辑彼此正交,对函数的实现就变得非常纯粹而简单,不用考虑太多外在的因素。只要设计好函数的接口,函数可以专心做自己的事情。

对Condition当前节点的验证

对Condition的验证相对简单,只需要分别针对操作符和条件值进行验证即可。如下是代码实现:

trait ConditionValidator {
def validateCondition(condition: Condition): Try[Boolean] = {
for {
_ <- validateOperator(condition)
result <- validateValues(condition)
} yield result
}

def validateOperator(condition: Condition): Try[Boolean] = {
List("between", "in", "<", ">", "=", "<=", ">=", "<>").contains(condition.operator.toLowerCase) match {
case true => Success(true)
case false => Failure(new Throwable(s"can't support operator ${condition.operator}"))
}
}

def validateValues(condition: Condition): Try[Boolean] = {
val error = new Throwable(s"invalid values for condition ${condition}")
if (condition.values.isEmpty) return Failure(error)
if (condition.operator.isBetween && condition.values.size != 2) return Failure(error)
if (condition.operator.isCommon && condition.values.size != 1) return Failure(error)

Success(true)
}

implicit class StringOperator(operator: String) {
def isBetween: Boolean = operator.toLowerCase == "between"
def isIn: Boolean = operator.toLowerCase == "in"
def isCommon: Boolean = List("<", ">", "=", "<=", ">=", "<>").contains(operator.toLowerCase)
}
}

对ConditionGroup当前节点的验证

这里对ConditionGroup的验证仅仅针对当前节点,不用去考虑ConditionGroup的嵌套,那是对表达式树的验证,属于另一个层次。把这一职责的边界明确界定,代码实现就变得非常的简单:

trait ConditionGroupValidator {
def validateConditionGroup(group: ConditionGroup): Try[Boolean] = {
for {
_ <- validateLogicOperator(group)
result <- validateConditionSize(group)
} yield result
}

def validateConditionSize(group: ConditionGroup): Try[Boolean] = {
val error = new Throwable(s"invalid condition group for ${group}")
group.logicOperator.toLowerCase match {
case "not" => if (group.conditions.size == 1) Success(true) else Failure(error)
case _ => if (group.conditions.size >= 2) Success(true) else Failure(error)
}
}

def validateLogicOperator(group: ConditionGroup): Try[Boolean] = {
List("and", "or", "not").contains(group.logicOperator.toLowerCase()) match {
case true => Success(true)
case false => Failure(new Throwable(s"invalid logic operator ${group.logicOperator} for ConditionGroup"))
}
}
}

对表达式树的验证

对表达式树的验证相对复杂,因为牵涉到递归,尤其是从性能考虑,需要使用尾递归(tail recursion)。关于尾递归的知识,在我之前的博客《艾舍尔的画手与尾递归》中已有详细介绍,这里不再赘述。阅读下面的代码实现时,注意尾递归方法recurseValidate()的第二个参数,其实就是关键的accumulator。

trait CriteriaValidator extends ConditionValidator with ConditionGroupValidator {
def validate(group: ConditionGroup): Try[Boolean] = {
@tailrec
def recurseValidate(expr: List[ConditionExpression], result: Try[Boolean]): Try[Boolean] = {
val ex = new Throwable(s"invalid condition group ${group}")
expr match {
case Nil => Failure(ex)
case head::Nil => result.flatMap(_ => validateExpression(head))
case head::tail => recurseValidate(tail, validateExpression(head))
}
}
validateConditionGroup(group).flatMap(_ => recurseValidate(group.conditions, Success(true)))
}

def validateExpression(expr: ConditionExpression): Try[Boolean] = expr match {
case expr: ConditionGroup => validateConditionGroup(expr)
case expr: Condition => validateCondition(expr)
}
}

注意,在函数validate()中,实际上是验证ConditionGroup当前节点的函数validateConditionGroup()与尾递归方法recurseValidate()的组合。至于validateExpression()函数的引入,不过是为了避免不必要的类型判断和强制类型转换罢了。

解析

我最初也曾尝试依旧采用FP方式实现解析功能。思索良久,发现要实现起来困难重重。最主要的障碍在于:每个解析行为返回的结果都会影响到别的节点,进而影响整个表达式。例如,为了保证解析后where子句的语法合规,需要考虑为每个节点解析的结果添加小括号。当对整个表达式树进行递归解析时,每次返回的结果无法直接作为accumulator的值。如果在当前递归层添加了小括号,由于该层次下的子节点还未得到解析,就会导致小括号范围有误;如果不添加小括号,就无法界定各个层次逻辑子句的优先级,导致筛选结果不符合预期。换言之,其中的关键在于每个解析操作并非正交的,因此无法对函数进行“分治”的拆解。

倘若站在OO的角度去思考,则对条件表达式的解析,实际就是对各个节点的解析。由于解析行为需要的数据是各个节点对象已经具备的,遵循信息专家模式,就应该让节点对象自己来履行职责,这就是所谓的“对象的自治”。而从抽象层面进行分析,虽然各个节点拥有的数据不同,解析行为的实现也不尽相同,却都是在完成对自身的解析。于是,我们通过ConditionExpression完成对不同节点类型的抽象。此时,Condition Group是表达式树的枝节点,而Condition则是表达式树的叶子节点。如下图所示,不恰好是Composite模式的体现么?

我们首先需要定义ConditionExpression抽象。这里之所以定义为抽象类,而非trait,是为了支持Json解析的多态,与本文无关,这里不再解释。若希望了解,请阅读我的另一篇博客《在Scala项目中使用Spring Cloud》:

abstract class ConditionExpression {
def evaluate: String
}

作为枝节点的ConditionGroup,不仅要解析自身,还要负责解析嵌套的子节点。但是,父节点不用考虑解析子节点内部的实现,它仅仅是在合适的地方发起对子节点的调用就可以了。这才是真正的“自治”,也就是每个对象在理智上都保持对“权力的克制”,仅负责履行属于自己的职责,绝不越权。

case class ConditionGroup(logicOperator: String, conditions: List[ConditionExpression]) extends ConditionExpression {
def evaluate: String = {
logicOperator.toLowerCase match {
case "not" => s"(NOT ${conditions.head.evaluate})"
case _ => {
val expr = conditions.map(_.evaluate).reduce((l, r) => s"${l} ${logicOperator.toUpperCase} ${r}")
s"($expr)"
}
}
}
}

case class Condition(fieldName: String, operator: String, values: List[String], dataType: String) extends ConditionExpression {
def evaluate: String = {
def handleValue(value: String, dataType: String): String = {
dataType.toLowerCase match {
case "text" => s"'${value}'"
case "number" => value
case _ => value
}
}

val correctValues = values.map(v => handleValue(v, dataType))
val expr = operator.toLowerCase() match {
case "between" => s"BETWEEN ${correctValues.head} AND ${correctValues.last}"
case "in" => {
val range = correctValues.map(x => s"$x").mkString(",")
s"IN (${range})"
}
case _ => s"${operator.toUpperCase} ${correctValues.head}"
}
s"(${fieldName} ${expr})"
}
}

组合验证与解析

若采用自顶向下的设计方法来看待整个功能,则表达式树的验证与解析属于两个不同的职责,遵循“单一职责原则”,我们应该将其分离。在进行验证时,无需考虑解析的逻辑;在开始解析表达式树时,也无需负担验证合法性的包袱。分则简易,合则纠缠不清。只有进行了合理地“分治”后然后再组合,景色就大不相同了:

trait CriteriaParser extends CriteriaValidator {
def parse(group: ConditionGroup): Try[String] = {
validate(group).map(_ => group.evaluate)
}
}

结论

就我个人而言,我认为OO与FP并不是势如水火的天敌,也无需发出“既生瑜何生亮”的慨叹,非得比出胜负。本文的例子当然仅仅是冰山一角地体现了OO与FP各自的优势。善于面向对象思维的,不能抱残守缺,闭关自守。函数式思维的大潮挡不住,也不必视其为洪水猛兽,反而应该主动去拥抱。精通函数式编程的,也不必过于炫技,夸大函数式思维的重要性,就好似要“一统江湖”似的。

无论面向对象还是函数思维,用对了才是对的。谁也不是江湖永恒的霸主,青山依旧在,几度夕阳红!