主页 >> 程序猿的东西 >> 编译原理 2:为什么编程语言都没有阶乘运算符?

编译原理 2:为什么编程语言都没有阶乘运算符?

问题

昨天发布了一篇文章《编译原理极简入门:表达式求值》,我们用编译原理的方式实现了表达式求值。有一位朋友说,如何实现阶乘运算呢?我当时在地铁上,只是简单考虑阶乘这个优先级来说,应该是高于乘除法的,那么他应该被定义在 factor 里面。但是深入再想,发现问题并不简单。

首先尝试实现阶乘

在数学公式里面 n 的阶乘被表示为 n!,那么我们先考虑一下如何进化我们的 BNF 让他支持阶乘,之前我们的 BNF 是这样的:

factor => NUM | ( expression ) | -factor 

首先负数是没有阶乘的,直接排除 -factor 这个分支,那我们的阶乘 factor 可以这样进化:

factor => NUM | NUM! | ( expression ) | (expression)! | -factor 

为了简化问题,我们先实现 NUM! 感受一下会发生什么。

代码实现

def factor(i):
    if tokens[i].isdigit():
        i += 1
        if tokens[i] == '!':
            n = int(tokens[i])
            i += 1
            return i, factorial(n)
        return i+1, int(tokens[i])
    elif tokens[i] == "-":
        i += 1
        i, a = factor(i)
        return i, -1*a
    elif tokens[i] == "(":
        i += 1
        i, a = expression(i)
        if tokens[i] == ")":
            i += 1
            return i, a
        else:
            raise Exception("SyntaxError: near the '%s'"%(tokens[i]))
    else:
        raise Exception("SyntaxError: near the '%s'"%(tokens[i]))
# 计算阶乘
def factorial(n): 
    if n == 0: 
        return 1 
    else: 
        return n * factorial(n-1)

我们发现之前的函数里面,拿到 NUM 就可以直接返回了,现在要多一次判断。而这个 if 看似不起眼,实则影响巨大,他的出现使得 factor 这个函数的过程产生了回溯。说人话就是,正常情况拿完 NUM 就返回了,但因为阶乘这个后置的一元运算符,使得我们每次处理 + - * / 的时候都要拿出来看一看,如果是阶乘则由 factor 处理,如果不是,则会把这个符号放回待处理交给其他语法去处理。如果括号后面也允许阶乘的话,也要做同样的事情。阶乘作为一个冷门算符,如果为了支持这样一个算符而增加大量的回溯,就非常影响编译的效率了。

因此,所有主流的语言都不会实现后置的一元运算符,像阶乘这样的计算,应该用函数实现。