文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

JS如何实现AST抽象语法树

2023-06-06 10:28

关注

小编给大家分享一下JS如何实现AST抽象语法树,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

前端中的AST抽象语法树问题

四则运算

首先明确,此次的代码都是基于LL的语法分析来实现的,实现的是四则混合运算的功能,先看下定义:
TokenNumber:
· 1 2 3 4 5 6 7 8 9 0 的组合
Operator:
+ - * / 之一
WhiteSpace:
<SP>
LineTerminator:
<LF> <CR>

看下产生式:
JS如何实现AST抽象语法树

正则表达式

我们首先实现正则表达式的匹配原则:

<script>    var regexp = /([0-9\.]+)|([ \t]+)|([\r\n]+)|(\*)|(\/)|(\+)|(\-)/g    var dictionary = ["Number", "Whitespace", "LineTerminator", "*", "/", "+", "-"];    function tokenize(source) {        var result = null;        while(true) {            result = regexp.exec(source);            if(!result) break;            for(var i = 1; i <= dictionary.length; i ++) {                if(result[i])                    console.log(dictionary[i - 1]);            }            console.log(result);        }    }    tokenize("1024 + 10 * 25");</script>

此时我们看一下页面的运行打印结果:
JS如何实现AST抽象语法树
值得一提的是这里用到了exec方法,exec() 方法用于检索字符串中的正则表达式的匹配。
我们看一下它的语法:
RegExpObject.exec(string)

如果 exec() 找到了匹配的文本,则返回一个结果数组。否则,返回 null。此数组的第 0 个元素是与正则表达式相匹配的文本,第 1 个元素是与 RegExpObject 的第 1 个子表达式相匹配的文本(如果有的话),第 2 个元素是与 RegExpObject 的第 2 个子表达式相匹配的文本(如果有的话),以此类推。除了数组元素和 length 属性之外,exec() 方法还返回两个属性。index 属性声明的是匹配文本的第一个字符的位置。input 属性则存放的是被检索的字符串 string。我们可以看得出,在调用非全局的 RegExp 对象的 exec() 方法时,返回的数组与调用方法 String.match() 返回的数组是相同的。

但是,当 RegExpObject 是一个全局正则表达式时,exec() 的行为就稍微复杂一些。它会在 RegExpObject 的 lastIndex 属性指定的字符处开始检索字符串 string。当 exec() 找到了与表达式相匹配的文本时,在匹配后,它将把 RegExpObject 的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。这就是说,您可以通过反复调用 exec() 方法来遍历字符串中的所有匹配文本。当 exec() 再也找不到匹配的文本时,它将返回 null,并把 lastIndex 属性重置为 0。

词法分析

我们在这一部分对上面的代码做优化。
首先是刚才提到的:
当 RegExpObject 是一个全局正则表达式时,exec() 的行为就稍微复杂一些。它会在 RegExpObject 的 lastIndex 属性指定的字符处开始检索字符串 string。当 exec() 找到了与表达式相匹配的文本时,在匹配后,它将把 RegExpObject 的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。
那么我们就要考虑到没有匹配上字符的情况,做一个判断处理:

<script>    var regexp = /([0-9\.]+)|([ \t]+)|([\r\n]+)|(\*)|(\/)|(\+)|(\-)/g    var dictionary = ["Number", "Whitespace", "LineTerminator", "*", "/", "+", "-"];    function* tokenize(source) {        var result = null;        var lastIndex = 0;        while(true) {            lastIndex = regexp.lastIndex;            result = regexp.exec(source);            if(!result) break;            if(regexp.lastIndex - lastIndex > result[0].length)                break;                        let token = {                type: null,                value: null            }            for(var i = 1; i <= dictionary.length; i ++) {                if(result[i])                    token.type = dictionary[i - 1];            }            token.value = result[0];            yield token        }        yield {            type: 'EOF'        }    }    for (let token of tokenize("1024 + 10 * 25")) {        console.log(token)    }</script>

如上,我们对regexp.lastIndex - lastIndexresult[0] 的长度进行比较,判断是否有字符串没有匹配上。
将整个函数改成generator函数的形式,我们看下运行的结果:
JS如何实现AST抽象语法树

语法分析

首先编写分块的产生式,我们看一下总的代码结构:

<script>    var regexp = /([0-9\.]+)|([ \t]+)|([\r\n]+)|(\*)|(\/)|(\+)|(\-)/g    var dictionary = ["Number", "Whitespace", "LineTerminator", "*", "/", "+", "-"];    function* tokenize(source) {        var result = null;        var lastIndex = 0;        while(true) {            lastIndex = regexp.lastIndex;            result = regexp.exec(source);            if(!result) break;            if(regexp.lastIndex - lastIndex > result[0].length)                break;                        let token = {                type: null,                value: null            }            for(var i = 1; i <= dictionary.length; i ++) {                if(result[i])                    token.type = dictionary[i - 1];            }            token.value = result[0];            yield token        }        yield {            type: 'EOF'        }    }    let source = [];    for(let token of tokenize("10 * 25")) {        if (token.type !== "Whitespace" && token.type !== "LineTerminator")            source.push(token);    }    function Expression(tokens) {    }    function AdditiveExpression(source){    }    function MultiplicativeExpresson(source) {        console.log(source);    }    MultiplicativeExpresson("10 * 25")</script>

我们先从MultiplicativeExpresson来进行研究,它分为四种情况:

function MultiplicativeExpresson(source) {//如果是数字则进行封装     if(source[0].type === "Number") {         let node = {             type: "MultiplicativeExpresson",             children:[source[0]]         }         source[0] = node;         return MultiplicativeExpresson(source)     }     //如果是乘号或者除号,则将三项出栈,进行重组     if(source[0].type === "MultiplicativeExpresson" && source[1] && source[1].type === "*") {         let node = {             type: "MultiplicativeExpresson",             operator: "*",             children: []         }         node.children.push(source.shift());         node.children.push(source.shift());         node.children.push(source.shift());         source.unshift(node);         return MultiplicativeExpresson(source)     }     if(source[0].type === "MultiplicativeExpresson" && source[1] && source[1].type === "/") {         let node = {             type: "MultiplicativeExpresson",             operator: "*",             children: []         }         node.children.push(source.shift());         node.children.push(source.shift());         node.children.push(source.shift());         source.unshift(node);         return MultiplicativeExpresson(source)     }     //递归结束的条件     if(source[0].type === "MultiplicativeExpresson")         return source[0];     return MultiplicativeExpresson(source); }

我们看一下当source为"10 * 25 / 2"时调用console.log(MultiplicativeExpresson(source))最后运行的结果:
JS如何实现AST抽象语法树
接下来看AdditiveExpression 本质上和MultiplicativeExpresson没有什么不同,差异点已经标注在代码当中了:

    function AdditiveExpression(source){        if(source[0].type === "MultiplicativeExpresson") {            let node = {                type: "AdditiveExpression",                children:[source[0]]            }            source[0] = node;            return AdditiveExpression(source)        }        //如果是乘号或者除号,则将三项出栈,进行重组        if(source[0].type === "AdditiveExpression" && source[1] && source[1].type === "+") {            let node = {                type: "AdditiveExpression",                operator: "+",                children: []            }            node.children.push(source.shift());            node.children.push(source.shift());            //考虑到第三个数可能时Number 需要在这里再次调用一下 MultiplicativeExpresson 做处理            MultiplicativeExpresson(source);            node.children.push(source.shift());            source.unshift(node);            return AdditiveExpression(source)        }        if(source[0].type === "AdditiveExpression" && source[1] && source[1].type === "-") {            let node = {                type: "AdditiveExpression",                operator: "-",                children: []            }            node.children.push(source.shift());            node.children.push(source.shift());            MultiplicativeExpresson(source);            node.children.push(source.shift());            source.unshift(node);            return AdditiveExpression(source)        }        //递归结束的条件        if(source[0].type === "AdditiveExpression")            return source[0];        //第一次进循环 调用        MultiplicativeExpresson(source);        return AdditiveExpression(source);    }

我们看一下当source为"10 * 25 / 2"时调用console.log(AdditiveExpression(source))最后运行的结果:
JS如何实现AST抽象语法树
那么Expression的代码逻辑就很好表达了:

function Expression(tokens) {     if(source[0].type === "AdditiveExpression" && source[1] && source[1].type === "EOF") {         let node = {             type: "Expression",             children: [source.shift(), source.shift()]         }         source.unshift(node);         return node;     }     AdditiveExpression(source);     return Expression(source); }

看下运行后的结果:
JS如何实现AST抽象语法树
以上就是所有的js解析抽象语法树的代码。

完整代码

<script>    var regexp = /([0-9\.]+)|([ \t]+)|([\r\n]+)|(\*)|(\/)|(\+)|(\-)/g    var dictionary = ["Number", "Whitespace", "LineTerminator", "*", "/", "+", "-"];    function* tokenize(source) {        var result = null;        var lastIndex = 0;        while(true) {            lastIndex = regexp.lastIndex;            result = regexp.exec(source);            if(!result) break;            if(regexp.lastIndex - lastIndex > result[0].length)                break;                        let token = {                type: null,                value: null            }            for(var i = 1; i <= dictionary.length; i ++) {                if(result[i])                    token.type = dictionary[i - 1];            }            token.value = result[0];            yield token        }        yield {            type: 'EOF'        }    }    let source = [];    for(let token of tokenize("10 * 25 / 2")) {        if (token.type !== "Whitespace" && token.type !== "LineTerminator")            source.push(token);    }    function Expression(tokens) {        if(source[0].type === "AdditiveExpression" && source[1] && source[1].type === "EOF") {            let node = {                type: "Expression",                children: [source.shift(), source.shift()]            }            source.unshift(node);            return node;        }        AdditiveExpression(source);        return Expression(source);    }    function AdditiveExpression(source){        if(source[0].type === "MultiplicativeExpresson") {            let node = {                type: "AdditiveExpression",                children:[source[0]]            }            source[0] = node;            return AdditiveExpression(source)        }        //如果是乘号或者除号,则将三项出栈,进行重组        if(source[0].type === "AdditiveExpression" && source[1] && source[1].type === "+") {            let node = {                type: "AdditiveExpression",                operator: "+",                children: []            }            node.children.push(source.shift());            node.children.push(source.shift());            //考虑到第三个数可能时Number 需要在这里再次调用一下 MultiplicativeExpresson 做处理            MultiplicativeExpresson(source);            node.children.push(source.shift());            source.unshift(node);            return AdditiveExpression(source)        }        if(source[0].type === "AdditiveExpression" && source[1] && source[1].type === "-") {            let node = {                type: "AdditiveExpression",                operator: "-",                children: []            }            node.children.push(source.shift());            node.children.push(source.shift());            MultiplicativeExpresson(source);            node.children.push(source.shift());            source.unshift(node);            return AdditiveExpression(source)        }        //递归结束的条件        if(source[0].type === "AdditiveExpression")            return source[0];        //第一次进循环 调用        MultiplicativeExpresson(source);        return AdditiveExpression(source);    }    function MultiplicativeExpresson(source) {        if(source[0].type === "Number") {            let node = {                type: "MultiplicativeExpresson",                children:[source[0]]            }            source[0] = node;            return MultiplicativeExpresson(source)        }        //如果是乘号或者除号,则将三项出栈,进行重组        if(source[0].type === "MultiplicativeExpresson" && source[1] && source[1].type === "*") {            let node = {                type: "MultiplicativeExpresson",                operator: "*",                children: []            }            node.children.push(source.shift());            node.children.push(source.shift());            node.children.push(source.shift());            source.unshift(node);            return MultiplicativeExpresson(source)        }        if(source[0].type === "MultiplicativeExpresson" && source[1] && source[1].type === "/") {            let node = {                type: "MultiplicativeExpresson",                operator: "*",                children: []            }            node.children.push(source.shift());            node.children.push(source.shift());            node.children.push(source.shift());            source.unshift(node);            return MultiplicativeExpresson(source)        }        //递归结束的条件        if(source[0].type === "MultiplicativeExpresson")            return source[0];        return MultiplicativeExpresson(source);    }    console.log(Expression(source))</script>

以上是“JS如何实现AST抽象语法树”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网行业资讯频道!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯