文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

java词法分析器DDL递归怎么应用

2023-07-02 17:53

关注

这篇文章主要讲解了“java词法分析器DDL递归怎么应用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“java词法分析器DDL递归怎么应用”吧!

intellij plugin

考虑到我们主要是用PyCharm开发,正好jetbrains也提供了SDK用于开发插件,所以UI层面可以不用额外考虑了。

使用流程很简单,只需要导入DDL语句就可以生成Python所需要的Model代码。

例如导入以下 DDL:

CREATE TABLE `user` (  `id` int(11) NOT NULL AUTO_INCREMENT,  `userName` varchar(20) DEFAULT NULL COMMENT '用户名',  `password` varchar(100) DEFAULT NULL COMMENT '密码',  `roleId` int(11) DEFAULT NULL COMMENT '角色ID',  PRIMARY KEY (`id`),  ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8

便会生成对应的 Python 代码:

class User(db.Model):    __tablename__ = 'user'    id = db.Column(db.Integer, primary_key=True, autoincrement=True)    userName = db.Column(db.String)  # 用户名    password = db.Column(db.String)  # 密码    roleId = db.Column(db.Integer)  # 角色ID

词法解析

仔细对比源文件及目标代码会很容易找出规律,无非就是解析出表名、字段、及字段的属性(是否为主键、类型、长度),最后再转换为Python所需要的模板即可。

在我动手之前我认为是非常简单的,无非就是解析字符串,但实际上手后发现不是那么回事;主要是有以下几个问题:

总结一句话,如何通过一系列规则识别出一段字符串中的关键信息,这同样也是 MySQL Server 所做的事情。

在开始真正解析 DDL 之前,先来看下一段简单的脚本如何解析:

x = 20

按照我们平时开发的经验,这条语句分为以下几部分:

所以我们对这段脚本的解析结果应当为:

VAR x

GE =

VAL 100

这个解析过程在编译原理中称为”词法解析“,可能大家听到编译原理这几个字就头大(我也是);对于刚才那段脚本我们可以编写一个非常简单的词法解析器生成这样的结果。

状态迁移

再开始之前先捋一下思路,可以看到上文的结果中通过VAR表示变量、GE表示赋值符号 ”=“、VAL表示赋值结果,现在需要重点记住这三个状态。

在依次读取字符解析时,程序就是在这几个状态中来回切换,如下图:

java词法分析器DDL递归怎么应用

java词法分析器DDL递归怎么应用

同理,当不满足这几个状态时候又会回到初始从而再次确认新的状态。

光看图有点抽象,直接来看核心代码:

public class Result{    public TokenType tokenType ;    public StringBuilder text = new StringBuilder();}

首先定义了一个结果类,收集最终的解析结果;其中的TokenType就对应了图中的三种状态,简单的用枚举值来表示。

public enum TokenType {    INIT,    VAR,    GE,    VAL}

首先对应到第一张图:初始化状态。

需要对当前解析的字符定义一个TokenType

java词法分析器DDL递归怎么应用

和图中描述的流程一致,判断当前字符给定一个状态即可。

接着对应到第二张图:状态之间的转换。

java词法分析器DDL递归怎么应用

会根据不同的状态进入不同的case,在不同的case中判断是否应当跳转到其他状态(进入INIT状态后会重新生成状态)。

举个例子:x = 20:

首选会进入VAR状态,接着下一个字符为空格,自然在 38 行中重新进入初始状态,导致再次确定下一个字符=进入GE状态。

当脚本为ab = 30:
第一个字符为 a 也是进入VAR状态,第二个字符为 b,依然为字母,所以进入 36 行,状态不会改变,同时将 b 这个字符追加进来;后续步骤就和上一个例子一致了。

多说无益,建议大家自己跑一下单测就会明白:

https://github.com/crossoverJie/sqlalchemy-transfer/blob/master/src/test/java/top/crossoverjie/plugin/core/lab/TestLexerTest.java

java词法分析器DDL递归怎么应用

java词法分析器DDL递归怎么应用

DDL 解析

简单的解析完成后来看看DDL这样的脚本应当如何解析:

CREATE TABLE `user` (  `id` int(11) NOT NULL AUTO_INCREMENT,  `userName` varchar(20) DEFAULT NULL COMMENT '用户名',  `password` varchar(100) DEFAULT NULL COMMENT '密码',  `roleId` int(11) DEFAULT NULL COMMENT '角色ID',  PRIMARY KEY (`id`),  ) ENGINE=InnoDB AUTO_INCREMENT=7 DEFAULT CHARSET=utf8

原理类似,首先还是要看出规律(也就是语法):

根据我们需要解析的数据种类,我这里定义了这个枚举:

java词法分析器DDL递归怎么应用

然后在初始化类型时进行判断赋值:

java词法分析器DDL递归怎么应用

由于需要解析的数据不少,所以这里的判断条件自然也就多了。

递归解析

针对于DDL的语法规则,我们这里还有需要有特殊处理的地方;比如解析具体字段信息时如何关联起来?

举个例子:

`userName` varchar(20) DEFAULT NULL COMMENT '用户名',`password` varchar(100) DEFAULT NULL COMMENT '密码',

这里我们解析出来的数据得有一个映射关系:

java词法分析器DDL递归怎么应用

所以我们只能一个字段的全部信息解析完成并且关联好之后才能解析下一个字段。

于是这里我采用了递归的方式进行解析(不一定是最好的,欢迎大家提出更优的方案)。

} else if (value == '`' && pStatus == Status.BASE_INIT) {    result.tokenType = DDLTokenType.FI;    result.text.append(value);}

当当前字符为 ”`“ 符号时,将状态置为 “FI”(FieldInfo),同时当解析到为 “,” 符号时便进入递归处理。

java词法分析器DDL递归怎么应用

可以理解为将这一段字符串单独提取出来处理:

`userName` varchar(20) DEFAULT NULL COMMENT '用户名',

接着再将这段字符递归调用当前方法再次进行解析,这时便按照字段名称、类型、长度、注释的规则解析即可。

同时既然存在递归,还需要将子递归的数据关联起来,所以我在返回结果中新增了一个pid的字段,这个也容易理解。

默认值为 0,一旦递归后便自增 +1,保证每次递归的数据都是唯一的。

用同样的方法在解析主键时也是先将整个字符串提取出来:

PRIMARY KEY (`id`)

只不过是 “P” 打头 “)” 结尾。

} else if (value == 'P' && pStatus == Status.BASE_INIT) {    result.tokenType = DDLTokenType.P_K;    result.text.append(value);}

java词法分析器DDL递归怎么应用

也是将整段字符串递归解析,再递归的过程中进行状态切换P_K ---> P_K_V最终获取到主键。

java词法分析器DDL递归怎么应用

所以通过对刚才那段DDL解析得到的结果如下:

java词法分析器DDL递归怎么应用

这样每个字段也通过了pid进行了区分关联。

所以现在只需要对这个词法解析器进行封装,便可以提供一个简单的API来获取表中的数据了。

java词法分析器DDL递归怎么应用

感谢各位的阅读,以上就是“java词法分析器DDL递归怎么应用”的内容了,经过本文的学习后,相信大家对java词法分析器DDL递归怎么应用这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     801人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     348人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     311人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     432人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     220人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯