re and automata | 软件认知

问题1: 如何简洁的定义语言

将语言定义用层次结构表示

可以用正则表达式生成一个string. 方法:重写正则表达式知道含有一个句子中只有字符生成过程中具有不确定性.

组成部分:

如何利用自动机接受字符串

string保有当前状态和和字符串的当前字符
以开始状态和字符串中第一个字符为开始
在每一步，将当前的字符和对应的转换匹配
直到到达字符串的末端或者匹配失败
如果结束时处于接受状态，自动机接受string.
NFA vs DFA

DFA: 每一个状态只有一个可能的状态转化 NFA:有可能有很多可能的转换: -. 同一个label有多个装换 -. 标记这空字符串的转换

Generative VS Recognition
re 给你一种方式去生成语言中所有的字符串
自动机给你一种方式去辨认特定的字符串
正则和自动机之间的关系 -. Philosophically very different -. thepretically equivalent 4.标准的方法:
当定义方法的时候使用正则
使用时利用自动机进行转换
re 向NFA装换

将re转换为不确定状态的自动机，采用递归的方式进行实现.
我们以一个可扩展的NFA用re作为输入边的标记.
然后我们不断的将那些以正则作为标识的边转换为以具体的字符为标识的边的转换.
具体过程如下图所示: