现在让我们从0开始写一个解析器:
let dirs = []function parse(s) { return dirs}简单的变量
首先支持最简单的第一种,实例属性或方法,根据上面的对照,基本原封不动返回即可:
var str = ''var dirs = []var dir = {}var begin = 0var i = 0exports.parse = function (s) { str = s for (i = 0, l = str.length; i < l; i++) {} pushDir() return dirs}function pushDir () { dir.raw = str.slice(begin, i) dir.expression = str.slice(begin, i) dirs.push(dir)}可以看到完全就是为了得到目标值的一个多此一举的过程,下一步来支持逗号分隔的冒号表达式。
冒号表达式
先看就一个的情况,如a:b,遍历到的当前字符如果是冒号的话就把冒号之前的字符截取出来作为arg,冒号后的字符作为expression,begin变量是用来标志当前这个表达式的起点的,以是要截取冒号后的字符必要新增一个变量:
var str = ''var dirs = []var dir = {}var begin = 0var argIndex = 0 // ++var i = 0exports.parse = function (s) { str = s for (i = 0, l = str.length; i < l; i++) { // ++ c = str.charCodeAt(i) if (c === 0x3A) {// 冒号: dir.arg = str.slice(begin, i).trim() argIndex = i + 1 } } pushDir() return dirs}function pushDir () { dir.raw = str.slice(begin, i) dir.expression = str.slice(argIndex, i).trim()// ++ dirs.push(dir)}接下来支持存在逗号的情况,逗号相当于一个表达式的结束,以是要进行一次push,别的begin、argIndex、dir变量都必要重置:
exports.parse = function (s) { str = s for (i = 0, l = str.length; i < l; i++) { c = str.charCodeAt(i) if (c === 0x3A) {// 冒号: dir.arg = str.slice(begin, i).trim() argIndex = i + 1 } else if (c === 0x2C) {// 逗号, ++ pushDir() dir = {} begin = argIndex = i + 1 } } pushDir() return dirs}三元表达式
接下来支持三元表达式,目前会把三元表达式的冒号前后部分分离调,会输出类似下面的结果:
[ { "arg":"show ? true", "raw":"show ? true : false", "expression":"false" }]以是检查到冒号的时候我们要判断一下这是否是个三元表达式,是的话就不截取:
exports.parse = function (s) { str = s for (i = 0, l = str.length; i < l; i++) { c = str.charCodeAt(i) if (c === 0x3A) {// 冒号: ++ var arg = str.slice(begin, i).trim() if (/^[^\?]+$/.test(arg)) { dir.arg = arg argIndex = i + 1 } } else if (c === 0x2C) { pushDir() dir = {} begin = argIndex = i + 1 } } pushDir() return dirs}判断一下冒号之前的字符里是否存在?,存在的话就代表是三元表达式,则不进行分割。
看一个特殊情况:background-color: 'rgb(0,0,' + bg + ')'
目前会解析成:
[ { "arg":"background-color", "raw":"background-color: 'rgb(0", "expression":"'rgb(0" }, { "raw":"0", "expression":"0" }, { "raw":"' + bg + ')'", "expression":"' + bg + ')'" }]缘故原由就出在属性值里的逗号,如果属性值里存在逗号,那该属性值一定是被引号包围的,以是在单引号或双引号里的都要忽略,以是让我们新增两个变量来记录是否是在引号里:
var inDouble = false // ++var inSingle = false // ++如果出现第一个引号,把标志设为true,然后中间字符都直接跳过,直到出现闭合的引号,才退出继续其他的判断:
exports.parse = function (s) { str = s for (i = 0, l = str.length; i < l; i++) { c = str.charCodeAt(i) if (inDouble) {// 双引号还未闭合 ++ if (c === 0x22) {// 出现了闭合引号 inDouble = !inDouble } } else if (inSingle) {// 单引号还未闭合 ++ if (c === 0x27) {// 出现了闭合引号 inSingle = !inSingle } } else if (c === 0x3A) { // ... } else if (c === 0x2C) { // ... } else {// ++ switch (c) { // 初次出现引号设置标志位 case 0x22: inDouble = true; break // " case 0x27: inSingle = true; break // ' default: break; } } } pushDir() return dirs}数组或对象
数组或对象都必要原封不动的返回,因为带冒号和逗号目前都会被切割,对数组来说,字符都是被[]中括号包围的,以是在这区间的逗号要忽略掉,因为括号可能多重嵌套,以是增长一个变量来计数,出现左括号加1,出现右括号减1,为0就代表不在括号里:
var square = 0// ++exports.parse = function (s) { str = s for (i = 0, l = str.length; i < l; i++) { c = str.charCodeAt(i) if (inDouble) {} else if (inSingle) {} else if (c === 0x3A) {} else if (c === 0x2C && square === 0) {// ++ pushDir() dir = {} begin = argIndex = i + 1 } else { switch (c) { case 0x22: inDouble = true; break case 0x27: inSingle = true; break case 0x5B: square++; break // [ ++ case 0x5D: square--; break // ] ++ default: break; } } } pushDir() return dirs}对象也是类似,但是对象多了冒号,冒号也会被截掉,以是必要和三元表达式一样进行判断:
var curly = 0// ++exports.parse = function (s) { str = s for (i = 0, l = str.length; i < l; i++) { c = str.charCodeAt(i) if (inDouble) {} else if (inSingle) {} else if (c === 0x3A) { var arg = str.slice(begin, i).trim() if (/^[^\?\{]+$/.test(arg)) {// ++ 正则表达式修改,如果出现了{代表可能是对象 dir.arg = arg argIndex = i + 1 } } else if (c === 0x2C && square === 0 && curly === 0) {// ++ pushDir() dir = {} begin = argIndex = i + 1 } else { switch (c) { // ... case 0x7B: curly++; break // { ++ case 0x7D: curly--; break // } ++ default: break; } } } pushDir() return dirs}过滤器
末了来看过滤器,过滤器利用管道符|,以是遍历到这个字符时推入过滤器,过滤器支持多个,第一个字符串代表表达式,后续|分隔的各代表一个过滤器,当出现第一个|时只能获取到该过滤器所被应用的值,也就是expression的值,必要继续遍历才知道具体的过滤器,怎样判断是否是第一个|可以根据expression是否有值:
exports.parse = function (s) { for (i = 0, l = str.length; i < l; i++) { c = str.charCodeAt(i) // ... else if (c === 0x7C) {// 管道符| if (dir.expression === undefined) {// 第一次出现| dir.expression = str.slice(argIndex, i).trim()// 截取第一个|前的字符来作为表达式的值 } } // ... }}function pushDir () { dir.raw = str.slice(begin, i) if (dir.expression === undefined) {// ++ 这里也必要进行判断,如果有值代表已经被过滤器分支设置过了,这里就不必要设置 dir.expression = str.slice(argIndex, i).trim() } dirs.push(dir)}假设只有一个过滤器的话继续遍历会直到结束,结束后会再调一次pushDir方法,以是修改一下这个方法,进行一次过滤器网络处理:
function pushDir () { dir.raw = str.slice(begin, i) if (dir.expression === undefined) { dir.expression = str.slice(argIndex, i).trim() } else {// ++ 添加过滤器 pushFilter() } dirs.push(dir)}function pushFilter () { // 这里要截取的字符串应该是|后面的,begin和argIndex字段都用不了,以是必要新增一个变量}新增一个变量用于记录当前过滤器的起始位置:
var lastFilterIndex = 0 // ++exports.parse = function (s) { for (i = 0, l = str.length; i < l; i++) { c = str.charCodeAt(i) // ... else if (c === 0x7C) { if (dir.expression === undefined) { dir.expression = str.slice(argIndex, i).trim() } lastFilterIndex = i + 1// ++ } // ... }}因为过滤器支持带参数,参数和过滤器名之间用空格分隔,以是写一个正则来匹配一下:/[^\s'"]+|'[^']+'|"[^"]+"/g,参数除了是变量也可以是字符串,以是后面两个对引号的匹配是为了包管末了匹配的结果也是带引号的,否则:capitalize 'abc'和capitalize abc末了匹配出来的都是:["abc"],加上后面两个引号的匹配后则才是我们必要的:["'abc'"]。
function pushFilter() { var exp = str.slice(lastFilterIndex, i).trim() if (exp) { var tokens = exp.match(/[^\s'"]+|'[^']+'|"[^"]+"/g) var filter = {} filter.name = tokens[0] filter.args = tokens.length > 1 ? tokens.slice(1) : null dir.filters = dir.filters || [] dir.filters.push(filter) }}结果如下: