街角小林 发表于 2021-8-17 21:30:12

Vue0.11版本源码阅读系列四:详解指令值解析函数

需求

首先该版本的vue指令值支持一下几种类型以及通过dirParser.parse要返回的数据:
1.实例属性:message,解析后应为:
[    {      "raw":"message",      "expression":"message"    }]2.表达式:message === 'show',解析后应为:
[    {      "raw":"message === 'show'",      "expression":"message === 'show'"    }]3.三元表达式:show ? true : false,解析后应为:
[    {      "raw":"message === 'show' ? true : false",      "expression":"message === 'show' ? true : false"    }]4.设置元素类名、样式、属性、事件的:red:hasError,bold:isImportant,hidden:isHidden,解析后应为:
[    {"arg":"red","raw":"red: hasError","expression":"hasError"},    {"arg":"bold","raw":"bold: isImportant","expression":"isImportant"},    {"arg":"hidden","raw":"hidden: isHidden","expression":"isHidden"}]或者:top: top + 'px',left: left + 'px',background-color: 'rgb(0,0,' + bg + ')',解析后应为:
[    {"arg":"top","raw":"top: top + 'px'","expression":"top + 'px'"},    {"arg":"left","raw":"left: left + 'px'","expression":"left + 'px'"},    {"arg":"background-color","raw":"background-color: 'rgb(0,0,' + bg + ')'","expression":"'rgb(0,0,' + bg + ')'"}]5.双大括号插值的:{{partialId}},解析后应为:
[    {      "raw":"{{partialId}}",      "expression":"{{partialId}}"    }]6.指令值是数组或对象
应解析为:
[    {      "raw":"",      "expression":""    }]{arr: , value: 'abc'}应解析为:
[    {      "raw":"{arr: , value: 'abc'}",      "expression":"{arr: , value: 'abc'}"    }]7.过滤器:
message | capitalize应解析为:
[    {      "expression":"message",      "raw":"message | capitalize",      "filters":[            {                "name":"capitalize",                "args":null            }      ]    }]带参数的message | capitalize 4 5应解析为:
[    {      "expression":"message",      "raw":"message | capitalize 4 5",      "filters":[            {                "name":"capitalize",                "args":["4","5"]            }      ]    }]多个过滤器之间利用|进行分隔。
总结一下,就是如果是以逗号分隔的冒号表达式,则解析为:
[    {      arg: 【冒号前的字符】,      expression: 【冒号后的字符】,      raw: 【原始值】    },    ...]带过滤器的会多一个filters字段。
其他一律解析为:
[    {      expression: 【和原始值一样的值】,      raw: 【原始值】    }]实现

现在让我们从0开始写一个解析器:
let dirs = []function parse(s) {    return dirs}简单的变量

首先支持最简单的第一种,实例属性或方法,根据上面的对照,基本原封不动返回即可:
var str = &#39;&#39;var dirs = []var dir = {}var begin = 0var i = 0exports.parse = function (s) {str = sfor (i = 0, l = str.length; i < l; i++) {}pushDir()return dirs}function pushDir () {dir.raw = str.slice(begin, i)dir.expression = str.slice(begin, i)dirs.push(dir)}可以看到完全就是为了得到目标值的一个多此一举的过程,下一步来支持逗号分隔的冒号表达式。
冒号表达式

先看就一个的情况,如a:b,遍历到的当前字符如果是冒号的话就把冒号之前的字符截取出来作为arg,冒号后的字符作为expression,begin变量是用来标志当前这个表达式的起点的,以是要截取冒号后的字符必要新增一个变量:
var str = &#39;&#39;var dirs = []var dir = {}var begin = 0var argIndex = 0 // ++var i = 0exports.parse = function (s) {str = sfor (i = 0, l = str.length; i < l; i++) {    // ++    c = str.charCodeAt(i)    if (c === 0x3A) {// 冒号:      dir.arg = str.slice(begin, i).trim()      argIndex = i + 1    }}pushDir()return dirs}function pushDir () {dir.raw = str.slice(begin, i)dir.expression = str.slice(argIndex, i).trim()// ++dirs.push(dir)}接下来支持存在逗号的情况,逗号相当于一个表达式的结束,以是要进行一次push,别的begin、argIndex、dir变量都必要重置:
exports.parse = function (s) {str = sfor (i = 0, l = str.length; i < l; i++) {    c = str.charCodeAt(i)    if (c === 0x3A) {// 冒号:      dir.arg = str.slice(begin, i).trim()      argIndex = i + 1    } else if (c === 0x2C) {// 逗号, ++      pushDir()      dir = {}      begin = argIndex = i + 1    }}pushDir()return dirs}三元表达式

接下来支持三元表达式,目前会把三元表达式的冒号前后部分分离调,会输出类似下面的结果:
[    {      "arg":"show ? true",      "raw":"show ? true : false",      "expression":"false"    }]以是检查到冒号的时候我们要判断一下这是否是个三元表达式,是的话就不截取:
exports.parse = function (s) {str = sfor (i = 0, l = str.length; i < l; i++) {    c = str.charCodeAt(i)    if (c === 0x3A) {// 冒号: ++      var arg = str.slice(begin, i).trim()      if (/^[^\?]+$/.test(arg)) {      dir.arg = arg      argIndex = i + 1      }    } else if (c === 0x2C) {      pushDir()      dir = {}      begin = argIndex = i + 1    }}pushDir()return dirs}判断一下冒号之前的字符里是否存在?,存在的话就代表是三元表达式,则不进行分割。
看一个特殊情况:background-color: &#39;rgb(0,0,&#39; + bg + &#39;)&#39;
目前会解析成:
[    {      "arg":"background-color",      "raw":"background-color: &#39;rgb(0",      "expression":"&#39;rgb(0"    },    {      "raw":"0",      "expression":"0"    },    {      "raw":"&#39; + bg + &#39;)&#39;",      "expression":"&#39; + bg + &#39;)&#39;"    }]缘故原由就出在属性值里的逗号,如果属性值里存在逗号,那该属性值一定是被引号包围的,以是在单引号或双引号里的都要忽略,以是让我们新增两个变量来记录是否是在引号里:
var inDouble = false // ++var inSingle = false // ++如果出现第一个引号,把标志设为true,然后中间字符都直接跳过,直到出现闭合的引号,才退出继续其他的判断:
exports.parse = function (s) {str = sfor (i = 0, l = str.length; i < l; i++) {    c = str.charCodeAt(i)    if (inDouble) {// 双引号还未闭合 ++      if (c === 0x22) {// 出现了闭合引号      inDouble = !inDouble      }    } else if (inSingle) {// 单引号还未闭合 ++      if (c === 0x27) {// 出现了闭合引号      inSingle = !inSingle      }    } else if (c === 0x3A) {      // ...    } else if (c === 0x2C) {      // ...    } else {// ++      switch (c) {      // 初次出现引号设置标志位      case 0x22: inDouble = true; break // "      case 0x27: inSingle = true; break // &#39;            default:          break;      }    }}pushDir()return dirs}数组或对象

数组或对象都必要原封不动的返回,因为带冒号和逗号目前都会被切割,对数组来说,字符都是被[]中括号包围的,以是在这区间的逗号要忽略掉,因为括号可能多重嵌套,以是增长一个变量来计数,出现左括号加1,出现右括号减1,为0就代表不在括号里:
var square = 0// ++exports.parse = function (s) {str = sfor (i = 0, l = str.length; i < l; i++) {    c = str.charCodeAt(i)    if (inDouble) {}   else if (inSingle) {}   else if (c === 0x3A) {}   else if (c === 0x2C && square === 0) {// ++      pushDir()      dir = {}      begin = argIndex = i + 1    } else {      switch (c) {      case 0x22: inDouble = true; break         case 0x27: inSingle = true; break         case 0x5B: square++; break      // [ ++      case 0x5D: square--; break      // ] ++      default:          break;      }    }}pushDir()return dirs}对象也是类似,但是对象多了冒号,冒号也会被截掉,以是必要和三元表达式一样进行判断:
var curly = 0// ++exports.parse = function (s) {str = sfor (i = 0, l = str.length; i < l; i++) {    c = str.charCodeAt(i)    if (inDouble) {}   else if (inSingle) {}   else if (c === 0x3A) {      var arg = str.slice(begin, i).trim()      if (/^[^\?\{]+$/.test(arg)) {// ++ 正则表达式修改,如果出现了{代表可能是对象      dir.arg = arg      argIndex = i + 1      }    } else if (c === 0x2C && square === 0 && curly === 0) {// ++      pushDir()      dir = {}      begin = argIndex = i + 1    } else {      switch (c) {      // ...      case 0x7B: curly++; break         // { ++      case 0x7D: curly--; break         // } ++      default:          break;      }    }}pushDir()return dirs}过滤器

末了来看过滤器,过滤器利用管道符|,以是遍历到这个字符时推入过滤器,过滤器支持多个,第一个字符串代表表达式,后续|分隔的各代表一个过滤器,当出现第一个|时只能获取到该过滤器所被应用的值,也就是expression的值,必要继续遍历才知道具体的过滤器,怎样判断是否是第一个|可以根据expression是否有值:
exports.parse = function (s) {    for (i = 0, l = str.length; i < l; i++) {      c = str.charCodeAt(i)      // ...      else if (c === 0x7C) {// 管道符|            if (dir.expression === undefined) {// 第一次出现|                dir.expression = str.slice(argIndex, i).trim()// 截取第一个|前的字符来作为表达式的值            }      }      // ...    }}function pushDir () {    dir.raw = str.slice(begin, i)    if (dir.expression === undefined) {// ++ 这里也必要进行判断,如果有值代表已经被过滤器分支设置过了,这里就不必要设置      dir.expression = str.slice(argIndex, i).trim()    }    dirs.push(dir)}假设只有一个过滤器的话继续遍历会直到结束,结束后会再调一次pushDir方法,以是修改一下这个方法,进行一次过滤器网络处理:
function pushDir () {dir.raw = str.slice(begin, i)if (dir.expression === undefined) {    dir.expression = str.slice(argIndex, i).trim()} else {// ++ 添加过滤器    pushFilter()}dirs.push(dir)}function pushFilter () {    // 这里要截取的字符串应该是|后面的,begin和argIndex字段都用不了,以是必要新增一个变量}新增一个变量用于记录当前过滤器的起始位置:
var lastFilterIndex = 0 // ++exports.parse = function (s) {    for (i = 0, l = str.length; i < l; i++) {      c = str.charCodeAt(i)      // ...      else if (c === 0x7C) {            if (dir.expression === undefined) {                dir.expression = str.slice(argIndex, i).trim()            }            lastFilterIndex = i + 1// ++      }      // ...    }}因为过滤器支持带参数,参数和过滤器名之间用空格分隔,以是写一个正则来匹配一下:/[^\s&#39;"]+|&#39;[^&#39;]+&#39;|"[^"]+"/g,参数除了是变量也可以是字符串,以是后面两个对引号的匹配是为了包管末了匹配的结果也是带引号的,否则:capitalize &#39;abc&#39;和capitalize abc末了匹配出来的都是:["abc"],加上后面两个引号的匹配后则才是我们必要的:["&#39;abc&#39;"]。
function pushFilter() {var exp = str.slice(lastFilterIndex, i).trim()if (exp) {    var tokens = exp.match(/[^\s&#39;"]+|&#39;[^&#39;]+&#39;|"[^"]+"/g)    var filter = {}    filter.name = tokens    filter.args = tokens.length > 1 ? tokens.slice(1) : null    dir.filters = dir.filters || []    dir.filters.push(filter)}}结果如下:
https://p9.toutiaoimg.com/large/pgc-image/1e413b25e92a496d82936b31f4d8d60c
接下来支持一下多个过滤器的情况,多个过滤器,则会出现多个|,以是又会走到|的if分支,非第一次出现的话不必要修改expression的值,直接push当前遍历到的过滤器即可:
exports.parse = function (s) {    for (i = 0, l = str.length; i < l; i++) {      c = str.charCodeAt(i)      // ...      else if (c === 0x7C) {            if (dir.expression === undefined) {                dir.expression = str.slice(argIndex, i).trim()            } else {// 非第一次出现直接push ++               pushFilter()            }            lastFilterIndex = i + 1      }      // ...    }}结果如下:
https://p9.toutiaoimg.com/large/pgc-image/77bf6094eb534c559c6a6db4d83a9ba9
末了也看一种特殊情况,就是||的情况,这是或的意思,以是肯定不能解析为过滤器,在if条件里增长一下判断,排除当前遍历到的|前一个或后一个字符也是|的情况:
exports.parse = function (s) {    for (i = 0, l = str.length; i < l; i++) {      c = str.charCodeAt(i)      // ...      else if (c === 0x7C && str.charCodeAt(i - 1) !== 0x7C && str.charCodeAt(i + 1) !== 0x7C) {// ++             // ...      }      // ...    }}完成

到这里基本就完成了,完备代码如下:
var str = &#39;&#39;var dirs = []var dir = {}var begin = 0var argIndex = 0 var i = 0var inDouble = falsevar inSingle = falsevar square = 0var curly = 0var lastFilterIndex = 0function reset() {str = &#39;&#39;dirs = []dir = {}begin = 0argIndex = 0   i = 0inDouble = falseinSingle = falsesquare = 0curly = 0lastFilterIndex = 0}exports.parse = function (s) {reset()str = sfor (i = 0, l = str.length; i < l; i++) {    c = str.charCodeAt(i)    if (inDouble) {// 双引号还未闭合      if (c === 0x22) {// 出现了闭合引号      inDouble = !inDouble      }    } else if (inSingle) {// 单引号还未闭合      if (c === 0x27) {// 出现了闭合引号      inSingle = !inSingle      }    } else if (c === 0x3A) {// 冒号:      var arg = str.slice(begin, i).trim()      if (/^[^\?\{]+$/.test(arg)) {      dir.arg = arg      argIndex = i + 1      }    } else if (c === 0x2C && square === 0 && curly === 0) {// 逗号,      pushDir()      dir = {}      begin = argIndex = i + 1    } else if (c === 0x7C && str.charCodeAt(i - 1) !== 0x7C && str.charCodeAt(i + 1) !== 0x7C) {// 管道符|      if (dir.expression === undefined) {// 第一次出现|      dir.expression = str.slice(argIndex, i).trim()      } else {// 非第一次出现直接push      pushFilter()      }      lastFilterIndex = i + 1    } else {      switch (c) {      case 0x22: inDouble = true; break // "      case 0x27: inSingle = true; break // &#39;          case 0x5B: square++; break      // [      case 0x5D: square--; break      // ]      case 0x7B: curly++; break         // {      case 0x7D: curly--; break         // }      default:          break;      }    }}pushDir()return dirs}function pushDir () {dir.raw = str.slice(begin, i)if (dir.expression === undefined) {// ++ 这里也必要进行判断,如果有值代表已经被过滤器分支设置过了,这里就不必要设置    dir.expression = str.slice(argIndex, i).trim()} else {// ++ 添加过滤器    pushFilter()}dirs.push(dir)}function pushFilter() {var exp = str.slice(lastFilterIndex, i).trim()if (exp) {    var tokens = exp.match(/[^\s&#39;"]+|&#39;[^&#39;]+&#39;|"[^"]+"/g)    var filter = {}    filter.name = tokens    filter.args = tokens.length > 1 ? tokens.slice(1) : null    dir.filters = dir.filters || []    dir.filters.push(filter)}}把上面的代码替换掉vue源码里的相关代码,测试了一下基本用例是能跑通的,但是可能还会有其他一些特殊场景没有照顾到,更完善的代码请自行阅读vue源码。
页: [1]
查看完整版本: Vue0.11版本源码阅读系列四:详解指令值解析函数