使用正则表达式解析Url字符串

使用正则表达式解析Url字符串

前一段时间阿里笔试题目中考到了给出一串url字符串,要求将url中的信息解析成一个对象,当时没有细细的研究过正则所以用了最土的办法一点一点分割,后来面试的时候被面试官问起,所以决定回过来研究一下正则表达式。

function getUrlObject (url) {
    //首先解析整个字符串我们一点一点对应来看
    //第一个括号(\w+) \w匹配任意asc字符 +号代表一个或多个,这里就是匹配https或者http
    //([\w\.]+)匹配主机地址www.baidu.com
    //(\d+)匹配端口号
    //([\/\w\.]*)匹配url路径
    //(\?[^#]*)匹配query查询字符串
    //(\S*)匹配hash
    var regexp = /(\w+):\/\/([\w\.]+)\:?(\d+)?([\/\w\.]*)?(\?[^#]*)?#?(\S*)?/;
    var par = /(&?(\w*)=([^&]*))+/
    var mat = url.match(regexp);
    var ob = {};
    ob.source = mat[0];
    ob.protocol = mat[1];
    ob.host = mat[2];
    ob.port = mat[3] || '80';
    ob.path = mat[4];
    ob.query = mat[5] || '';
    ob.hash = mat[6] || '';
    ob.params = {};
    //用&分割查询字符串中的每一个参数
    var params = ob.query.split("&");
    for (var i = 0; i < params.length; i++) {
        if(params[i]!==''){
            //匹配每一个参数中的键和值。
            var par=params[i].match(/\??(\w+)=(\S+)/);
            // console.log(par);
            ob.params[par[1]]=par[2];
        }
    };
    return ob;
}
var url = "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=%E5%93%88%E5%93%88#top";
console.log(getUrlObject(url));

结果如下:

{ source: 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=%E5%93%88%E5%93%88#top',protocol: 'https',host: 'www.baidu.com',port: '80',path: '/s',query: '?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=%E5%93%88%E5%93%88',hash: 'top',params: { ie: 'utf-8',f: '8',rsv_bp: '0',rsv_idx: '1',tn: 'baidu',wd: '%E5%93%88%E5%93%88' } 
 }

相关文章

正则替换html代码中img标签的src值在开发富文本信息在移动端...
正则表达式
AWK是一种处理文本文件的语言,是一个强大的文件分析工具。它...
正则表达式是特殊的字符序列,利用事先定义好的特定字符以及...
Python界一名小学生,热心分享编程学习。
收集整理每周优质开发者内容,包括、、等方面。每周五定期发...