node.js正则表达式获取网页中所有链接的代码实例


实现代码

复制代码 代码如下:

var http = require('http');

//定义函数
var getAHref = function(htmlstr){
    var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim;
    var arr = [];
    while(tem=reg.exec(htmlstr)){
        arr.push(tem[2]);
    }
    return arr;
}


var qHref = "http://xxx";//设置被查询的目标网址
    var req = http.get(qHref, function(res) {
    var pageData = "";
    res.setEncoding('utf8');
    res.on('error', function (errget) {
           //出错处理
    });
    res.on('data', function (chunk) {
           pageData += chunk;
    });

    res.on('end', function(){
          //console.dir(pageData);
          var content = pageData;//获取到网页内容
          var hrefs=getAHref(content);//获取链接

    });

});



相关阅读:
视频对比Win10 Mobile 10549与WP8.1运行速度
ASP.NET中使用开源组件NPOI快速导入导出Execl数据
AngularJS基础 ng-click 指令示例代码
数据库表的查询操作实践演练(实验三)
jQuery对val和atrr("value")赋值的区别介绍
Swing常用组件之多行文本区JTextArea
javascript中match函数的用法小结
win10 build 10120系统Edge截图曝光 现代感十足
Linux系统下 源码软件最简单的安装方法
Win10没有中文版怎么办?Win10切换到中文版的教程
SQL字符串处理函数大全
jQuery+CSS3折叠卡片式下拉列表框实现效果
jquery实现二级导航下拉菜单效果
借助FileReader实现将文件编码为Base64后通过AJAX上传
快速导航

Copyright © 2016 phpStudy |