解读Node核心模块Stream系列一(Readable)

栏目: 数据库 · 发布时间: 6年前

内容简介：node中stream模块是非常，非常，非常重要的一个模块，因为很多模块都是这个模块封装的：由于node原码的可读流有将近一千行的代码，其中有大量的异常处理，debug调试，各种可读流的兼容处理，加码解码处理等，所以这里采取一个简化版的实现，源码中使用链表作为buffer，这里采用数组进行简化，主要是阐述可读流的处理过程。下面这个函数在Readable没有，但是在ReadStream中存在，这里为了利用fs读取操作说明流，简化实现版本上添加了这个方法，后面说明ReadStream模块和Readable的继

node中stream模块是非常，非常，非常重要的一个模块，因为很多模块都是这个模块封装的：

Readable：可读流，用来读取数据，比如 fs.createReadStream()。
Writable：可写流，用来写数据，比如 fs.createWriteStream()。
Duplex：双工流，可读+可写，比如 net.Socket()。
Transform：转换流，在读写的过程中，可以对数据进行修改，比如 zlib.createDeflate()（数据压缩/解压）。

node中流的实现：

node中stream是一个类，它继承自Event模块，所以可以通过事件订阅的方式来修改内部的状态或者调用外部的回调，我们可以从源码node/lib/internal/streams/legacy.js看到：

node中stream(node/lib/stream.js)包括了主要包括了四个部分：

lib/_stream_readable.js
lib/_stream_writable.js
lib/_stream_tranform.js
lib/_stream_duplex.js

Readble

Readble的例子

客户端上的 HTTP 响应
服务器上的 HTTP 请求
fs 读取的流
zlib 流
crypto 流
TCP socket
子进程 stdout 与 stderr
process.stdin

Readable的特点和简化实现：

特点

Readable拥有一个通过BufferList生成的缓存链表buffer，用来缓存读取到的chunk(对于非对象模式的流，数据块可以是字符串或 Buffer。对于对象模式的流，数据块可是除 null 以外的任意 JavaScript 值)，同时有一个length来记录buffer的长度
Readable拥有一个highWaterMark来标明buffer的最大容量，通过和length比较决定是否需要补充缓存
Readable订阅'readble'事件来触发read()消费者从缓存中消耗数据
Readable拥有read()从缓存区读取数据的同时也会根据标志判断是否调用生产者补充缓存区
Readable拥有reading来标明消费者正在消耗
Readable拥有howMatchToRead()来随时调整读取的大小，防止对buffer过多的读取，导致会读取乱码的部分
Readable拥有fromList()来根据读取大小的不同，随时调整buffer中的链表结构

由于node原码的可读流有将近一千行的代码，其中有大量的异常处理，debug调试，各种可读流的兼容处理，加码解码处理等，所以这里采取一个简化版的实现，源码中使用链表作为buffer，这里采用数组进行简化，主要是阐述可读流的处理过程。

构造函数

Readable拥有一个通过BufferList生成的缓存链表buffer，用来缓存读取到的chunk(对于非对象模式的流，数据块可以是字符串或 Buffer。对于对象模式的流，数据块可是除 null 以外的任意 JavaScript 值)，同时有一个length来记录buffer的长度
Readable拥有一个highWaterMark来标明buffer的最大容量，通过和length比较决定是否需要补充缓存
Readable订阅'readble'事件来触发read()消费者从缓存中消耗数据

const EE = require('events');
const util = require('util');
const fs = require('fs');

function Readable(path,options) {//这个参数是源码没有的，这里主要是为了读取fs为案例加的
    EE.call(this);//构造函数继承EventEmiter
    
    this.path = path;
    this.autoClose = options.autoClose || true;
    this.highWaterMark = options.highWaterMark || 64 * 1024;//64k
    this.encoding = options.encoding || null;
    this.flags = options.flags || 'r';//// 这个源码没有的，这里主要是为了fs读取案例加的
    this.needEmitReadable = false;// 需要触发readable事件，默认不需要
    this.position = 0;// 偏移量
    this.cache = []; // 缓存区
    this.reading = false;// 是否正在从缓存中读取，消费者消耗中
    this.length = 0; // 缓存区大小,控制长度
    this.open(); // 这个源码没有的，这里主要是为了fs读取案例加的
    this.on('newListener', (type) => {
        if (type === 'readable') { // 看一下是否是'readable'事件模式
            this.read();//消耗者，从buffer读取数据
        }
    })
}
util.inherits(Readable, EE);//原型继承EventEmiter
复制代码

下面这个函数在Readable没有，但是在ReadStream中存在，这里为了利用fs读取操作说明流，简化实现版本上添加了这个方法，后面说明ReadStream模块和Readable的继承关系

Readable.prototype.open = function(){//这里是异步打开的操作
    fs.open(this.path, this.flags, (err, fd) => {
        if (err) { // 销毁文件
            if (this.autoClose) { // 如果需要自动关闭触发一下销毁事件
                this.destroy(); // 它销毁文件
            }
            return this.emit('error', err);
        }
        this.fd = fd;
        this.emit('open', fd);
    });
}
//源码中的destory不是这样的，这里只是ReadStream中的destory，源码中做了各种可读流的兼容组合处理
Readable.prototype.destroy = function() {
    if (typeof this.fd != 'number') {
        this.emit('close');
    } else {
        fs.close(this.fd, () => {
            this.emit('close');
        })
    }
}
复制代码

read和_read

Readable拥有read()从缓存区读取数据的同时也会根据标志判断是否调用生产者补充缓存区
Readable拥有reading来标明消费者正在消耗
Readable拥有howMatchToRead()来随时调整读取的大小，防止对buffer过多的读取，导致会读取乱码的部分
Readable拥有fromList()来根据读取大小的不同，随时调整buffer中的链表结构

Readable.prototype.read = function(n) {
    let buffer = null;
    if(n>this.len){// 如果缓存区中有数据不够这次读取，则调整highWaterMark并且补充缓存区
        this.highWaterMark = computeNewHighWaterMark(n);//重新计算调整内存2的次方 exp: 5 => 8
        this.needEmitReadable = true;
        this.reading = true;
        this._read();
    }
    if (n > 0 && n < this.len) { // 如果缓存区中有数据够这次读取，则从缓存区中读取
        buffer = Buffer.alloc(n);
        let current;
        let index = 0;
        let flag = true;
        //这里的代码就是源码中fromList()的功能，对buffer进行调整，exp：123 456 789读取12 => 3 456 789
        while (flag && (current = this.cache.shift())) {//current是一个buffer
            for (let i = 0; i < current.length; i++) {
            buffer[index++] = current[i];//将缓存区中的chunk内容copy到buffer中
            if (index == n) {//n个数据读取完毕
                flag = false;
                this.length -= n; //缓存区长度更新
                let c = current.slice(i + 1);//获取完的chunk exp:123 => 3
                    if (c.length) { 
                        this.cache.unshift(c);//将没有取完的chunk放回 exp: 3
                    }
                    break;
                }
            }
        }
    }
    if(this.length === 0){//缓存中没有数据
        this.needEmitReadable = true; 需要触发'readable'
    }
    if (this.length < this.highWaterMark) {//缓存区没有满，补充缓存区
        this.reading = true;
        this._read();
    }
    return buffer;//read()返回值为一个buffer
}
//第一次读取是内置的自动读取到缓存区
//然后触发readable是从缓存区中读取消耗的同时，并且也会补充缓存区
Readable.prototype._read = function(n) {
    if (typeof this.fd !== 'number') {
        return this.once('open', () => this._read());//因为fs.open是异步函数，当执行read必须要在open之后
    }
    let buffer = Buffer.alloc(this.highWaterMark);
    
    //源码中通过Readable.prototype.push()调用readableAddChunk()再调用addChunk()
    //这里通过fs.read来调用addChunk(this,bytesRead)
    fs.read(this.fd, buffer, 0, buffer.length, this.pos, (err, bytesRead) => {
       addChunk(this,bytesRead);
    })
}

//源码中通过Readable.prototype.push()调用readableAddChunk()再调用addChunk()
function addChunk(stream, chunk) {
        stream.length += bytesRead; // 增加缓存的个数
        stream.position += bytesRead;//记录文件读取的位置
        stream.reading = false;
        stream.cache.push(buffer);//数据放入到缓存中
        if (stream.needEmitReadable) {
            stream.needEmitReadable = false;
            stream.emit('readable');
        }
}

//源码中这个函数是通过howMatchToRead()调用的，因为howMatchToRead()在其他的流中也会用到，所以兼容了其他情况
function computeNewHighWaterMark(n) {
    n--;
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    n++;
    return n;
}
复制代码

实例

const fs = require('fs');
const rs = fs.createReadStream('./1.txt',{//123456789
  flags:'r',
  autoClose:true,
  highWaterMark:3,
  encoding:null
});
rs.on('readable',function () { 
  // 如果缓存区没这么大会返回null
  let r = rs.read(1);
  console.log(r);
  console.log(rs._readableState.length);
  rs.read(1);
  setTimeout(() => {//因为补充是异步的
  console.log(rs._readableState.length);
  }, 1000);
});
复制代码

ReadStream

ReadStream和Readable的关系

ReadStream其实是Readable的子类，它继承了Readable，以fs.createReadStream为例(node/lib/internal/fs/streams.js)：

然后对上面的_read方法进行了覆盖但是其中调用了Readable.prototype.push()方法：

并且在其上扩展了open和close：

ReadStream的特点和简化实现：

特点

ReadStream拥有一个highWaterMark来标明读取数据的大小
ReadStream订阅'data'事件来触发read()消费者读取数据
ReadStream拥有paused 模式和flowing 模式，它们通过flowing标志进行控制：

readable.readableFlowing = null，没有提供消费流数据的机制，所以流不会产生数据。
readable.readableFlowing = true，监听'data'事件、调用readable.pipe()方法、或调用readable.resume()方法，会变成true可读流开始主动地产生数据触发事件。
readable.readableFlowing = false，调用readable.pause()、readable.unpipe()、或接收背压，会被设为false，暂时停止事件流动但不会停止数据的生成。

Readable拥有read()读取数据
ReadStream拥有howMatchToRead来随时调整读取的大小，防止读取乱码

简化实现

const EE = require('events');
const util = require('util');
const fs = require('fs');
function ReadStream (path,options) {
    this.path = path;
    this.flags = options.flags || 'r'; //用来标识打开文件的模式
    this.encoding = options.encoding || null;
    this.highWaterMark = options.highWaterMark || 64 * 1024;
    this.start = options.start || 0; //读取(文件)的开始位置
    this.end = options.end || null; //读取(文件)的结束位置
    this.autoClose = options.autoClose || true;
    this.flowing = null; // 默认非流动模式
    this.position = this.start // 记录读取数据的位置
    this.open(); // 打开文夹
    this.on('newListener', function (type) {
        if (type === 'data') { // 用户监听了data事件
            this.flowing = true;
            this.read();
        }
    })
}
ReadStream.prototype.read = function (){
    if (typeof this.fd !== 'number') {// open操作是异步的，所以必须等待文件打开this.fd存在说明打开文件
        return this.once('open', () => this.read());
    }
    let buffer = Buffer.alloc(this.highWaterMark); // 把数据读取到这个buffer中
    //判断每次读取的数据是多少exp:数据源1234567890 highWaterMark=3
    //最后一次读取长度为1
    let howMuchToRead = Math.min(this.end - this.pos + 1, this.highWaterMark);
    fs.read(this.fd, buffer, 0, howMuchToRead, this.position, (err, byteRead) => {
    if (byteRead > 0) {
        this.emit('data', buffer.slice(0, byteRead));
        this.position += byteRead;//更新读取的起点
        if (this.flowing) {//处在flowing模式中就一直读
            this.read();
        }
    }else{//读取完毕
        this.flowing = null;
        this.emit('end');
        if(this.autoClose){
            this.destroy();
        }
    }
}
//通过flowing控制暂停还是继续读取
ReadStream.prototype.pause = function(){
    this.flowing = false;
}
ReadStream.prototype.resume = function(){
    this.flowing = true;
    this.read();
}
ReadStream.prototype.destroy = function () {
    if (typeof this.fd != 'number') {
        this.emit('close');
    } else {
        fs.close(this.fd, () => {
        this.emit('close');
        })
    }
};

ReadStream.prototype.open = function() {
    fs.open(this.path, this.flags, (err, fd) => {// fd文件描述符 只要文件打开了就是number
        if (err) {
            if (this.autoClose) { // 如果需要自动关闭 触发一下销毁事件
            this.destroy(); // 销毁文件
        }
        return this.emit('error', err);
    }
    this.fd = fd;
    this.emit('open', fd);
    });
};
复制代码

实例

let fs = require('fs');
let ReadStream = require('./ReadStream')
let rs = fs.createReadStream('1.txt',{//1234567890
  encoding:null, 
  flags:'r+', 
  highWaterMark:3, 
  autoClose:true, 
  start:0, 
  end:3  
});
let arr = [];
rs.on('open',function () {
  console.log(' 文件开启了')
});
rs.on('data',function (data) {
  console.log(data);
  arr.push(data);
}); 
rs.on('end',function () { // 只有目标文件读取完毕后才触发
  console.log('结束了');
  console.log(Buffer.concat(arr).toString());
});
rs.pause()
setTimeout(function () {
    rs.resume(); // 恢复的是data事件的触发
},1000)
rs.on('error',function (err) {
  console.log('出错了')
})
rs.on('close',function () {
  console.log('close')
});
复制代码

结语：

希望这篇文章能够让各位看官对Stream熟悉，因为这个模块是node中的核心，很多模块都是继承这个模块实现的，如果熟悉了这个模块，对node的使用以及koa等框架的使用将大有好处，接下来会逐步介绍writable等流模式本文参考：

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

第二次机器革命

[美]埃里克·布莱恩约弗森 / 蒋永军 / 中信出版社 / 2014-9 / 59.80

“一本非常鼓舞人心的书！”——托马斯•L•弗里德曼《世界是平的》作者一场革命开始了！在《第二次机器革命》这本书中，埃里克•布莱恩约弗森和安德鲁•麦卡菲——这两位处于数字技术时代最前沿的思想家，向我们阐述了驱动我们经济和生活的发生变革的力量。他们认为，数字技术将会给我们带来难以想象的巨大变革：想象一下令人眩目的个人数字技术产品、一流的基础设施，都将会给我们带来极大的便利。数字技术（......一起来看看《第二次机器革命》这本书的介绍吧!

码农工具