内容简介:顺序不能变 :顺序改变,page.on() 监听事件将无法监听爬取数组url上的所有图片,并返回其真实宽高.
基本使用
'use strict'; const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch(); const page = await browser.newPage(); let imgArr = []; page.on('domcontentloaded', async () => { imgArr = await page.$$eval('img', img => { const arr = []; // 返回的是一个集合需要重新遍历 for (let i = 0; i < img.length; i++) { const obj = { width: img[i].width, naturalWidth: img[i].naturalWidth, height: img[i].height, naturalHeight: img[i].naturalHeight, isStandard: !((img[i].width * 10 <= img[i].naturalWidth || img[i].height * 10 <= img[i].naturalHeight)), url: img[i].src, level: 3, imageUrl: img[i].src, describeUrl: '', summary: `为了显示${img[i].width}x${img[i].height}的图片引入了原尺寸为${img[i].naturalWidth}x${img[i].naturalHeight}的图片`, }; if (obj.width && obj.height) { arr.push(obj); } } return arr; }); }); await page.goto('https://www.npmjs.com/package/puppeteer', { waitUntil: 'networkidle0' }); await browser.close(); console.log('imgArr: ', imgArr); })();
顺序不能变 :
- await puppeteer.launch() 启动
- await browser.newPage() 打开page
- page.on 监听事件
- await page.goto 跳转页面
- await browser.close() 关闭
顺序改变,page.on() 监听事件将无法监听
多个URL的使用方法
爬取数组url上的所有图片,并返回其真实宽高.
/* eslint-disable no-undef */ 'use strict'; const puppeteer = require('puppeteer'); (async () => { const browser = await puppeteer.launch(); const page = await browser.newPage(); let arr = []; const html = [ 'https://www.npmjs.com/package/puppeteer', 'https://www.iconfont.cn/search/index?searchType=icon&q=test' ]; for (let i = 0; i < html.length; i++) { await page.goto(html[i], { waitUntil: 'domcontentloaded' }); await page.waitForSelector('img', { timeout: 3000 }); // eslint-disable-next-line no-loop-func const doms = await page.evaluate(() => { const arr = [ ...document.querySelectorAll('img') ]; return arr.map(v => { return { naturalWidth: v.naturalWidth, naturalHeight: v.naturalHeight, width: v.width, height: v.height, }; }); }); arr = [ ...arr, ...doms ]; } await browser.close(); })();
此方法大致参考了overflow上的答案:
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
现代前端技术解析
张成文 / 电子工业出版社 / 2017-4-1 / 79.00元
这是一本以现代前端技术思想与理论为主要内容的书。前端技术发展迅速,涉及的技术点很多,我们往往需要阅读很多书籍才能理解前端技术的知识体系。《现代前端技术解析》在前端知识体系上做了很好的总结和梳理,涵盖了现代前端技术绝大部分的知识内容,起到一个启蒙作用,能帮助读者快速把握前端技术的整个脉络,培养更完善的体系化思维,掌握更多灵活的前端代码架构方法,使读者获得成为高级前端工程师或架构师所必须具备的思维和能......一起来看看 《现代前端技术解析》 这本书的介绍吧!