PHP 爬虫踩坑实践

栏目: PHP · 发布时间: 5年前

内容简介:诶 最近总是踩坑实践 ... 然后未完待续 .今天接到需求 需要抓爬虫选型当然是python, but 身为phper 不用 php 写一下我怎么会死心呢!!!

诶 最近总是踩坑实践 ... 然后未完待续 .

今天接到需求 需要抓 https://coinmarketcap.com 下各交易平台数据.

爬虫选型当然是python, but 身为phper 不用 php 写一下我怎么会死心呢!!!

前两天找 swoole 客户端的轮子 [Saber][1] 很人性化, 官方推荐的果然不错.

人性化使用风格, ajax.js/axios.js/requests.py用户福音, 同时支持PSR风格操作

好吧 我就用它了 !

部分代码展示:

$url = 'https://coinmarketcap.com/zh/exchanges/binance/';

go(function () use ($url) {
            [$repsonse] = SaberGM::list(['uri' => $url, 'proxy' => ['http://127.0.0.1:1234']]);

            $repsonse->getParsedDomObject()->
            getElementById('exchange-markets')->
            getElementsByTagName('tbody')->
            item(0)->
            getElementsByTagName('tr')->
            textContent;
  });

代码语法风格 是不是很熟悉 .

先说踩得第一个坑

PHP Fatal error: Class 'DOMDocument' not found

写的很明白 我没有 dome 类 百度一下 yum install php-xml , 试了下 当然不好使了 , 因为我的开发环境是 php7.2

yum search xml
yum install -y php72-php-xml.x86_64

好了 这个坑就填完了

未完待续/...

最后更新于 2019-01-07 10:49:52 并被添加「」标签,已有 1 位童鞋阅读过。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

删除

删除

[英] 维克托•迈尔-舍恩伯格(Viktor Mayer-Schönberger)著 / 袁杰 译 / 浙江人民出版社 / 2013-1 / 49.90元

《删除》讲述了遗忘的美德,为读者展现了大数据时代的取舍之道。 《删除》从大数据时代信息取舍的目的和方法分别诠释了“被遗忘的权利”。维克托首先回溯了人类追寻记忆的过程,之后提出数字技术与全球网络正在瓦解我们天生的遗忘能力。对此,他考察了促进遗忘终止4大驱动力——数字化,廉价的存储器,易于提取,全球性访问。之后,他提出了当前数字化记忆的两大威胁——信息权力与时间,并给出了应对威胁的6大对策——数......一起来看看 《删除》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

MD5 加密
MD5 加密

MD5 加密工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试