- 授权协议: Apache
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: https://gitee.com/mail_osc/templatespider
- 软件文档: https://gitee.com/mail_osc/templatespider
软件介绍
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!扒下来的网站,会自动变成html模版。js、css、图片等自动分好类,变为标准的模版文件。可以供网市场云建站、帝国CMS、织梦CMS等各大建站系统使用
软件界面
使用步骤
将要扒取的网站页面的网址粘贴进去
点击左下方“开始抓取”按钮
等待抓取完毕,自动打开下载好的文件夹
使用示例
例如,我要拔取 qiye1.wscso.com 这个网站中的首页、关于我们、新闻列表三个页面,拔取下来做成模板,扒网站工具中可以这么设置URL:
http://qiye1.wscso.com http://qiye1.wscso.com/gongsijieshao.html http://qiye1.wscso.com/xinwenzixun.html
设置如下图所示
设置好后,点击左下角的“开始提取”按钮,便开始了自动扒这几个设置好的页面。
扒完后,会自动打开下载好的文件夹。例如,上面拔取的结果:
可以看到,扒取下来的网页算是很规范的模板页。可以直接打开模板页进行浏览查看。
Python自然语言处理
(英)伯德、(英)克莱因、(美)洛普 / 东南大学出版社 / 2010-6 / 64.00元
《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。 《Python自然语言处理》准备了充足的示例和练习,......一起来看看 《Python自然语言处理》 这本书的介绍吧!
