- 授权协议: Apache
- 开发语言: Java
- 操作系统: 跨平台
- 软件首页: https://github.com/gudaoxuri/keyword-extract
- 软件文档: https://github.com/gudaoxuri/keyword-extract/blob/master/README.adoc
- 官方下载: http://repo1.maven.org/maven2/com/ecfront/keyword-extract/
软件介绍
单文件、无三方依赖、支持在线规则升级、非标准协议的 URL 关键词提取工具。
使用
<dependency> <groupId>com.ecfront</groupId> <artifactId>keyword-extract</artifactId> <version>1.4</version> </dependency>
// 关键词提取
KeyWordExtract.Result result = KeyWordExtract.extract(url);
// 使用在线规则
KeyWordExtract.loadOnlineRules("https://raw.githubusercontent.com/gudaoxuri/keyword-extract/master/src/main/resources/kwe-rules.txt");规则配置说明
本地规则文件默认已打到 jar 中,如要修改可在 classpath 根目录中创建 kwe-rules.txt 文件,此文件会覆盖默认规则。
使用在线规则会覆盖自定义规则。
# 一行一条规则,配置项以|分隔
# 规则分一般规则和自定义规则,后者使用js代码处理
# 一般规则
<名称>|<host>|<关键字所在位置,query:查询条件中,path:url路径中>|<对于query位置指定关键字的key,对于path位置指定以/分隔的偏移量>|<解码方式,目前只支持decodeURI,空>|<编码>
e.g. :
百度|www.baidu.com|query|wd|decodeURI|UTF-8
搜狗微信|weixin.sogou.com|query|query|encodeURI|UTF-8
苏宁|search.suning.com|path|0|decodeURI|UTF-8
# 自定义规则
<名称>|<host>|<js代码,入参为uri,返回值为result>
e.g. :
微博|s.weibo.com|var uri = decodeURI(decodeURI(uri)); var kv = uri.split("/")[2]; result = kv.split("&Refer=")[0];
# 自定义协议支持
app://app1/somepath?q=URL关键词提取
custom://custom1/somepath?q=URL关键词提取
深入理解 Flask
[美]Jack Stouffer / 苏丹 / 电子工业出版社 / 2016-7-1 / 79.00
Flask 是一种具有平缓学习曲线和庞大社区支持的微框架,利用它可以构建大规模的web应用。学习上手Flask非常轻松,但要深入理解却并不容易。 本书从一个简单的Flask应用开始,通过解决若干实战中的问题,对一系列进阶的话题进行了探讨。书中使用MVC(模型-视图-控制器)架构对示例应用进行了转化重构,以演示如何正确地组织应用代码结构。有了可扩展性强的应用结构之后,接下来的章节使用Flask......一起来看看 《深入理解 Flask》 这本书的介绍吧!
