- 授权协议: Apache 2.0
- 开发语言: HTML/CSS
- 操作系统: 跨平台
- 软件首页: https://github.com/chimbori/crux
- 软件文档: https://github.com/chimbori/crux
- 官方下载: https://github.com/chimbori/crux
软件介绍
Crux 是一个 HTML 正文内容提取库,它通过分析 Web 页面,以确定一篇文章的关键内容。该库由多个独立的 API 组成,可随意选择想使用的那个。比如说,如果你在 Android 应用中使用 Crux ,则可以使用 Proguard 或其他压缩工具来去除不需要的部分。
文章提取 API :
可格式化提取内容丰富,不限于纯文本。
支持更多的网站和更好的页面整体解析。
支持更多的元数据格式:OpenGraph, Twitter Cards,Schema.org 等
占用空间小,JSoup 是唯一需要的依赖项。
更少的 setters/getters,简单易用
能够使用默认的 HttpUrlConnection 之外的 HTTP 库,例如 OkHttp 。
代码简洁
高度支持通过 Gradle 导入 Android Studio 项目
持续集成单元测试和 golden file 测试。
示例代码:
在后台线程中,发出网络请求并获取想要分析的页面的 rawHTML 。
String url = "https://example.com/article.html"; String rawHTML = "<html><body><h1>This is an article</h1></body></html>"; Article article = ArticleExtractor.with(url, rawHTML) .extractMetadata() .extractContent() // If you only need metadata, you can skip `.extractContent()` .article();
在 UI 线程上:
// Use article.document, article.title, etc.
CSS禅意花园
[美] Dave Shea、Molly E. Holzschlag / 陈黎夫、山崺颋 / 人民邮电出版社 / 2007-6 / 49.00元
这本书的作者是世界著名的网站设计师,书中的范例来自网站设计领域最著名的网站——CSS Zen Garden(CSS禅意花园)。全书分为两个主要部分。第1章为第一部分,讨论网站“CSS禅意花同”及其最基本的主题,包含正确的标记结构和灵活性规划等。第二部分包括6章,占据了书中的大部分篇幅。 每章剖析“CSS禅意花园”收录的6件设计作品,这些作品围绕一个主要的设计概念展开,如文字的使用等。通过探索......一起来看看 《CSS禅意花园》 这本书的介绍吧!
html转js在线工具
html转js在线工具
正则表达式在线测试
正则表达式在线测试
