- 授权协议: 未知
- 开发语言: Google Go
- 操作系统: 跨平台
- 软件首页: https://github.com/sundy-li/html2article
- 软件文档: https://github.com/sundy-li/html2article/blob/master/README.md
- 官方下载: https://github.com/sundy-li/html2article
软件介绍
html2article — 基于文本密度的html2article实现[golang]
Install
go get -u -v github.com/sundy-li/html2article
Performance
avg 3.2ms per article, accuracy >= 98% (对比其他开源实现,可能是目前最快的html2article实现,我们测试的数据集约3kw来自于微信公众号,各大类中文科技媒体历史文章,目前能达到98%以上准确率)
Examples
参考examples from_url.go
package main
import (
"github.com/sundy-li/html2article"
)
func main() {
article, err := html2article.FromUrl("https://www.leiphone.com/news/201602/DsiQtR6c1jCu7iwA.html")
if err != nil {
panic(err)
}
println("article title is =>", article.Title)
println("article publishtime is =>", article.Publishtime)
println("article content is =>", article.Content)
}Algorithm
白话机器学习算法
[新加坡] 黄莉婷、[新加坡] 苏川集 / 武传海 / 人民邮电出版社 / 2019-2 / 49.00元
与使用数学语言或计算机编程语言讲解算法的书不同,本书另辟蹊径,用通俗易懂的人类语言以及大量有趣的示例和插图讲解10多种前沿的机器学习算法。内容涵盖k均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法,以及回归分析、k最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法,并概述强化学习算法的思想。任何对机器学习和数据科学怀有好奇心的人都可以通过本书构建知识体系。一起来看看 《白话机器学习算法》 这本书的介绍吧!
