内容简介:曾经有一次在GitHub上看到使用golang自动保存trending的历史记录到markdown文件的项目,感觉这个项目做的很新颖而精致.进而做一个在GitHub上自动记录每日hacknews新闻和猫眼电影.
灵感
曾经有一次在GitHub上看到使用golang自动保存trending的历史记录到markdown文件的项目,感觉这个项目做的很新颖而精致.进而做一个在GitHub上自动记录每日hacknews新闻和猫眼电影.
知识储备
- html css selector 或者 xpath 的语法,提出html的有用信息(自己做爬虫也会使用到)
- redis List/SET/HASH等数据结构
- 熟悉git的基本命令
- 熟悉ssh key和配置GitHub ssh key 登陆
- GO语言: exec,go-redis,goquery,template,http等包
- go stmp包发送服务器信息和每日hacknews到自己的邮箱
思路
- 使用http包下载html文档
- goquery提取html中用的信息
- 使用第三方翻译接口翻译有用信息
- 保存提取的信息到 redis 中并去重,设置自动失效时间
- 获取去重之后的信息使用go template来渲染markdown格式的文档
- go exec 调用git命令提交生产之后的markdown文件到github 同时更新readme.md文件
- 发送每日hacknews和服务器的状态到自己的邮箱
main.go代码注释解析
package main import ( "github.com/dejavuzhou/md-genie/util" "log" "time" ) var gitCount = 1 func createCmds() []util.Cmd { //使用两个账号轮流交替提交代码到GitHub //可耻的私心:我要让这两个GitHub账号在contributions in the last year 显示面板都是绿色(代表活跃) gitCount++ gifConfig1 := []util.Cmd{ {"git", []string{"config", "--global", "user.email", "'dejavuzhou@qq.com'"}}, } gifConfig2 := []util.Cmd{ {"git", []string{"config", "--global", "user.email", "'1413507308@qq.com'"}}, } //执行一系列git命令 和 linux 服务器的命令 来定时监控服务器的健康状态 cmds := []util.Cmd{ {"git", []string{"config", "--global", "user.name", "'EricZhou'"}}, {"git", []string{"stash"}}, {"git", []string{"pull", "origin", "master"}}, {"git", []string{"stash", "apply"}}, {"git", []string{"add", "."}}, {"git", []string{"status"}}, {"git", []string{"commit", "-am", time.Now().Format(time.RFC3339)}}, {"git", []string{"status"}}, {"git", []string{"push", "origin", "master"}}, {"netstat", []string{"-lntp"}}, {"free", []string{"-m"}}, {"ps", []string{"aux"}}, } if gitCount%2 == 0 { cmds = append(gifConfig2, cmds...) } else { cmds = append(gifConfig1, cmds...) } return cmds } func main() { //比较懒 使用最原始sleep的方法来实现定时任务 for { //提出hacknews html中的新闻游泳信息调用有道翻译来 保存信息到redis //如果有条件建议使用google翻译API if err := util.SpiderHackNews(); err != nil { log.Fatal(err) } //解析hacknews新闻到markdown文件,按照时间天格式命名 if err := util.ParseMarkdownHacknews(); err != nil { log.Fatal(err) } //获取猫眼电影json接口,保存到redis if err := util.FetchMaoyanApi(); err != nil { log.Fatal(err) } //解析电影信息到markdown文件 if err := util.ParseMaoyanMarkdown(); err != nil { log.Fatal(err) } //读取archieves 文件夹名称 生成readme.md文件 util.ParseReadmeMarkdown() //运行git linux 命令 保存日志 slice gitlogs, err := util.RunCmds(createCmds()) if err != nil { log.Fatal(err) } //解析日志和hacknews新闻 生产email的html正文 //发送邮件 if err, mailBody := util.ParseEmailContent(gitlogs); err == nil { mailTitle := "md-genie+hacknews日志:" + time.Now().Format(time.RFC3339) util.SendMsgToEmail(mailTitle, mailBody) } else { log.Fatal(err) } //每天执行4次 我的两个GitHub账号就可以每天活跃数量为两次 time.Sleep(6 * time.Hour) } }
dejavzuhou/util包解析
api.go command.go ding.go hacknews.go mail.go markdown.go redditnews.go scanfiles.go translate.go
md-genie源代码
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- Facebook发布机器学习框架PyRobot,助力机器人开源社区
- 创建聊天机器人,第 3 部分: 使用认知(或人工智能)服务增强聊天机器人
- 基于 Python 的僵尸网络将 Linux 机器变成挖矿机器人
- 协作机器人行业
- 开源机器人自学指南
- python图灵机器人
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
锦绣蓝图
[美] 沃德科 (Christina Wodtke)、[美] 戈夫拉 (Austin Govella) / 蔡芳 / 人民邮电出版社 / 2009-11-01 / 59.00
Web 2.0和社会化大趋势下,你的网站发展喜人,但是问题也接踵而来:信息变得越来越庞杂无序,业务流程愈加复杂,搜索和导航越来越难,用户对使用体验的要求也越来越高……怎么办? 作者非常通俗易懂地讲述了如何规划易用的网站及其背后的信息架构原理。首先介绍了建立信息架构的八项基本原则,然后重点强调了组织系统和元数据在信息架构中的作用,并指出设计搜索和导航需要考虑的问题和方法,另外还补充了当今热门的......一起来看看 《锦绣蓝图》 这本书的介绍吧!
JSON 在线解析
在线 JSON 格式化工具
Markdown 在线编辑器
Markdown 在线编辑器