golang[53]-爬虫解决-403错误

栏目: Go · 发布时间: 6年前

内容简介:如下,直接用http.Get(url)进行获取信息,用浏览器可以对该URL进行访问,可是爬取时则返回403,禁止访问resp,err := http.Get(url)解决方案:模拟浏览器访问:

如下,直接用http.Get(url)进行获取信息,用浏览器可以对该URL进行访问,可是爬取时则返回403,禁止访问

resp,err := http.Get(url)

解决方案:模拟浏览器访问:

1、查看自己浏览器中的User-Agent 信息。

2、将下面代码

resp,err := http.Get(url)
defer resp.Body.Close()

替换成下面的代码

client := &http.Client{}
req, err := http.NewRequest("GET", url, nil)
if err != nil {
	log.Fatalln(err)
}

//浏览器中的User-Agent

req.Header.Set(“User-Agent”, “Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36”)

resp, err := client.Do(req)
if err != nil {
	log.Fatalln(err)
}

defer resp.Body.Close()

以上所述就是小编给大家介绍的《golang[53]-爬虫解决-403错误》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

社群营销实战手册

社群营销实战手册

秋叶、邻三月、秦阳 / 人民邮电出版社 / 2018-1 / 69.00元

互联网正从“物以类聚”,走向“人以群分”的时代。秋叶等人的“社群营销”,并非单纯靠社群卖东西,而是建立一种中心化的、自行运转的生态,让“同好”们形成紧密的联系,创造出海量营销机会。 《社群营销实战手册 从社群运营到社群经济》共5章内容,从社群的定位、建立、扩张、变现、运营,到社群的生命周期延长、社群运营团队的打造和管理以及社群管理工具,大量干货秘笈一应俱全,并提供丰富的运营实战案例,全面解读社群的......一起来看看 《社群营销实战手册》 这本书的介绍吧!

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具