书单 | 想成为一名合格的NLPer,应该读哪些书?

栏目: 数据库 · 发布时间: 5年前

内容简介:-The End-

书单 | 想成为一名合格的NLPer,应该读哪些书?

自然语言处理(NLP)作为人工智能研究的核心领域之一,长久以来备受关注。微软全球执行副总裁沈向洋博士曾表示 “懂语言者得天下,人工智能对人类影响最为深刻的就是自然语言方面。” 为了帮助大家更好地学习NLP,我“门”向大家推荐一份精简书单,enjoy~

以下自然语言处理书籍由数智物语(decision_engine)根据公开资料、豆瓣评分综合整理。

言语和语言处理

Speech and Language Processing

书单 | 想成为一名合格的NLPer,应该读哪些书?

作者:Daniel Jurafsky / James H. Martin

书籍简介:该书由 NLP 领域的大牛 ,斯坦福大学 Daniel Jurafsky 教授和科罗拉多大学的 James H. Martin 教授等人共同编写。Daniel Jurafsky 是斯坦福大学计算机科学教授,主要研究方向是计算语言学和自然语言处理。 James H. Martin 是科罗拉多大学博尔德分校计算机科学系一名教授,两位教授都是 NLP 领域知名学者。

推荐理由: 经典的 NLP 教科书,涵盖了所有 NLP 的基础知识 ,也被国外许多著名大学选为自然语言处理和计算语言学课程的主要教材。本书写作风格引人入胜,深入技术细节而又不让人感觉枯燥,不仅可以作为高等学校自然语言处理和计算语言学等课程的本科生和研究生教材,对于自然语言处理相关领域的研究人员和技术人员也是不可或缺的权威参考书。

:link: https://web.stanford.edu/~jurafsky/slp3/

统计自然语言处理的基础

Foundations of Statistical Natural Language Processing

书单 | 想成为一名合格的NLPer,应该读哪些书?

作者:Christopher Manning and Hinrich Schütze

书籍简介:本书涵盖的内容十分广泛,分为四个部分,共16章,包括了构建自然语言处理软件 工具 将用到的几乎所有理论和算法。全书的论述过程由浅入深,从数学基础到精确的理论算法,从简单的词法分析到复杂的语法分析, 适合不同水平的读者群的需求 。同时,它还将理论与实践紧密联系在一起,在介绍理论知识的基础上给出了自然语言处理技术的高层应用(如信息检索等)。

推荐理由: 经典的统计自然语言处理入门教材 。本教材成书较早(1999年),但是自然语言处理领域的基本概念和任务没有太大的变化,仍然适用于初学者快速了解自然语言处理相关的概念和任务。

:link: https://nlp.stanford.edu/fsnlp/

自然语言处理中的神经网络方法

Neural Network Methods in Natural Language Processing

书单 | 想成为一名合格的NLPer,应该读哪些书?

作者:Yoav Goldberg

书籍简介:本书着重介绍 神经网络模型在自然语言数据中的应用 。书的前半部分介绍了有监督的机器学习和前馈神经网络的基础知识,基于语言数据的机器学习的基础知识。它还涵盖了可以定义和训练任意神经网络的计算图形抽象方面的知识,是当代神经网络软件库设计的基础。

第二部分介绍了更多专门的神经网络体系结构,包括一维卷积神经网络、递归神经网络、条件生成模型和基于注意力的模型。这些体系结构和技术是机器翻译、句法分析和许多其他应用程序的最先进算法的推动力量。最后,本书还讨论了树形网络,结构化预测和多任务学习的前景。

推荐理由:最近几年随着深度学习的兴起,图像识别、语音识别等多个方面都发生了很大的变革。深度学习在自然语言处理方面也是非常普遍了,一些经典的自然语言模式也都是基于神经网络的,这本书是 目前市面上唯一一本介绍神经网络在自然语言处理的应用 的书。本书作者对学术的态度极其严谨,因此书中的大量参考文献也非常有价值。

:link: http://library1.org/_ads/7ECBFA717EC2AAF7E2F20AA3597D1C8C

Python自然语言处理

Natural Language Processing with Python

书单 | 想成为一名合格的NLPer,应该读哪些书?

作者:Steven Bird / Ewan Klein / Edward Loper

书籍简介:本书教你 如何用 Python 和 NLTK 库来做 NLP 。提供了非常易学的自然语言处理入门介绍,涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。

推荐理由:这本书的 实用性较强 。如果你对 Python 与 NLTK 感兴趣,可以将本书当做入门读物来看,整本书即涉及到了语料库的操作,也对传统的基于规则的方法有所涉及。全书包括了分词(tokenization)、词性标注(POS)、语块(Chunk)标注、句法剖析与语义剖析等方面,是 NLP 中不错的一本实用教程。

:link: http://www.datascienceassn.org/sites/default/files/Natural%20Language%20Processing%20with%20Python.pdf

信息检索导论

Introduction to Information Retrieval

书单 | 想成为一名合格的NLPer,应该读哪些书?

作者:Christopher D.Manning / Prabhakar Raghavan /Hinrich Schütze

书籍简介:本书从计算机科学领域的角度出发,介绍了信息检索的基础知识,并对当前信息检索的发展做了回顾,重点介绍了搜索引擎的核心技术,如文档分类和文档聚类问题,以及机器学习和数值计算方法。书中所有重要的思想都用示例进行了解释, 生动形象,引人入胜

推荐理由:关于排名/搜索的优秀参考书,作者从最简单的布尔检索到一个完整的搜索引擎,逐步深入,逐步引导读者思考,对建造一个大型搜索引擎需要用到的架构和算法都有所涉猎,搜索引擎并不仅仅是检索信息,它还有一个更重要的用处是对返回的结果进行排序,而这往往是非常重要的。

:link: https://nlp.stanford.edu/IR-book/html/htmledition/irbook.html

欢迎大家在评论区推荐更多NLP书籍哦~

-The End-

将门 是一家 以专注于 发掘、加速及投资技术驱动型创业公司 的新型 创投机构 ,旗下涵盖 将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

将门创新服务 专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。

将门技术社群 专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。

将门创投基金 专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括 机器智能、物联网、自然人机交互、企业计算。 在三年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、 宽拓科技、 杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务, 欢迎发送或者推荐项目给我“门”:  bp@thejiangmen.com

书单 | 想成为一名合格的NLPer,应该读哪些书?     

点击右上角,把文章分享到朋友圈

书单 | 想成为一名合格的NLPer,应该读哪些书?  

将门创投

让创新获得认可!

微信:thejiangmen

bp@thejiangmen.com

点击“ ❀在看 ”,让更多朋友们看到吧~


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

C++设计新思维

C++设计新思维

(美)Andrei Alexandrescu / 侯捷、於春景 / 华中科技大学出版社 / 2003-03 / 59.8

本书从根本上展示了generic patterns(泛型模式)或pattern templates(模式模板),并将它们视之为“在C++中创造可扩充设计”的一种功能强大的新方法。这种方法结合了template和patterns,你可能未曾想过,但的确存在。为C++打开了全新视野,而且不仅仅在编程方面,还在于软件设计本身;对软件分析和软件体系结构来说,它也具有丰富的内涵。一起来看看 《C++设计新思维》 这本书的介绍吧!

RGB转16进制工具
RGB转16进制工具

RGB HEX 互转工具

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

RGB CMYK 转换工具
RGB CMYK 转换工具

RGB CMYK 互转工具