神经网络的菜鸟入门秘籍

栏目: 数据库 · 发布时间: 6年前

内容简介:在过去几年中,如果你打开过浏览器,那么你肯定看到过几百回“神经网络”这个词。在这篇短文中,我将为你初步介绍这一领域和神经网络本身的背景信息。接下来的5分钟可能不会让你迅速成为这个领域的世界级专家,但让你经历一个意义非凡的入门阶段却是很简单的。另外,你还将学习到一些流行术语(尤其是按文后的清单做进一步阅读),这可以成为你茶余饭后的谈资。要理解神经网络,我们首先需要懂机器学习。而为了理解机器学习,我们就得先谈谈人类学习,或者“经典编程”。

在过去几年中,如果你打开过浏览器,那么你肯定看到过几百回“神经网络”这个词。

在这篇短文中,我将为你初步介绍这一领域和神经网络本身的背景信息。接下来的5分钟可能不会让你迅速成为这个领域的世界级专家,但让你经历一个意义非凡的入门阶段却是很简单的。另外,你还将学习到一些流行术语(尤其是按文后的清单做进一步阅读),这可以成为你茶余饭后的谈资。

什么是机器学习?

要理解神经网络,我们首先需要懂机器学习。而为了理解机器学习,我们就得先谈谈人类学习,或者“经典编程”。

在经典编程中,我,也就是开发人员,需要弄明白我正在试图解决的问题的各个方面,并确切地知道怎样找到解决方案。

例如,假设我希望我的程序知道正方形和圆形之间的区别。解决这个问题的其中一种方法是编写一个可以检测边角的程序。如果我的程序检测到4个角,那么这个形状是一个正方形,如果它检测不到任何角,那么这个形状就是一个圆。

那么机器学习又是啥?一般来说,机器学习=从例子中学习。

在机器学习中,当面对上文区分圆和正方形的问题时,我们将设计一个学习系统,将许多形状及其类别(正方形或圆形)的例子作为输入,从而希望机器能够自己学习可以用来区分形状的特征。

然后,一旦机器学会了所有的特征,我们就可以给它一个以前没出现过的图像,并且希望它能够正确地对其进行分类。

神经网络的菜鸟入门秘籍

什么是神经元?

在神经网络的背景下,神经元是一个奇妙的名词,“聪明”的人不愿用函数(function)这个朴素名字。当然,在数学和计算机科学的背景下,函数(function)也是一个奇妙的名称,它接收输入,实现处理逻辑并输出结果。

更重要的是,神经元可以被认为是一个学习单元。

因此,我们需要在机器学习的背景下理解什么是学习单元。之后我们就可以理解神经网络最基本的构造,即神经元。

为了阐述这个问题,假设我试图理解博客文章中单词数量与人们实际从该帖子中读到的单词数量之间的关系。请注意 - 我们是在机器学习领域做这件事,因此我们要从例子中学习。

所以我在博客文章中收集了许多单词数统计的实例,用x表示,以及人们在这些帖子中实际阅读了多少单词,用y表示,我假设它们之间存在一定关系,用f表示。

这件事情的神奇之处在于,我只需要告诉机器(程序)我期望看到的关系(例如直线)大概是怎样的,机器就会明白它需要绘制的实际图形。

神经网络的菜鸟入门秘籍

那我在这里又得到了什么?

下一次,我想要写一篇有x个单词的博客文章,机器可以运用它发现的关系f来告诉我,我可以预期人们实际阅读的单词数量,y。

神经网络的菜鸟入门秘籍

所以,神经网络是......

好,如果一个神经元是一个函数,那么神经网络就是一个函数网络!这意味着我们有许多(很多)这样的函数和这样的学习单元,它们的所有输入和输出是相互交织的,就是说他们互为输入输出。

作为这个网络的设计者,我需要回答以下问题:

  • 如何为输入和输出建模?(例如,如果输入是一些文本,我可以用字母建模吗?那数字和向量呢?...。)

  • 每个神经元有哪些功能?(它们是线性的吗?还是指数型的?...)

  • 网络的架构是什么?(也就是说,哪个函数的输出是哪个函数的输入?)

  • 我可以用哪些流行术语描述我的网络?

一旦我回答了这些问题,我就可以向我的网络“展示”许多正确的输入输出的例子,这样当我“展示”给它一个它以前从未见过的新示例输入时,它就会知道正确的输出。

你也可以访问神经网络游乐场这个超级酷的网站,从而更好地理解这个过程意味着什么。

神经网络游乐场: https://playground.tensorflow.org/

神经网络的菜鸟入门秘籍

神经网络- 永无止境的故事

由于这个领域实际上在不断膨胀,每分钟出现的新内容的数量对任何人来说都是不可能跟踪的。(不知道会不会有朝一日我们能够建立一个能够追踪人类在AI领域进步的AI)

进入这个领域,首先要知道的是没有人知道一切。所以你不用担心自己不如他人,只要保持好奇心就好了。:)

因此,推荐一些比较优秀的资源:

Gal Yona,在这个领域非常棒的博主之一。她的帖子包括从核心技术的解释到半哲学的评论。

核心技术的解释: https://towardsdatascience.com/do-gans-really-model-the-true-data-distribution-or-are-they-just-cleverly-fooling-us-d08df69f25eb

到半哲学的评论: https://towardsdatascience.com/the-tale-of-1001-black-boxes-62d12b5886aa

Siraj Raval 是一个拥有大量视频的油管博主(youtuber),从理论解释到动手教程都非常有趣!

理论解释: https://www.youtube.com/watch?v=xRJCOz3AfYY

动手教程: https://www.youtube.com/watch?v=pY9EwZ02sXU

Christopher Olah,一位充满激情和洞察力的研究员,拥有一个超炫的博客,其中包括从基本概念到深度学习的帖子。

从基本概念: http://colah.github.io/posts/2015-09-Visual-Information/

深度学习: https://distill.pub/2017/feature-visualization/

《走向数据科学》是这个领域最大的中型出版物,无论你有几分钟或几小时的时间,都可以去他们的主页开始探索一切,从实用 工具 到深度算法应有尽有。

走向数据科学: https://towardsdatascience.com/

相关报道: https://medium.freecodecamp.org/neural-networks-for-dummies-a-quick-intro-to-this-fascinating-field-795b1705104a


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

STL源码剖析

STL源码剖析

侯捷 / 华中科技大学出版社 / 2002-6 / 68.00元

学习编程的人都知道,阅读、剖析名家代码乃是提高水平的捷径。源码之前,了无秘密。大师们的缜密思维、经验结晶、技术思路、独到风格,都原原本本体现在源码之中。 这本书所呈现的源码,使读者看到vector的实现、list的实现、heap的实现、deque的实现、Red Black tree的实现、hash table的实现、set/map的实现;看到各种算法(排序、查找、排列组合、数据移动与复制技术......一起来看看 《STL源码剖析》 这本书的介绍吧!

图片转BASE64编码
图片转BASE64编码

在线图片转Base64编码工具

MD5 加密
MD5 加密

MD5 加密工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器