内容简介:在过去几年中,由于深度学习的颠覆性进步,语音处理、语言处理、计算机视觉和多模态等应用都取得了重大进展。尽管实践证明深度学习可以取得非常优越的效果,它仍面临许多亟待解决的重要问题。可以预期的是,理论和实证的进步将进一步推动人工智能应用性能的提高,从而为深入研究多种学习和建模方法的融合创造机会。
IEEE 信号处理专题( IEEE Journal of Selected Topics in Signal Processing, JSTSP) 最近公布了新的特刊: 跨语音、语言、视觉和异构信号的多模态智能深度学习( Deep Learning for Multi-modal Intelligence across Speech, Language, Vision, and Heterogeneous Signals) 。
在过去几年中,由于深度学习的颠覆性进步,语音处理、语言处理、计算机视觉和多模态等应用都取得了重大进展。尽管实践证明深度学习可以取得非常优越的效果,它仍面临许多亟待解决的重要问题。可以预期的是,理论和实证的进步将进一步推动人工智能应用性能的提高,从而为深入研究多种学习和建模方法的融合创造机会。
另外,许多人工智能问题都涉及到不止一种模态,如语言、视觉、语音和异构信号等,而多模态技术经常可以让不同模态之间的信息互通有无。因此,研究同时跨多种模态的模型和学习方法具有重要意义。本期特刊的目标是汇集与多模态有关的各种多元互补的深度学习算法。特刊的主题范围包括但不限制于以下内容:
-
处理多模态数据的基本问题和方法,包括语言、语音、图像、视频和异构信号
-
预训练、表征学习、多任务学习、小样本学习,以及跨自然语言、语音、图像和视频等多种模态的强化学习
-
跨模态的深度学习方法和应用,包括图像字幕生成、视觉问答、视觉叙事、从文本合成图像、视觉语言导航等
-
跨模式的深度学习方法和应用,例如图像字幕,视觉问答,视觉故事讲述,文本到图像合成,视觉语言导航等
-
多模态应用程序的评估方法
作者投稿时应按 IEEE JSTSP 网站说明将稿件提交至指定的网页提交系统。
-
IEEE JSTSP 是 IEEE 信号处理社群( IEEE Signal Processing Society )的核心刊物之一。 是《中科院文献情报中心期刊分区表》分类的工程类 2 区论文,影响因子为 6.688 (据 IEEE XPlore )。
-
IEEE 信号处理社群始创于 1948 年,是 IEEE 的第一个专业学会,也是全球信号处理工程师和行业专业人士的首要协会。 IEEE 信号处理社群在全球 100 多个国家拥有超过 19000 名会员,并提供信号处理领域的最新信息。
-
电气电子工程师协会( Instituteof Electrical and Electronics Engineers, IEEE )是全球最大的专业技术组织之一,拥有来自 175 个国家的 42 万名会员。 拥有包括信号处理社群在内的 35 个专业学会等, IEEE 发表多种杂志、期刊、书籍等,并每年举办至少 300 次学术会议等。 IEEE 也对工业标准的制定有重大理解。
本期 IEEE 信号处理专题客座编辑简介:
何晓东博士( Dr. Xiaodong He ) -- 客座主编
何晓东博士是京东人工智能研究院的常务副院长,以及深度学习、自然语言处理和语音处理实验室主任。他也是华盛顿大学(西雅图)电子和计算机工程系的客座教授。他因对与人类语言和视觉相关的多模态信号处理技术的重要贡献于 2019 年当选为 IEEE 会士。 在加入京东公司之前,他是微软公司雷蒙德研究院深度学习技术中心的主任研究员和研究经理。他的研究兴趣包括了深度学习、自然语言处理、计算机视觉、语音处理、信息检索和多模态人工智能等。他有多篇论文获奖,包括 ACL 2015 年度杰出论文奖和 IEEESPS 社群 2018 年度最佳论文奖等。 他的重要学术贡献包括深度结构语义模型( DSSM )和层次结构注意力网络( HAN )等,这些贡献被广泛应用于语言、视觉、信息检索和知识表征学习等。 他还于 2016 年领导开发了世界上第一款基于云端的图像字幕生成服务 CaptionBot 。 他和同事一起获得过许多主要人工智能竞赛的第一名,包括 2008 NIST MT 评测、 IWSLT2011 评测、 COCO 字幕生成挑战赛 2015 以及 VQA2017 等。 他的许多工作都被整合到具有广泛影响的软件和服务中,如微软云端图像字幕生成服务、 Seeing AI ,以及京东智能客服机器人等。 他也担任 IEEE 的多个期刊的编辑和许多语音和语言处理会议的组委会、程序委员会成员或区域主席等。
.
邓力博士( Dr. Li Deng )
邓力博士从 2017 年 5 月起担任 Citadel 美国公司的首席人工智能官( Chief Artificial Intelligence Officer )。 在此之前,他曾任微软公司的人工智能首席科学家以及合伙人级研究经理。在加入微软之前,他是加拿大滑铁卢大学的正教授。他还是 IEEE 、美国声学学会、国际语音通讯学会等多个国际学会等会士。 邓力博士曾任 IEEE 信号处理社群的理事会成员、 IEEE 信号处理杂志的主编、 IEEE/ACM 声音、语音和语言处理期刊的主编( 2008-2014 年),并因此荣获 IEEE 信号处理社群的功勋服务奖。 他还因“对自动语音识别和深度学习的杰出贡献”获得了 2015 年 IEEE 信号处理社群的技术成就大奖。 邓力博士还撰写了 6 本关于深度学习、语音处理、模式识别和机器学习的专著,其中最近的一本是 Springer 出版社于 2018 年 6 月出版的《 Natural Language Processing 》。 他还曾担任包括 IEEE-SPM 、 IEEE-TPAMI 、 IEEE-JSTSP 、 Proceedings of the IEEE ,以及 IEEE-TASLP 等多个重要刊物的客座编辑。
Richard Rose 博士( Dr. Richard Rose )
Richard Rose 博士自 2014 年 10 月起担任 Google 纽约的研究科学家。 包括最近对 Youtube 视频的信号处理工作在内,他在 Google 期间对语音、语言和视频处理都做出了贡献。 在加入 Google 公司前,他曾担任位于加拿大蒙特利尔的麦吉尔大学的电子和计算机工程教授、担任 AT&T 公司实验室和贝尔实验室的研究团队成员、麻省理工大学林肯实验室的成员等,并在佐治亚理工学院获得电子工程博士学位。 他主要活跃在 IEEE 信号处理社群,曾两次作为 IEEE SPS 期刊的副主编、两次作为语音技术委员会成员、信号处理社群董事会成员,以及 IEEE 的多个研讨会的组委会成员。 他还是一位 IEEE 会士。
黄民烈副教授( Prof. Minlie Huang )
黄民烈是清华大学计算机科学与技术系的副教授及智能技术与系统实验室的副主任。他于 2006 年获得博士学位, 2018 年获汉王青年创新奖, 2019 年获得微软亚研院合作研究奖。 他还曾获得 IJCAI-ECAI 2018 年杰出论文奖、 NLPCC 2015 年最佳论文奖和 CCL 2018 年最佳展示奖等。 他关于带有情感的聊天机器人的工作被 MIT 技术评论、英国卫报、 Nvidia 、参考消息、新华社等广泛报道。 他已经在包括 ACL 、 AAAI 、 IJCAI 、 EMNLP 、 DNN 等多个顶级会议以及 IEEE TASLP 、 ACM TOIS 、 Bioinformatics 、 JAMIA 等期刊中发表了 80 多篇论文。 他还曾担任 EMNLP 2019 、 ACL 2016 、 EMNLP 2014 、 EMNLP 2011 以及 IJNLP 2017 的领域主席, IJCAI 2017 、 IJCAI 2018 (获杰出资深程序委员奖)、 IJCAI 2019 、 AAAI 2018 、 AAAI 2019 、 AAAI 2020 会议的资深程序委员。 他还担任包括 ACL 、 IJCAI 、 AAAI 、 EACL 、 COLING 、 EMNLP 、 NAACL 等多个会议的审稿人,以及 TOIS 、 TKDE 、 TPAMI 等多个期刊的审稿人。 他的个人主页地址是: http://coai.cs.tsinghua.edu.cn/hml/ 。
Isabel Trancoso 教授( Prof. IsabelTrancoso )
Isabel Trancoso 是里斯本大学高等理工学院的正教授以及 INESC-ID 的科学理事会主席。 她于 1979 年、 1984 年、 1987 年和 2002 年分别获得了里斯本大学高等理工学院的学士、硕士、博士和综合学位,并曾任该校电子和计算机工程系的主席。 她还曾担任 IEEE 语音和声音处理期刊的主编、 IEEE 信号处理社群理事会成员以及国际语音通讯协会( ISCA )主席等,并担任 Interspeech 2005 年国际会议的主席。 她还曾作为 IEEE James Flanagan 奖评审委员会主席以及 ISCA 杰出讲师选委会主席,以及 IEEE 会士选举委员会、 IEEE 出版服务、产品和战略规划委员会等多个委员会等成员,以及 ELRA 董事会的副主席等。 她目前整合了 ISCA 顾问委员会和 ISCA 会士选委会,并担任 IEEE 信号处理社群会士评估委员会主席。 她于 2009 年获得了 IEEE 信号处理社群功勋服务奖,并于 2011 年和 2014 年分别被选举为 IEEE 会士和 ISCA 会士。
张超博士( Dr. Chao Zhang )
张超是位于英国剑桥的京东 AI 欧洲研究院的建院顾问以及京东语音处理团队的技术顾问,也是英国剑桥大学语音和自然语言处理方向的博士后研究员。 他 2009 年和 2012 年分别在北京清华大学计算机系获得学士和硕士学位, 2017 年从英国剑桥大学工程系获得博士学位。 他是隐式马尔可夫模型 工具 包( HTK )的作者之一,开发了 HTK 3.5 版和 PyHTK 工具包。 他已经发表了 30 多篇论文,并获得了 NCMMSC 2011 和 ICASSP 2014 会议最佳学生论文、 ASRU2015 会议最佳论文候选等奖项。 张超作为剑桥大学工程系语音团队的核心成员之一先后参加并赢得了多项国际尖端语音识别竞赛,包括 iARPA Babel 2013 、 DARPA BOLT 2014 、 ASRU 2015 MGB 挑战赛等。 他还担任多个会议和期刊的审稿人,包括 Interspeech 、 EMNLP-IJCNLP 、 IEEE/ACM-TASLP 、 IEEE-JBHI 、 Computers Speech & Language 等。
:mag:
现在,在 「知乎」 也能找到我们了
进入知乎首页搜索 「PaperWeekly」
点击 「关注」 订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击 「交流群」 ,小助手将把你带入 PaperWeekly 的交流群里。
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 迷你书: 架构师特刊:大前端
- Python信号处理
- Linux信号处理机制
- xenomai内核解析之信号signal(二)---xenomai信号处理机制
- Python内核阅读(二十五):信号处理机制
- 写给 PHP 程序员的信号处理教程
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Cracking the Coding Interview
Gayle Laakmann McDowell / CareerCup / 2015-7-1 / USD 39.95
Cracking the Coding Interview, 6th Edition is here to help you through this process, teaching you what you need to know and enabling you to perform at your very best. I've coached and interviewed hund......一起来看看 《Cracking the Coding Interview》 这本书的介绍吧!