Facebook 开源深度学习框架 Pythia,支持视觉和语言多任务处理

栏目: 数据库 · 发布时间: 5年前

内容简介:Pythia 涵盖了 Facebook 在近期多项 AI 竞赛(VQA Challenge 2018 和 Vizwiz Challenge 2018)获胜成果中的元素。其功能特性包括一些最新模型的参考实现方法,能够帮助研究人员了解这些先进模型如何实现对应的基准测试结果,同时快速评估新模型的性能。除了多任务,Pythia 还支持分布式训练和各种数据集,以及自定义的损失、度量、调度和优化。具体功能特性如下:

Pythia 简介

Pythia 是一个深度学习框架,支持视觉和语言领域的多任务处理。Pythia 基于 Facebook 开源的 PyTorch 框架,采用模块化和即插即用设计,研究人员能够基于它快速构建、复制 AI 模型和进行基准测试。Pythia 专为视觉和语言任务而设计,例如回答与视觉数据相关的问题、自动生成图像标题等。

Pythia 能做什么

Pythia 涵盖了 Facebook 在近期多项 AI 竞赛(VQA Challenge 2018 和 Vizwiz Challenge 2018)获胜成果中的元素。其功能特性包括一些最新模型的参考实现方法,能够帮助研究人员了解这些先进模型如何实现对应的基准测试结果,同时快速评估新模型的性能。除了多任务,Pythia 还支持分布式训练和各种数据集,以及自定义的损失、度量、调度和优化。

具体功能特性如下:

  • Model Zoo:最先进的视觉和语言模型的参考实现,包括 LoRRA(SoQ on VQA 和 TextVQA)、Pythia 模型(VQA 2018 挑战获胜者)和 BAN。
  • 多任务:支持多任务,允许多个数据集同时训练。
  • 数据集:内置多种数据集,包括 VQA、VizWiz、TextVQA 和 VisualDialog。
  • 模块:提供视觉和语言领域中常用层的实现方法。
  • 分布式:支持基于 DataParallel 和 DistributedDataParallel 的分布式训练。
  • Unopinionated:不影响基于它构建任何数据集和模型。
  • 可定制:支持自定义损失、度量、调度、优化器、TensorBoard 等任何定制化需求。

这里 可以了解有关 Pythia 的更多信息。

开源 Pythia 的重要性

Pythia 让研究人员能够更加轻松地展开视觉和语言子领域的工作,研究人员能够专注于更快的原型设计和实验。Facebook 官网博客表示,Pythia 的目标是通过提高这些模型和结果的可重复性来加速进步。这将使社区更容易在成功系统的基础上构建自己的模型和进行基准测试。Pythia 旨在消除模型重现的障碍,进而使研究人员能够更快地为人和智能机器开发新的交流方式。这项工作将帮助研究人员开发自适应人工智能,将多种理解融合到更基于情境的多模式理解中。

除了当前开源的版本,Facebook 还计划继续为 Pythia 添加更多 工具 、任务、数据集和参考模型。

Pythia 开源项目地址: https://github.com/facebookresearch/pythia


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

勇敢新世界‧互聯網罪與罰

勇敢新世界‧互聯網罪與罰

許煜、劉細良 / CUP / 2005 / $48

我天天上網數小時,為的是要在節目裡面介紹世界的最新動態,尤其是網絡這個世界本身日新月異的變化。所以我不可能不注意到BT、共享軟件、 Wikipedia、網絡監管等各種影響政治、社會、經濟及文化的重要網絡現象。但是我發現市面上一直沒有一本內容充實全面,資料切時的中文參考書,直到這本《互聯網罪與罰》。而且,最大的驚喜是它易讀好看,簡直就像故事書。 梁文道 鳳凰衛視 《網羅天下......一起来看看 《勇敢新世界‧互聯網罪與罰》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具