用不可描述的图片做可以描述的事情

栏目: 数据库 · 发布时间: 5年前

内容简介：写在前面：不要找我要训练数据，我是遵纪守法的好公民，训练数据已经删除。几天前看到 GitHub 上用于

用不可描述的图片做可以描述的事情

写在前面：不要找我要训练数据，我是遵纪守法的好公民，训练数据已经删除。

几天前看到 GitHub 上用于黄图鉴别的数据 , 就 down 回来做了个黄图鉴别的模型，现模型已开源： nsfw 。在线demo

用不可描述的图片做可以描述的事情

数据

训练数据共五个类别：

porn - pornography images hentai - hentai images, but also includes pornographic drawings sexy - sexually explicit images, but not pornography. Think nude photos, playboy, bikini, beach volleyball, etc. neutral - safe for work neutral images of everyday things and people drawings - safe for work drawings (including anime)

训练数据的数量如下:

drawing: 18251 hentai: 42649 netural: 44677 porn: 108114 sexy: 17253

使用

可以直接下载代码和训练好的模型来用下载代码和模型

git clone https://github.com/rockyzhengwu/nsfw.git

训练好的模型在 /data/ 目录下。

cd nsfw
python nsfw_predict.py /tmp/test/test.jpeg

输出结果：

{'class': 'sexy', 'probability': {'drawings': 0.008320281, 'hentai': 0.0011919827, 'neutral': 0.13077603, 'porn': 0.13146976, 'sexy': 0.72824186}}

class : 图片所属列表 probability : 各类别所属的概率得分

也可以使用 Tensorflow Serving 部署，详情可以查看 nsfw

模型

模型部分采用 Resnet ，主要参考了 Tensorflow 官方的代码做了少许修改。详情见 resnet 目录下。尝试了微调和训练一个相对简单的新模型，微调的效果并不好，反而速度会慢很多。我想是因为这些图片和ImageNet 数据集相差太大的缘故。最终发布的模型使用Resnet-32, 准确率 90% 。

如有建议可邮件: zhengwu@midday.me

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

プログラミングコンテストチャレンジブック

秋葉拓哉、岩田陽一、北川宜稔 / 毎日コミュニケーションズ / 2010-09-11 / JPY 34.44

現在、プログラミングコンテストは数多く開催されています。Google Code Jam、TopCoder、ACM/ICPCなどの名前を聞いたことがある人も少なくないでしょう。本書で扱うのはそれらのような、問題を正確にできるだけ多く解くことを競うプログラミングコンテストです。プログラミングコンテストは気軽に参加することができます。例えば、Google Code JamやTopCoderはイン......一起来看看《プログラミングコンテストチャレンジブック》这本书的介绍吧!

码农工具