内容简介:写在前面:不要找我要训练数据,我是遵纪守法的好公民,训练数据已经删除。几天前看到 GitHub 上用于
用不可描述的图片做可以描述的事情
写在前面:不要找我要训练数据,我是遵纪守法的好公民,训练数据已经删除。
几天前看到 GitHub 上用于 黄图鉴别的数据 , 就 down 回来做了个黄图鉴别的模型,现模型已开源: nsfw 。在线demo
数据
训练数据共五个类别:
porn - pornography images hentai - hentai images, but also includes pornographic drawings sexy - sexually explicit images, but not pornography. Think nude photos, playboy, bikini, beach volleyball, etc. neutral - safe for work neutral images of everyday things and people drawings - safe for work drawings (including anime)
训练数据的数量如下:
drawing: 18251 hentai: 42649 netural: 44677 porn: 108114 sexy: 17253
使用
可以直接下载代码和训练好的模型来用 下载代码和模型
git clone https://github.com/rockyzhengwu/nsfw.git
训练好的模型在 /data/
目录下。
cd nsfw python nsfw_predict.py /tmp/test/test.jpeg
输出结果:
{'class': 'sexy', 'probability': {'drawings': 0.008320281, 'hentai': 0.0011919827, 'neutral': 0.13077603, 'porn': 0.13146976, 'sexy': 0.72824186}}
class
: 图片所属列表 probability
: 各类别所属的概率得分
也可以使用 Tensorflow Serving 部署,详情可以查看 nsfw
模型
模型部分采用 Resnet ,主要参考了 Tensorflow 官方的代码 做了少许修改。详情见 resnet
目录下。 尝试了微调和训练一个相对简单的新模型,微调的效果并不好,反而速度会慢很多。我想是因为这些图片和ImageNet 数据集相差太大的缘故。最终发布的模型使用Resnet-32, 准确率 90% 。
如有建议可邮件: zhengwu@midday.me
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
勇敢新世界‧互聯網罪與罰
許煜、劉細良 / CUP / 2005 / $48
我天天上網數小時,為的是要在節目裡面介紹世界的最新動態,尤其是網絡這個世界本身日新月異的變化。所以我不可能不注意到BT、共享軟件、 Wikipedia、網絡監管等各種影響政治、社會、經濟及文化的重要網絡現象。但是我發現市面上一直沒有一本內容充實全面,資料切時的中文參考書,直到這本《互聯網罪與罰》。而且,最大的驚喜是它易讀好看,簡直就像故事書。 梁文道 鳳凰衛視 《網羅天下......一起来看看 《勇敢新世界‧互聯網罪與罰》 这本书的介绍吧!