話雖簡單,事實上用機器去分辨色情圖片確實是件困難的事,畢竟在法理上區分淫穢都非常不容易,甚至可以說根本無法定義淫穢。美國前大法官波特·斯圖爾特有一句名言:我看到它,才知道它是不是。機器是沒有七情六欲的,任何圖片在它看來都只是文件。
經過多年的研究和實踐,卷積神經網絡已經證明是最好的圖片歸類工具,只要提供相應的數據庫,算法就可以學習這類圖片的特性,比如分類狗狗的照片,只要識別尾巴鼻子頭;分類汽車,前臉輪子門把手;給機器“欲望”,你們自己腦補吧。
雅虎的色情圖片識別系統會給圖片一個 NSFW 值,最無害的是 0,最極端是 1,題圖裡花從中的姑娘的 NSFW 值是 0.001,鐵人三項妹子因為穿的稍微運動一些,數值升高到 0.116,也都不是色情圖片的標准。
開源之後,這套識別系統可以在很多場合使用,除了第一時間能想到的審查系統,比如還可以用作自動 NSFW 標簽器,幫你過濾工作郵箱裡不合時宜的圖片(來自其他員工的惡搞)。
各位如果有興趣的話可以去雅虎的文章(https://yahooeng.tumblr.com/post/151148689421/open-sourcing-a-deep-learning-solution-for)裡查看詳細情況,模型可以在GitHub(https://github.com/yahoo/open_nsfw/blob/master/README.md)上下載,如果你想要搭建自己的色情圖片識別系統,你必須自己提供數據,不過我想這應該不是什麼問題。
(配圖來自網絡,非原文配圖)
原文來自:https://linux.cn/article-7827-1.html
本文地址:http://www.linuxprobe.com/yahoo-detection-picture.html
http://xxxxxx/Linuxjc/1184604.html TechArticle