原文:《Pornhub is improving search with an AI porn addict》
翻译:小马哥
编辑:船长
常规的不可描述网站在 UGC(用户产生内容)方面往往都面临着一个大麻烦,那就是用户在上传视频的时候常常不会按照数据库的正常方式操作。
这样就带来了一个问题:每当你打开网站,映入眼帘的就是千上万个视频,虽然全都使用了简单词汇和标签描述内容,但内容往往重复。这就给用户在搜寻视频资源时造成了很大困扰,尤其是当你有特殊♂癖好,或者当你突然很想看某个特定的演员的作品时,比如最近听说有新作发布的明日花老师。
为了解决这个问题,世界最大不可描述网站 Pornhub 计划利用人工智能技术将网站目录里的全部视频逐帧扫描和整理。
这套AI系统从成人演员身上采集了数千幅画面和动作,以此构建了一个数据库,含有人物名字、面部特征和开车姿势等信息,然后将收集到的数据和 Pornhub 系统中的视频片段相比较,从而对网站视频库中庞大的视频资源自动标记和分类。
更加令人侧目的,是超越传统意义上的“标签”功能,系统会利用 CV 技术识别屏幕上任何时间点人物的名字以及任何姿势,在 Pornhub 为科技媒体 Engadget 的演示中,演员边以某种姿势开车,屏幕上就会浮现相应的标签,比如“咬”“牛仔女郎”“传!教!士姿势”等。此外,系统甚至还能识别出演员是不是金发,是在室内还是室外,然后添加上相应的标签。
在此套 AI 系统正式上线前 Pornhb 对视频分类的方式还是由人力来完成。Pornhub 希望在不远的将来,用户能够观看由其AI智能系统分类和标记后的视频。届时,假如你很想看某个成人演员的作品,AI 系统就会把所有它认为有这个演员演出的视频片段展示给你,而且还会显示此演员演出的百分比。
Pornhub 同时也会请求用户帮助训练 AI 系统,比如赞同正确的展示,反对错误的展示,使其逐步完善,准确度越来越高,想必没有人能够拒绝这个请求。
Pornhub AI系统工作方式:
迄今这套系统已经扫描了大约 50 万部视频,但 Pornhub 希望能在 2018 年初之前完成对所有视频资源的扫描和标记工作。(还是别让唐马儒上了,估计会死)
Pornhub 最终希望能给用户提供多种形式的产品,无论他们有什么样的嗜好,采用的新系统都能为用户展示更准确的结果,提高用户的回访率。Pornhub 认为用户搜索和找到资源越容易,他们的愉♂悦♂感就越高。
不过与此同时,人脸识别技术也引起了人们对隐私问题的担忧。一些报复性的视频常常会被上传至某些知名的不可描述网站,还有些人发布了自己的视频但想保持匿名。对此 Pornhub 称他们采用的系统绝对没有任何用户隐私方面的隐患,因为软件仅识别数据库中的知名成人演员的脸部数据,不会识别非从业者,而且如果演员戴着面具或者脸部模糊不清的话,软件就无法识别。这样以来,一些戴着面具或者想保持匿名的演员的真实身份,外界就无法知道了。
尽管上述这一系列操作听起来有点变态,但是 Pornhub 的 AI 系统本身的确功能强大。比如它还能发现和矫正人类操作造成的错误。
Pornhub 利用该系统可以发现低质量的重复视频和一些资源的浓缩版,然后删除。当然了,它最厉害的地方在于能够利用 CV 技术,自主学习怎样有效地自动识别和标记视频,并添加描述内容。通过 AI 系统和机器学习,Pornhub 相信能够提供更好的搜索体验、更高质量的视频和更少的重复资源。
拓展阅读:
或是邮件反馈可也:
askdama[AT]googlegroups.com
订阅 substack 体验古早写作:
关注公众号, 持续获得相关各种嗯哼: