有人提出,这个系统可能会被一部分人用来寻找“滥交的女性”,从而变成约炮工具,你有考虑过这个问题吗?
不存在这个可能。这个查询系统需要通过eID(公民网络电子身份标识)实名认证后注册登录,不经过本人同意是无法查询的。增加人脸识别作为二次确认后,只能查询自己是否有视频或图片被上传到色情网站。
文
陈怡含
编辑
陶若谷
5月28日早上,程序员李旭(化名)到自己的公司后,发现前一天发的一条微博在网上炸了。评论区里,骂声扑面而来:“以荡妇羞辱为本质”、“对他人隐私的完完全全地侵犯”、“违法而满足一己私欲的炫技”……
半年时间,多TB数据,利用海外一些主要色情网站采集的数据比对微博等社交媒体,李旭在名为“将记忆深埋“的微博里写,他们“在全球范围内成功识别了10多万从事不可描述行业的小姐姐”。
简单说,他和他的团队利用图像比对的原理开发了一套AI系统,用来识别社交媒体上“滥交的女性”。年8月13日,他首次在网络上发布了关于这个项目的构想——
“鉴于很多人都在说程序员是各种退休小姐姐的接盘侠,我联合了几个小伙伴准备把各种色情网站上的视频和图片打tags后去做匹配,为码农朋友们做一个初步过滤。”
专栏作家侯虹斌告诉《极昼》,女性选程序员作为’接盘侠’,“完全是他们一种非常荒诞的想象”。相反,她提到美国警方曾在一两年前公布过一项数据,某次“钓鱼执法”抓到的上百名男性嫖客里,中文姓名的超过1/10,身份是在当地工作的程序员。她认为,李旭从头到尾都是要为男性谋福利,“带有极其男权的视角,猎奇、猥琐的那种”。
侯虹斌认为,视频中的人不管是不是性工作者,一定有被偷拍的、被迫的。本来这些视频只有很少一部分人才会看到,但经过他们传播,色情网站的浏览量一定会暴增,对受害女性会二次伤害,除非这个系统完全没有影响力。
“我一直在尝试解释,但已经没有人愿意听了。”李旭接连发布多条微博,说明查询需要通过实名认证和人脸识别,仅供本人检测是否在网络上被传播过不雅视频和图片;项目并非为了盈利,而是想帮助“真正需要帮助的人”。他原本计划“在解决法律问题后公开发布(这个查询系统)”。
数轮辩论后,他关闭了评论功能。5月31日,他取消了前一日宣布的开通直播间接受所有媒体采访的计划,只留下邮箱地址,用以回应公众的质疑。随后,他删除了项目的所有数据。
《极昼》通过邮件联系了李旭。他逐一回复了问题,答案总是简短、概括。李旭在德国创业,有自己的科技公司。微博简介里,他给自己加上几个标签:异性恋,C/C++,Lisp,JuliaDeveloper,Startup,非著名黑客,人工智能砖家,aka(AlsoKnownAs)真伪书生。
"我们筛选出了不到11万女性,拥有微博或抖音帐号的不到0人"
极昼:你做这个项目的灵感和初衷是什么?
李旭:最初是为了寻找那些滥交的女性。但在项目真正启动后,我觉得女性可以用它来查询色情网站上是否有自己被迷奸、诱奸的视频或图片,并且它可以让她们尝试发送“DMCA删除请求”给色情网站,这样可能会更有意义。
(编者注:DMCA全称为“DigitalMillenniumCopyrightAct”,即美国的《数字千年版权法案》,是保护网络作品著作权的法律依据。)
极昼:你怎么定义“滥交的女性”?身边有吗?
李旭:就是网上一些炫耀自己睡了多少男人、喜欢群交的女性。父母曾经教育过我要远离那些“乱七八糟的女性”。我身边没有。
极昼:为什么要寻找她们呢?
李旭:我有一个朋友,十多年前上大学的时候认识的,他被这种人伤害过。去年,他染上了HIV,问我借钱治病。他谈起这件事的时候很懊悔,也带着绝望。患病对他的影响很大,原本挺开朗的一个人,变得沉默寡言。现在他身体还好,仍然在治疗中。
极昼:女方是性工作者吗?
李旭:我不好给别人乱贴标签,不知道是不是职业性工作者。但我在色情网站上发现了那个女孩和一些黑人的性爱视频。
她并不知道自己被感染(HIV),不是恶意隐瞒。得知我朋友患病之后,她也很绝望。
极昼:项目真正启动后,想法为什么发生了转变?
李旭:我们在抓取数据后发现,在欧美色情网站上,有很多中国女性被偷拍的性爱视频,而且在一些社交平台上,还有人用视频和图片炫耀自己和多少个中国女性做过爱。
后来我们在全球筛选出了不到11万女性,其中拥有微博或抖音帐号的,只有不到0人。这个数字在我意料之外,却也在情理之中,因为我们并没有采集到太多的国内社交媒体的数据。
极昼:为什么只做女版,不做男版?
李旭:因为采集数据的时候,并没有采集男性社交媒体数据来进行大规模训练,仓促做男版误报率可能会非常高。而且我现在工作很忙,没有太多精力来做。
“做项目时没有考虑那么多”
极昼:你在微博上说“联合了几个小伙伴”,能介绍一下你的团队吗?
李旭:一共有七个人,来自不同国家,其中有一个女性。他们都是我打电话邀请的,其中两个人有过犹豫,担心程序做出来后被滥用,最终大家在线下见面,一起讨论了整个项目的社会意义,以及如何保证数据不被滥用,才确定下来。
极昼:能形容一下他们都是什么样的人吗?
李旭:可以说是Geek(极客),也可以说是OldSchoolHacker(老派黑客)。
极昼:中途有人退出吗?
李旭:没有。
极昼:你们是否考虑过合法性问题?从什么时候开始的?
李旭:做项目的时候并没有考虑那么多,两个月前开始考虑。我说过很多次,在做好完整的隐私条款、解决法律问题之前,这套查询系统是不会发布的。
极昼:系统的数据来源是什么?是否会有侵犯隐私权的风险?
李旭:目前的数据来源于互联网的公开数据。至于采集社交媒体数据,那是没办法的事儿,因为前期需要数据做支撑,进行规模训练。商业化的情况下,可能会存在部分侵犯隐私权(的风险)。
(编者注:西安交通大学苏州信息安全法律研究中心主任马民虎告诉《极昼》,根据我国的《网络安全法》,未经本人同意在社交网络收集个人信息是一种非法行为。如果有中国用户使用这个系统,开发者就会面临违反《网络安全法》的风险。
中国人民大学法学院教授张新宝补充,鉴于开发行为在德国发生,开发者会触犯到欧盟去年5月25日出台的《通用数据保护条例》。这一条例曾被评价为“史上最严个人数据保护条例”。)
极昼:性爱视频网站上有大量的偷拍,如何甄别摆拍与偷拍?
李旭:通过摄像机的角度和位置来区分。
极昼:如何甄别性交易与伴侣之间的性爱视频?
李旭:无法甄别。
极昼:这样可能会影响到不是性工作者的女性?
李旭:这个查询系统需要通过eID(公民网络电子身份标识)实名认证后注册登录,不经过本人同意是无法查询的。增加人脸识别作为二次确认后,只能查询自己是否有视频或图片被上传到色情网站。我不认为这样会影响到别的女性。
极昼:通过eID系统来保障隐私权,在技术上如何实现?
李旭:欧盟年开始推行eID,目前在很多国家已经完全普及。eID服务是可以随便申请接入的,在中国也一样。
(编者注:马民虎教授解释,eID与二代身份证网络认证不同,后者的应用受到《中华人民共和国居民身份证法》的保护,而前者在我国的普及度并不高,国家也没有在法律层面推行。
中国公民网络身份识别系统的