虚假账号不断进化,AI能做的还是有限

  • 日期:01-06
  • 点击:(1140)


你的社交平台有多少粉丝?

1000?一万?还是更多?你知道他们当中有多少“僵尸粉丝”吗?

最近,根据美国权威科技媒体《信息》援引的研究机构Ghost Data的一份报告,2015年Instagram平台上僵尸账户的比例为7.9%,至今已攀升至9.5%。Instagram的读者人数已经增加到10亿。根据上述比例,Instagram现在拥有约9500万僵尸账户。

一些媒体评论指出,如此庞大的“僵尸账户”使得Instagram成为下一个互联网行业打击虚假新闻、虚假信息和政客营销的重要阵地。

你为什么这么说?恐怕我得看看近年来“网络水军”的“杰作”。2017年,至少有18个国家在选举期间遭遇了在线操纵和虚假信息策略,包括德国联邦总统选举期间活跃的社交机器人和频繁的垃圾新闻。

显然,管理“网络水军”已经成为一个全球性问题。然而,由于其分散性、海量性和技术隐蔽性,其管理需要更加专业化和智能化。此时,人工智能也被投入使用。

比道路高一英尺,比魔法高一英尺。从创建应用软件、官方网站或内容传播平台到制作包含大量内容的图像、视频或文本,假账户通过与用户交互(无论是真的还是假的)变得越来越“真实”。就在去年,研究表明,即使是人工智能也可以用来生成复杂的评论信息,这些错误的评论不仅无法被机器检测到,也无法被人类读者区分开来。

虚假账户不再是“虚假”的,整个社交网站正面临潜在但严重的影响。智能相对论(aixdlun)分析师严萱梳理了三种智能“认证”方法,包括用户行为、内容和情感特征三种形式,试图解决这一问题。

首先是对用户行为特征的分析。该方法大多依赖于爬虫技术,即通过主动爬行特定微博或论坛主体相关的注册行为、社交行为、转发和评论行为,进行多维特征向量表征。同时,一些研究者也使用隐马尔可夫模型对用户行为进行建模,并使用模型参数对用户行为进行识别和分类。毕竟,“僵尸”属于“植物”,而且总是不同的。

这主要是利用账号之间的社会关系来识别那些“僵尸号”。然而,面对这种方法,水军“与时俱进”。例如,一些专业法官的账号在注册行为上无可挑剔。他们的账号通常配有身份证、用户手持身份证照片、实名手机号码卡、实名银行卡等。他们还可以通过欺骗软件欺骗实名认证系统。甚至微博上的“僵尸粉丝”也会有一些粉丝关系。

第一种方法是“退出游戏”,人工智能必须想出第二种方法,即分析内容特征。基于内容分析的识别技术主要从发布内容本身开始,建立“僵尸粉丝”、恶意或美化信息等本体模型,同时建立敏感的语义数据库,通过语言特征统计来区分虚假账户。

然而,由于语义场的不统一,同一本体在不同的领域,甚至在同一个领域,都有许多象征意义。例如,当用户讨论手机时,他们会说“这个手机在互联网上真的很快”,而“快”是一种赞美。如果他们说“这部手机耗电如此之快”,那么“快”就变成了一种批评。因此,内容特征模型在不同的情况和平台下会发生很大的变化,这也导致人工智能在分析内容特征和识别“僵尸粉丝”方面通用性差的问题。

从这个角度来看,仍然很难基于一个特征来识别虚假账户,所以人工智能必须开始考虑第三种方法。第三种方法源于第二种方法,即分析内容中的情感特征。

一些研究人员发现,在线社交网络中内容的创建和传播与股票市场的波动、期货价格以及国家和社会的重大事件密切相关

然而,用于虚假账户监控的内容和情感特征的集成是一个相对明显的特征,同时忽略隐藏的异常用户,例如上传与文本内容无关的图片的用户,或者评论情感和用户评分不匹配等新特征的用户。

当网民开始对水军麻木时,活着的水军实际上已经死了。

事实上,网络水军只需要错开发帖时间,编辑同一个核心的不同文本内容就可以操纵舆论。虽然这样做的成本会更高,但具体操作并不困难。如果有人真的想给一件作品一个不好的评价,人工智能不能立即判断他是一个真正的使用者还是一支水军。

我们对这些假账户无能为力吗?

新浪微博是第一位突破1亿粉丝的女艺术家。我们不会真的相信有1亿人关注她。当一部好电影上映时,没有人会在意一些奇怪的坏评论,即使它很受欢迎。消费者也会对100%受欢迎的产品产生怀疑。疫苗事件后,网民给调查记者的电话实际上是一种自我保护.我不得不说,中国的舆论形成和监督机制正在更新,水军操纵舆论的力量越来越弱。

以最近的疫苗事件为例。事件刚爆发时,也有一些别有用心的人编辑了一些疫苗残疾儿童的照片,但没有做出任何书面解释,在许多人当中引起恐慌和愤怒。然而,作者在其中发现了许多合理的评价,表明疫苗的不良反应也是客观存在的。这种危言耸听的言论反而会阻碍健康疫苗在中国的普及。

目前,关于疫苗流程的网上查询、相关人员的查询、各种po文件都是合理的,也是许多网民理性思考的结果。

因此,虽然虚假账户的痕迹越来越隐蔽,但网民的理性和成熟也在加速,越来越多的网民不再盲目信任。相反,他们会批判地看待每一个观点,从感性到理性,从感性到理性,社会软件的观点变得越来越多样化,而网络水力量越来越难以控制舆论的趋势。