央视网评:“爬虫”滥觞 窃取数据的行径该整肃了!

来源:未知    作者:      2019-10-12 16:04

导语:

最近,多家知名大数据风控公司身陷丑闻,他们运用“爬虫”技术侵犯用户隐私,滥用数据,还涉嫌助力放贷和催收。这又是一种披着科技创新外衣,做着“挂羊头卖狗肉”的传统生意,值得多方警惕。

我们不否认大数据对产业升级和提高决策效率有巨大的作用。特别是大数据风控,日益成为金融决策的数字化大脑,广泛应用于银行的贷款审批和反欺诈方面。

按理说,大数据风控公司的商业逻辑应在于研判数据规律,减小风险,控制损失。但事实呢?他们在爬取数据、贩卖流量。常见的情形是,一些公司运用爬虫技术获取用户的信息,如购物流水、通讯录联系人、银行卡账单,支付宝和微信交易记录,以及公积金和社保等数据,然后打包出售。在买家当中,不少是放贷公司,他们甚至有这么一个“风控奇招”,买下大数据公司爬到的其他贷款公司的数据,根据“他家放多少,我这就放多少”批贷,直接省去了风控环节。其实,第三方大数据公司提供的风控报告,几乎都是个人信息泄露报告汇总,基本无任何大数据分析。

爬取用户或同行的数据是如此低成本、如此快捷,让大数据风控公司走上了赚快钱的路子,背离了风控的本意。这还反过来提醒我们:真正意义上的大数据积累及其风控是一门慢活,数据的研究应用更是难活。

在概念包装和故弄玄虚之下,我们需要认清现实中大数据行业的发展,普遍还处于“刀耕火种”阶段。在金融风控中,从多数银行实际落地情况看,“智能风控”或“智慧风控”其实也就是把人工操作流程和各种统计报表电子化、线上化罢了。进一步看,人们想象中的大数据风控的一个基础功能就是预判风险。遗憾的是,频频发生的银行卡被盗刷事件,暴露出当前的风控水平远远做不到识别欺诈交易并进行拦截和处置。再譬如,金融机构的“反洗钱”风控中,本希望通过设置一定的参数和规则,让系统判断交易是否存在洗钱嫌疑,但从时间看,预警都是“事后”的,等发现的时候,损失已经发生。

更可笑的是,扯着科技大旗的大数据风控,十分依赖于人工。日常业务场景中,很多企业即使搭建了风控平台,也可能会因为需要,迁就用户的体验性和业务的流畅性,使得机器的自动判别受到人为干预。特别是在现金贷中,很多企业在利益驱动和员工的业绩分成机制下,风控流于形式。

可以看出,大数据风控在错误的方向上野蛮生长,在必要的路径上发育十分不足。还可以这么说,能看得出来的风险,不需要大数据也行;真正的风险,目前的大数据风控水平也难甄别出来。

爬虫技术的滥觞,一个客观原因在于,第三方公司不像电商平台或商业银行那样有足够的独立数据来源。大数据风控发挥作用的前提之一是数据要足够多,越多维度的数据,用户的画像越清晰,风险源越清楚。当前,数据还零散地分布于各个角落。且不说工商、税务、征信、司法、社保等信息彼此割裂,就是各家企业之间,企业内部部门之间都会“各自为战”。常见的情形是,向一家银行申请消费贷不通过,换个银行周转一下,就能倒腾出来,因数据割裂,跨行的交易监管一直是盲区。因此,所谓的数据之“大”,实际上量级和维度都很有限,制约着行业的发展和风控的效果,打破“信息孤岛”势在必行。

爬虫技术的滥觞,“得益”于长期以来的监管缺位,充分暴露出我们对用户的隐私安全保护的意识和力度明显不足。虽说技术本身无罪,但是人心会有。江湖骗子谋财害命可恨,窃取信息、贩卖信息的人同样可恨。这轮行业的整肃和“寒冬”的到来,是一次正本清源,冬天越冷,冻死的蛀虫越多。靠爬虫技术窃取数据的路子,注定是无法持久的,提升数据的加工处理能力,服务社会、实现普惠才是未来的意义所在。