快捷搜索:

大数据行业的替代方案又在何处

“现在有没有什么好的数据源?有什么替代规划?”全部破费金融行业惊惶掉措地迎来了“去爬虫”期间,尤其是现金贷受影响最大年夜。探求替代规划,成为当下最紧迫的问题。

图片来自“Pixabay”

9月,魔蝎科技、公信宝、聚信立等第三方风控行业头部公司接踵被查询造访或被波及,使得全部行业主要爬虫办事出于避险斟酌基础停息。

虽然监管意在管理“套路贷”“超利贷”等违规贷款产品,然则大年夜部分爬虫办事停息的影响却波及到全行业。

一位破费金融行业资深风控人士奉告零壹财经,据他懂得,银行类机构在这次事故中受影响的数据线大年夜约在10%阁下,其他非持牌金融机构受影响的数据线更是高达50%。

数据缺掉,迫使全部破费金融行业进行风控策略的大年夜调剂。

痛别爬虫

“爬虫,是全部大年夜数据风控行业的灵魂。”一位大年夜数据风控公司人士指出,大年夜多半大年夜数据风控公司本身并没有那么多半据。

由于数据是从营业傍边来的,然则有大年夜量数据源的机构实际上并不多,多半大年夜数据风控公司的数据是靠爬虫爬取。

爬虫办事停息,破费金融行业的公司都若干受到影响,此中现金贷是重灾区。

对现金贷来说,受影响最大年夜的有两方面数据:运营商数据和电商数据。

一位网贷平台治理层人士表示,爬虫为风控供给的信息对照广泛,各家网贷公司经由过程爬虫获取的数据维度都不完全一样,然则在现金贷产品中,运营商数据和电商数据是运用最为广泛的两类数据。这两类数据对714等高炮产品的影响是致命的,由于这些产品的风控对这两类数据依附极大年夜,对其他现金贷产品影响比714等稍弱。

他解释,一样平常来说,对付现金贷来说,有三项数据对照关键:运营商数据、电商数据、信用卡数据。

运营商数据,可以经由过程通话记录客不雅反应和用户关联的联系人,从而可以用来做催收。

电商数据,因为电商一样平常会送货到家,这是由真实买卖营业验证过的客户信息,用来做身份验证异常有效;此外,电商的破费环境也可以在必然程度上反利用户的破费能力,从而评估信用。

信用卡数据,则是异常核心的金融借贷信息,判断用户信用直接有效。

然则,运营商数据和电商数据很难经由过程爬虫之外的道路获取,是以供给现金贷的公司一样平常都经由过程爬虫来获取这些数据。

“因为监管较严,并不是谁去接数据,运营商或者相关的三方风控办事都乐意供给,每每要求天资。而且,运营商供给的数据都不是原始数据。电商数据则异常难接,比如阿里自己就有贷款产品,它只为自己段系内的产品供给风控方面的支持。”一位风控行业人士走漏。信用卡数据,714等公司运用较少,现金贷公司有的会利用,然则利用并不是十分广泛,是以这次影响面不大年夜。

现在,运营商数据和电商数据的缺掉,使得大年夜多半破费金融类公司都不得不调剂风控规划。

探求替代规划

探求替代规划,是当下最紧迫的问题。

首先被想到的替代规划是自建爬虫团队。然则,据懂得,这样做的公司今朝并不多。缘故原由是从无到有自建爬虫团队的资源对照高,而且要自建爬虫团队,关键是要挖到相宜的人,这方面的人才尚有缺口

更麻烦的是,自建爬虫团队恐非长久之计。一位风控行业资深人士奉告零壹财经,假如自建爬虫团队,照样涉及到爬取数据违规、侵犯小我隐私的问题,问题在“强制授权”上,而不在“雇佣第三方爬”照样“自建团队爬”上。

自建爬虫团队的设法主见被放弃之后,能不能接入其余数据源,成为首先被斟酌的偏向。

国庆节前后,许多有现金贷产品的公司在亲昵打仗能够打仗到数据的机构。此次受影响不大年夜的机构,如银行、BATJ旗下金融科技公司、头部P2P平台、破费金融公司等被摸了一圈。

有业内人士走漏,今朝接入头部P2P公司、破费金融公司可能是对照好的替代规划。“要和银行对接,最少要6个月之后,光阴太长,等不起。BATJ这些机构都不会给我们接,只有一些头部P2P机构乐意和我们谈,而且对接光阴也不用太长。”他走漏。

这此中,机构之间的互相对接,都开始“看身份”。

一方面,一些稀有据源的机构只乐意与持牌金融机构相助;一方面,持牌金融机构,也要看相助方是否得到了合法的数据源授权。

不过,耐人寻味的是,事实上最为合规、并且被觉得是大年夜数据风控未来偏向的替代规划——联合建模,虽然今朝市场热度有所上升,然则身处此中的公司,差异却很大年夜。

联合建模“冰火两重天”

国庆节后,零壹财经扣问多位联合建模业内相关人士,营业量是否有大年夜幅度提升,获得的回答不尽相同:有的公司贩卖电话被打爆,有的公司只是营业的扣问量有必然程度的上升、签单量也有上升,然则实际成交量并没有“暴涨”。

联合建模是大年夜数据风控行业最为合规的营业,2015年前后就已经在市场上呈现。

一位业内人士表示,着实最早联合建模的呈现,便是为了办理一个问题——很多半据对金融机构的风险节制很有用,然则出于用户隐私保护的身分,这些数据没法拿到,没法被金融风控营业运用。

联合建模的终纵目的,便是既保护用户隐私、又节制好金融风险,由于这项技巧可以在双方数据不出本地的环境下,运用数据建立风控模型。

然则,在这次大年夜部分主流厂商的爬虫办事停息之前,联合建模市场并不大年夜。

据业内人士预计,业内用联合建模这种规划进行风险节制的公司大年夜概只占四成,六成的公司都是经由过程爬虫获取数据。这此中的缘故原由有两个:

一个是资源,联合建模的资源对照高,比如联合建模一个模型就必要至少10万元,质量好一些的联合建模,加上商务洽谈孕育发生的用度至少30万,有的则可能高达50万,对规模较小的公司来说并不划算。

另一个缘故原由是数据,不少金融公司主如果珍视外部的一些紧张数据源,而不是建模能力。而在实际营业中,短缺数据源的联合建模,其效果也不是分外好,在市场上短缺竞争力。

这次联合建模公司处境差异大年夜,其缘故原由主要在“数据”。虽然全行业都在探求替代规划,然则大年夜家都是在探求可替代的数据源。“虽然说是在找联合建模,但着实假如你有独特的数据源,别人才会和你联合建模。假如你没有,只有技巧,那就不可。”一位行业人士坦言。

多位业内人士走漏,还有一个独特的征象是,联合建模这个领域,做得好的公司“闷声发大年夜财”,市场上险些看不到他们的鼓吹。而在到处做市场推广的公司,实际上营业做得并不多。“由于那些做得好的公司不必要鼓吹,全行业都知道他们。”他表示。

不过,跟着监管的加强,联合建模被业内觉得确凿是未来的偏向。由于跟着对数据合规的监管日益严格,联合建模将成为不得不选择的规划。

虽然现在很多做联合建模营业的公司都还在A轮和B轮的阶段,大年夜多半规模还很小,然则有行业人士猜测:“未来三年,联合建模应该会越来越热,可能变成‘红海’,而且会徐徐形成对照显着的行业格局。”

滥觞:零壹财经温

您可能还会对下面的文章感兴趣: