互联网领域数据造假

孔府菜2022-07-13  20

文/王新喜

最近两年,随着互联网行业竞争的加剧和互联网创业热潮的兴起,过度宣传、过度包装的行业数据不时被曝光,对某个产品领域的争夺也使得数据乱象时有出现。第三方数据因统计口径“不满意”,导致厂商间口水仗频发。

从正常的逻辑来看,数据不会说话,也不会说谎,但如果数据消息背后的人对抛出的数据进行过度修饰,往往会演变成互联网行业的“花剌子模使者”事件(花剌子模是中亚的一个古国,有着古怪的习俗。所有给国王带来好消息的使者都会被提升,给国王带来坏消息的会被送去喂老虎)。这背后的原因是什么,从永不说谎的数据到「破烂的子模式信使」?

自说自话盘点互联网数据:大部分是因为对竞争加剧或融资困境的焦虑

我们来盘点一下出租车行业。早在2014年,滴滴(当时也叫“滴滴打车”)发展迅速。当年年初,滴滴打车公布了与微信支付合作后的报告单数据。2014年1月10日至2月9日,滴滴微信总支付订单约2100万。然而,当年2月7日,北京晨报记者收到腾讯的数据,却显示自1月10日起,打车微信支付订单总数已超过500万。业内质疑其数据:2月7日-2月9日,500万-2100万的数据水分太多。当时腾讯公关部表示,2月7日发布的数据为1月10日至1月26日,由于表述不清造成了歧义和混乱。当时出租车行业的投资机构越来越多,砸广告、疯狂补贴抬高估值成为出租车行业的普遍现象。日均订单等数据成为投资者衡量出租车行业前景的重要指标。

1.png

再来看电商和O2O行业。猫眼去年发布的一份数据显示,2015年7月,旗下电影月交易额高达22亿。国家电影基金办数据显示,2015年7月,中国电影票房达54.9亿元,其中46%来自电商票务,约25.3亿元。这个25.3亿的电商票务市场主要被美团、百度糯米、淘宝、格瓦拉、微信、大众点评等产品瓜分。根据猫眼的数据,如果仅猫眼就占了22亿,其他票务电商总共只有3.3亿。就这样,几乎90%的猫眼电影都是独家的,当时有业内人士感叹:这是因为百度糯米、淘宝电影、微信、大众点评、Time.com、Douban.com、在线票务网、格瓦拉、微票等在线票务平台被视为空气。当然,这也和当时激烈的竞争环境有关,财大气粗的BAT强势进入,打响了补贴大战。猫眼电影已经感受到了巨大的压力。

2.png

行业分析师认为,康佳可能急于推广其蜂鸟分销系统,无意中说出了真相。这背后,是2014年5月获得大众点评8000万美元投资后,张的饿了么开始了持续疯狂融资烧钱的旅程,目前还在苦苦寻找下一轮融资。对于投资人来说,O2O外卖行业最重要的价值指标无疑是日订单量和用户数。这是一个需要投资者掏钱失血的游戏。它需要依靠漂亮的数据来提振估值。

3.png

去年,引起业界关注的是一亩田的交易数据涉嫌造假。同样是在去年7月下旬,多家媒体发表文章称当时一亩田的交易数据存在造假。以“9小时前,老板购买了1073741.8235吨洋葱”的交易信息为例。单次收购107万吨洋葱,已经超过洋葱产区西昌30万吨的年产量。但一亩田造假运营数据的曝光,以及之前被质疑的饿了么6.3亿美元F轮融资的“水分”,显然与需要继续融资和烧钱密切相关。一旦投资方停止输血,烧钱模式的创业公司往往会破产,手里有钱不断推动外界的想象空,或者被巨头成功收购成为其代理人和战略棋子,都是成功。

4.png

互联网数据造假的先进性还体现在可以通过先进的代码技术实现。比如去年11月,手机音响领域的蜻蜓FM被媒体曝光。它通过使用Prometheus和Zeus两个强制自开代码,在用户手机后台启动无窗透明界面,传输给第三方数据统计公司,从而伪造DAU(日活跃用户数)、广告展示和广告点击。后来喜马拉雅FM发布了《蜻蜓FM四问:你敢肯定数据造假吗?FM当时发出回应,“不管是谁恶意攻击,我们都不怕”。这反映了当前移动音频行业背后的竞争恶化。

有问题数据的最新例子是地图服务的用户数量。春节前夕,百度地图在湖南卫视春节期间的广告中提到了“5亿人用百度地图”的口号。一个多月后,高德地图也宣布,截至2016年1月底,高德地图用户数量已突破5亿。但从大部分第三方数据机构提供的统计数据来看,高德的用户规模和活跃用户数据可能还是有疑问的。从国内主流安卓市场,如百度手机助手、应用宝、360手机助手、豌豆荚等应用市场来看,百度地图和高德地图的下载量应该反映了数据的大致基本面。我们收集了相关数据:应用宝百度地图有5亿次下载,高德地图有2亿次下载;30手机助手显示的数据是:百度地图:4.62亿,高德地图:3.06亿。豌豆荚显示的数据显示,百度地图安装量为1.6亿人,高德地图安装量为7893万人。

5.png

虽然各个电子市场的用户群体不同,但基本面已经反映了大势。从各大电子市场的数据来看,高德地图的5亿用户基数缺乏来源口径的支撑。在iOS端,虽然高德是苹果中国地图数据的独家供应商,但苹果用户和高德地图用户并不能直接划等号。更有意思的是,在高德地图宣布“用户数突破5亿”后,苹果App Store于3月1日更新了新版高德地图,但在该版本提供的产品介绍资料中,高德地图仍标注“3.2亿用户正在使用”。

6.png

为什么互联网行业被大众质疑数据掺假事件频发?

当然,互联网数据自说自话的现象远不止这些,包括二手车市场、在线旅游市场等很多案例。笔者在这里举了不同的例子,其中归根结底是对产品的不自信。但同时我们可以看到,互联网数据可疑的案例基本都会发生在互联网的热门领域,如O2O、电子商务、互联网地图、打车、在线旅游等。互联网行业频频被大众质疑数据掺假,有多重原因。首先,对于互联网行业的公司来说,他们的业务基础基本上是基于用户增长率的盈利模式和估值模式。日活跃用户数和增长速度可以直接影响公司的融资估值。从传统互联网的起步阶段,用户注册、排名关注度、电商销售额、订单、转化率、增长率等数据指标。已经成为衡量一个公司商业模式健康程度和盈利模式想象力的基本指标。[/k0/]移动互联网时代,APP下载量、日活跃、打开率、留存率、交易量等。已经成为核心指标,他们依靠这些指标来吸引投资和广告。创造更高的购买价格,而在传统互联网时代,用户注册数和点击率都可以交给水军。移动互联网时代,无论是点击率还是APP排名本身,也可以依靠水军或者第三方计费公司、服务商来做。可以说,互联网公司的造假与互联网本身的基因,即盈利模式和增长模式密切相关。这是其中之一。

其次,一些创业公司需要夸大数据,以利于融资到投资人的想象空。近年来,在互联网创业大潮下,众多创投机构和孵化器如雨后春笋般涌现,互联网领域的创业充满活力。风险投资和投资机构特别喜欢在互联网领域创业。从创业者的角度来说,当数据被夸大后,会方便他们更有利的融资,助推上市估值,被巨头收购或投资。相对来说,数据最有说服力,是拿钱的有利筹码。但与此同时,当投资人陷入这场博弈,基于自身利益,便于创始人提高估值,推更多融资继续烧钱,也便于他们在利益高点顺利退出。投资者会对数据造假视而不见。因为投资者往往或被动或主动地成为数据造假利益链条中的一环。

其次,互联网企业的考核机制。在互联网公司,基本的KPI考核指标都需要运营数据来量化。基于各自的利益,一个企业内部的不同团队,甚至一个团队的不同成员,一旦达不到预期的量化目标,就会在执行过程中开始尝试猫腻战术,比如部门之间的相互KPI指标,跨部门协作或者第三方合作伙伴。在同一个利益链中,通过相互理解,将有可能修改和扩展数据。与合作伙伴联合第三方数据造假已经成为行业默认的潜规则,数据注水往往开始向地下发展。但是,如前所述,其中有些涉及数据篡改的技术内容。总而言之,互联网行业的数据造假,线下、线上等技术都可以用在第三方数据机构和传播稿件的多线操作上,漏洞很少。正如一些网友所说,这相对体现了互联网的“先进性”。第三方数据机构也可能被质疑为权力寻租的工具,比如去年底艾瑞咨询和今日百科的互撕。

一个是巨头之间的竞争。百度地图和高德地图的数据纠纷就是如此。地图并入阿里后,高德一直坚守自己的基础功能,砍掉了原有的O2O业务,宣布“专注地图导航”。然而,2015年6月,高德地图似乎不愿意让百度抛得太远,开始切入O2O领域。在这一年中,高德反复与惯例主义作斗争,球队遭受了很多痛苦。被收购的互联网公司也有几个通过数据修改的意向。一是可以避免在巨头的羽翼和架构中被边缘化,同时可以获得更多的资源支持和资本输血。随着在线地图在用户级市场的竞争越来越激烈,用户数量成为重要流量渠道和O2O入口的重要指标,否则在很多业务格局下注定会被边缘化。

数据造假影响用户认知:影响用户和投资者对企业诚信和信任价值的评价

当然,数据造假的受害者是用户。用户经常看企业的数据做决策,也有很强的从众心理。比如在电商平台上,一旦公布交易规模,往往会影响用户的购物意向,刺激用户转向平台消费。所以数据在一定程度上影响了用户的判断。通过日复一日的数据灌输,消费者会逐渐认同这种认知,这也是洗脑的过程。造假被曝光后,必然会面临一系列的行业质疑和投资者对企业价值的重估,也会影响用户对企业诚信和信任价值的评价。也将推动整个VC圈对互联网成长型企业有一个更全面的评价标准。互联网运营数据和影响用户判断、损害用户利益的行为时有发生,这也与行业恶性竞争有关。目前互联网各个领域的格局已经相对固化,新进入者难以出人头地,人口红利趋于枯竭。当整个行业已经进入目标市场相对成熟与增长受限空之间的战斗时,市场竞争往往会陷入低水平的重复竞争和数据战争。

个体欺诈一旦变成集体欺诈,显然不利于整个行业生态的健康运行。也催生了整个行业的泡沫。赛峰亚洲投资基金首席合伙人闫妍在早些时候的一个论坛上发言,称互联网行业存在大量泡沫。我们遇到的情况是,初创企业对点击率、用户转化率等数据进行了全面造假,夸大造假已经成为中国互联网的常态。

避免数据夸大成互联网常态:需要一个中间机制来推动数据监控机构和企业实现制衡

目前来看,如何杜绝数据造假可能是一大行业难题。有业内人士认为,会计师事务所介入互联网企业的数据服务可能更加严谨,但会计师事务所的介入最终是为企业服务的,其中权力空的寻租必然极大,因此企业持有的第三方机构与第三方数据机构的可靠性本质上没有区别。随着新群体的介入,必然会出现一个服务于数据的新产业链。

而政府的干预呢?例如,据报道,北京市工商局此前通过行政建议书等形式公布了第三方商家售假信息,并在各电商平台间建立了第三方商家资质和信用管理制度。因为互联网平台本身缺乏信用认证体系,而且很多平台往往有多种数据操纵方式和模糊演算规则。在这个规则下,数据迷雾重重,真假难辨。某种程度上,企业数据造假的本质没有变,只是手段变了。但是,第三方的认证,尤其是政府背书的权威第三方的认证,是否真的能保持独立性和真实性就不好说了,因为缺乏监督和制衡机制,必然会出现灰色地带和权力寻租空。也有业内人士表示,判断数据真假,用一两个渠道来反推他的打新和日常生活,是比较有效的方法。总的来说,需要一种机制来促进数据监测机构与平台企业之间的平衡,而只有第三方数据监测方与平台之间的平衡,才能监测到企业发展过程中的一些真实有效的数据,并给予用户正确的认知。

互联网行业的“花刺子模使者”:它无法隐藏用户对劣质产品最真实的直觉

数据的修改掩盖不了业务发展本身的规律和产品基础的缺失,很多风投已经醒悟了。很难保证互联网上的数据造假不会催生新一轮的泡沫和资本寒冬,相对降低投资者对行业的信任度。很多投资者捂紧钱包,逐渐少烧钱,对行业也是有利的,因为适度的泡沫有利于行业降温。它让行业回归理性,让资本非理性的独角兽回归正常估值。数据故事还能继续讲下去,掺水经营和财务数据泄露的负面效应会继续放大,给业务和品牌带来沉重打击,削弱整个公司的信任价值。

王小波当年在《花剌子模的信使问题》一文中写道:在古老的中亚国家有一个古怪的习俗。凡是给国王带来好消息的使者都会被提升,给国王带来坏消息的会被送去喂老虎。于是将军们都出去了,他们手下的士兵都被派去给国王报信,好让他们得到提升;如果他有罪,他会把坏消息和食物送给国王的老虎。王小波这里说的是,中国现代学者中有很多“好消息使者”,尤其是人文学者。但现在的互联网行业也是如此。他们认为,只要带来坏消息的人被杀,坏消息就不复存在。很明显,如果鸵鸟把头埋在沙子里,狮子还是会扑向自己。一旦皇帝的新衣被戳破,数据游戏带来的将是自欺欺人后无法掩饰的尴尬和行业公信力的丧失。更重要的是,数据并不能永远掩盖用户对劣质产品体验最真实的直觉。

转载请注明原文地址:https://juke.outofmemory.cn/read/712435.html

最新回复(0)