气浮机

蓝象智联童玲:做数据要素市场的“铲子”、“厨房”和“大厨” 解码数字新浙商No94


来源:欧宝全站app    发布时间:2023-12-21 17:50:59

  蓝象智联是一家真正不碰数据的数据要素运营服务商,依托隐私计算技术和数据要素运营能力,促进数据价值流通,释放数据要素生产力。

  从中国工商银行总行研发中心总架构师,到蚂蚁金服首席架构师、芝麻信用CTO、蚂蚁区块链及隐私计算平台创始人,童玲是中国金融科技变革的深度参与者,也是中国隐私计算技术的早期实践者,如今她一头扎进数据流通的蓝海,开辟新航道。

  “如果给自己贴标签,我应该是‘女架构师’,喜欢体系性的框架,化繁为简。”多年架构师的思维让童玲擅长从全局视角出发,简单寒暄后她就打开电脑,以布道者的姿态开始了这场访谈。

  外界看蓝象智联此公司,总将视野锁定在隐私计算,童玲很明确,要在更广阔的数据要素市场坐标系中定义蓝象。2020年3月,蓝象智联(下文简称“蓝象”)成立第一天,她就确定将“促进数据价值流通、释放数据要素生产力”作为公司使命,与此后“数据二十条”的政策目标不谋而合。

  在她看来,数据要素市场不是从0到1长出来的,而是大数据产业的升级版。经历了快速地发展的大数据产业,要解决合规安全这把“达摩克利斯之剑”。凭借隐私计算的技术能力和数据运营的经验,蓝象团队从最熟悉的金融领域切入,打透数据安全流通和价值生产两个环节,沉淀方法论和工具,并逐步向政务等领域扩展。

  “2022年以来,国家密集出台了多项数据要素市场相关的重磅政策,能够说是有史以来最完备的制度”。政府和市场相向而行的合掌,正推动数商产业进入一个壮阔的大航海时代,征途上,有激越人心的扬帆,也有无法预知的风暴。

  章丰:你深度参与了中国金融科技的变革,又作为行业代表参与“数据二十条”的早期调研编制,回看蓝象的创业历程,每一步都和数据要素市场紧密相连。

  童玲:我想先和你们探讨整个数据要素市场和政策的发展,才能理解蓝象的定位和独特优势。

  2022年12月以来,国家密集出台了四条数据要素市场相关的政策,“数据二十条”、数据资产入表试点、组建国家数据局、数字中国建设整体布局规划,能够说是有史以来最完备的制度。

  章丰:数据资产入表试点是财政部的暂行规定,你把它和其他三条政策并列,是认为它同等重要?

  童玲:数据资产入表是一个世界级的难题,试点启动正是从经济价值的角度促进“数据二十条”落地。

  当前数据要素市场存在数据供应不足的问题,任何一个人都希望使用别人的数据,但分享自身数据时又有所顾虑。数据资产入表能带来市场经济的驱动力,数据流通后能证明自身价值,让数据资产的持有方愿意分享数据,推动更多拥有数据资产的企业进入市场,促进流通和交易。

  童玲:当前数据资产入表主要是按成本法(注:根据形成数据资产的成本做评估的一种估值方式)计量,会逐步走向按公允市价法(注:在一个充分竞争的市场上,买方和卖方在彼此知情的情况下,达成的一个合理的交易价格)计量,真正体现出数据资产的价值,但需要一个过程。

  章丰:成本法也有其合理性,比如地方政府可以把数据资产纳入政府的资产负债表,逐步提升公共部门建设数据资产的积极性。

  童玲:所以数据资产入表就体现出直接的经济价值。另外“数据二十条”中我认为有两条内容非常重要。

  一条是“统筹推进涵盖数据产权(数据资源持有权、加工使用权、数据产品经营权)、流通交易、收益分配、安全治理的数据基础制度体系”,也就是明确了“三权分置”的数据资产确权方式,从制度体系层面淡化了数据所有权,代之以持有权,更强调数据流通。

  另一条是“鼓励公共数据在保护个人隐私和确保公共安全的前提下,按照‘原始数据不出域、数据可用不可见’的要求,以模型、核验等产品和服务等形式向社会提供”,从保护数据安全的角度提出了对隐私计算技术的需求。

  数据要素市场不是从0到1长出来的产业,本质是过去大数据产业的升级版。大数据产业经历了快速地发展后,最大瓶颈就是合规安全。数据究竟属于谁?数据怎么安全使用?仍然是悬在头顶的“达摩克利斯之剑”。

  所以“数据二十条”提出的这两条政策,首先是确定产权,促进解决数据合规问题;“原始数据不出域、数据可用不可见”解决数据安全问题,在保护隐私的情况下,促进数据流通。制度、合规、安全,国家所主导的数据要素市场解决了过去大数据产业的“达摩克利斯之剑”。

  土地要素价值释放的逻辑是,土地资源即原始土地,附加劳动力,产出商品房和农作物,在市面上售卖和流通。土地真正转让的不是所有权,而是使用权。

  数据要素价值释放的逻辑同理。数据资源是原始数据,在原始数据上附加计算和算力,最终产出数据产品,进入市场流通和售卖,这几个环节对应了“数据二十条”提出数据资源持有权、数据加工使用权、数据产品经营权。

  童玲:数据产品是原始数据和应用场景之间的重要纽带。什么是数据产品?比如蚂蚁的芝麻信用分,就是数据加工形成的数据产品,通过信用分,可以分析用户的信用情况,判断能不能给他租自行车、充电宝等。

  未来数据要素市场是个两级市场,一级市场是数据资源市场,对应土地市场;证券交易市场是数据产品和服务市场,有点像房地产市场,把原始数据计算加工成可流通的数据服务、应用、产品。

  章丰:蓝象的定位是“数商”。今年我们学会和未来科技城打造了未来数商大会, 我们得知“数商”是一个足够新的概念,它的定义五花八门。 你们怎么定义“数商”?

  童玲:“数商”一词来源于数据二十条中提出的“所商分离”。国家发改委曾发文明确数商在市场中的定位,它扮演三大角色,一是技术方案提供者,通过技术促进数据要素在市场中流通;二是数据价值发现者,通过产品发挥数据价值;三是流通交易合规保荐者,保证数据合规和安全的流通交易*。相对应的,数商可大致分为三类,技术类数商、产品类数商、撮合类数商。

  蓝象就是标准的数商,我们专注两件事:一是隐私计算,基于自身的隐私计算技术能力和算力支撑,解决数据安全流通的问题;二是数据要素运营,我们团队来自于芝麻信用、花呗、借呗等,有丰富的数据变现经验,擅长把原始数据加工为数据产品,解决数据产生价值的问题。

  通俗地说,我们第一步要“修路”,用隐私计算技术修一条数据安全流通的新路。过去大量的隐私计算厂商只负责“修路”,但从市场化的角度看,修好了路,还得有“车”愿意来跑。所以我们修好了路,还要让路上能跑“车”,至少把样板的数据产品跑起来,蓝象深入金融、政务等领域,搭建数据运营团队。

  聚焦数据加工使用权和数据产品经营权,蓝象将自己定位为隐私计算与数据要素运营服务商,打通数据安全流通和产生价值这两步,契合数据二十条的中心思想“促进数据要素合规高效流通,赋能实体经济”。

  章丰:我们在梳理数商产业图谱时观察到,很多企业同时贯穿产业链的基础技术层、产品应用层等环节,蓝象非常典型的,这一些企业在产业中该如何定位?

  童玲:企业未来的发展早期的更好选择是跨环节,只有跨越才能打通全链路,促进产业和生态的发展。比如淘宝商家初期什么都干,卖商品、生产商品、搭建店铺,生态完善后才逐渐出现专门帮商家做店铺的企业等。现在数商生态处于早期阶段,数据变现的链路非常长,蓝象选择跑通全链路,尽快让全链路产生价值。

  理解了数据要素市场的所有的环节,能判断不同企业在市场中的位置。比如做数据中台的企业,更偏一级市场,本质是帮助数据资源持有方进行数据治理;只做隐私计算的厂商,就在数据计算环节;帮银行做风控产品、营销解决方案的企业,围绕证券交易市场做数据的落地应用。

  蓝象同时具备隐私计算和数据运营的能力,所以是横跨数据计算和数据产品环节,专注解决数据外循环问题,发掘数据价值。当然蓝象也不是大而全地打通链路,而是围绕垂直行业切入,比如我们在金融领域已经有完整的产品体系和解决方案,正在支持政府领域的数据流通。

  童玲:交易所横跨数据资源和市场流通环节,在一级市场中它负责数据资源持有权的认定,在证券交易市场中它也涵盖场内交易的数据流通。

  不是只有交易所的场内交易才叫数据要素流通,市场流通环节包括场内交易和场外流通。“数据二十条”的核心在于数据要素流通,交易只是流通的一个手段,目的都是让数据产生价值。这一环节的逻辑可以对标金融要素市场,场内只有资金交易,但场外有各类市场化行为,比如信贷等产品,对公司进行授信和放贷,同样是金融要素赋能实体经济的重要手段。

  数据要素市场中,数据要素持有权需要在场内登记确权,但场外能够最终靠数据产品流通,赋能实体经济。只有场内场外结合的手段,才能真正把整个市场规模做大。

  童玲:隐私计算只是一个加工数据的工具,没这个工具不行,但光有工具也不行,它解决不了数据产生价值的问题。打个不太形象的比方,如果把数据看作原料,数据中台企业就是后厨,他们把数据原料清洗加工成标准化的数据资产,而隐私计算是“炒菜”的铲子。

  蓝象推出了“公共数据要素流通运营平台”,是基于隐私计算技术的升级平台,就像“共享厨房”,提供数据处理的工具组合,炒出来的“菜”就是数据产品,进入市场流通运营。

  现在各地政府都想做公共数据授权运营,但不知从何下手。我们第一步提供隐私计算这把铲子,在可用不可见的情况下“炒菜”;再提供运营平台“共享厨房”,附带多种工具,能处理敏感数据,也能支持基于明文API的数据流通等。政府刚拿到“厨房”不会使用,我们有专门的数据运营团队,相当于“大厨团队”,和政府一起先打造数据产品的“样板菜”,送到“餐厅”里去售卖,把数据流通的全链路打通。

  蓝象是一家真正不碰数据的数据要素运营商。“数据二十条”鼓励“公共数据按照‘原始数据不出域、数据可用不可见’的要求,以模型、核验等产品和服务等形式向社会提供”,很多人不知道如何解读。“公共数据要素流通运营平台”是业内首个真正能实现“数据二十条”落地的平台,支持数据要素在产品中进行运营和变现。

  章丰:隐私计算是比较昂贵的技术,技术效率和商业成本之间有博弈。普通的地方政府用得起蓝象的“厨房”吗?

  童玲:并不是全部客户都需要五星级“厨房”,我们的“厨房”是可装配的,为客户提供性价比合适的零部件方案。

  比如我们的“共享厨房”里最受客户欢迎的功能之一是“数据价值试衣间”,能够一次性对接多个数据源进行快速的价值探查。先把样本数据灌入测试,探查评估数据价值,先试后买,再进入数据产品工厂生成产品,降低流通过程中的试错成本。有点像农家乐,客户直接先看菜,选好了想要的菜,丢进厨房炒。

  章丰:提供做菜示范的“厨师”也很重要,长远来看蓝象主要是提供“厨房”,更多的“厨师”来自于外部。你们“厨房”的友好度目前达到了什么水准?

  童玲:我们平台的最大特点是生态化,第三方空中建模、空中分析。相当于厨房里所有的菜都码上来了,无论是我们自己的“厨师”,还是生态合作伙伴进来,只要有足够的能力就可以基于这套工具“炒菜”,生产出数据产品。

  蓝象团队从最熟悉的金融领域切入,在普惠金融、助农惠农、诈骗防控等实际场景中落地实践,构建起隐私计算和数据运营的产品线,实现数据在“可用不可见”的情况下释放价值。 目前,蓝象已与上百家金融、运营商及互联网机构达成合作,并在政务领域展开探索,进一步 实践 “数据二十条”落地。

  章丰:蓝象目前聚焦金融和政府两个行业,但未来这种“隐私计算+数据要素运营”的能力可以移植到别的行业。

  童玲:是的,我们分析数据要素流通的应用行业,金融、营销、政务目前占比超过80%,其中金融占比50%,行政监管、工业制造、医疗等都是未来可以发展的方向。

  我们的商业逻辑是先在某个领域摸索出成熟的模式,比如数据怎么安全流通、如何加工成数据产品、怎么变现和收费等,再将这套成熟模式提炼为最佳经验,应用于其他行业,目前蓝象已经在金融领域跑通了模式。

  数据产品化,数据到底怎么在场景里用起来。很多人不知道如何把数据变成产品,他们仿照过去工业时代的产品化,就像把电子元件组合成手机,做一堆数据组件加工成APP去售卖,这种模式完全不适用于数据产品。

  数据产品并不是标品,必须依据数据服务的对象和场景定制,所以数据产品应该由C2M(Customer to Manufacturer,用户直连制造商)模式主导,由客户和场景需求驱动产品生产。好比卖二手房,不同的二手房卖给不同的人,采光和装修都不一样。

  比如我们做金融反电诈的数据产品,接入了多种数据资产,有三大运营商的数据、SDK的数据、网络站点平台的数据等。但同样的数据产品,不同的银行客户拿样本测试的效果不同,本质是因为场景里他们的用户群体不同。

  章丰:金融业务的标准化程度高、数字化基础扎实。对别的行业,比如制造业又有细分的行业,数据产品的设计会不会更复杂?

  童玲:数据加工的逻辑是可以共通的,我们沉淀多年总结出了四种基本的数据产品:API服务类,把数据资产简化为API服务,做核验和查询;评分类,比如信用分、风控分、营销分等;报表类,多方数据联合分析产生BI报表支持决策;指数类,从数据中提炼出对决策有价值的内容。蓝象的“共享厨房”配备了这四类数据产品的加工引擎,能够完全满足大部分行业的需求。

  此外我们有很多场景的落地实践,比如普惠金融案例,采用银联的数据帮助某国有大行,为小微企业授信和放贷。我们把链路分为三个阶段,第一个阶段是数据准备,银联作为数据持有方,需要确认它的持有权。其中数据授权是重点,银行需要授权我们加工数据。

  第二阶段是价值挖掘,国有大行和银联的数据融合应用,双方联合建模,创造出适用于场景的数据产品。在建模过程中,个人会使用了隐私计算的匿名化技术,设计出用于计算小微业主信分评分的产品。

  第三阶段是流通交易和场景应用,在前两个环节的基础上再增加基于最小化场景授权,在生成数据产品时一定要设计出让数据拥有方获得数据收益的场景,比如通过信用评分给予信用额度,增强拥有数据企业的授权意愿。

  章丰:“ 厨房”和“厨师”有了,实操中还可能有“菜”的问题。 数据源的数据质量会影响数据产品的效果,你们有遇到过吗?

  童玲:金融行业的数据质量是最高的,我们在扩展其他领域时确实会面临数据质量的问题。但无论“好菜”还是“烂菜”,只有拿出来加工成“餐品”,有人“品尝”才能验证它的质量。数据只有用起来、流动起来,才能解决数据质量的问题,如果数据资产堆在仓库里,永远没人能发现它的价值。

  章丰:只有转起来才有迭代改进的机会,否则内部数据治理设施做得很好,但数据没能流通产生价值转化,也很难验证治理的质量。

  童玲:所以我们提倡场景驱动,不要一来就大量投入数据质量治理,最终的数据产品不一定可以用,而是数据产品在场景中用起来后,再去真正解决数据质量的问题。

  从数据源到数据资产、数据产品,再到流通和协同,数据要素落地是一条很长的链路,存在诸多难点和挑战。

  数据质量和供应不足是第一大问题。第二是隐私安全的问题,不光涉及隐私计算技术,还包括合规链路的设计、场景授权、采集授权等,不同场景的数据合规设计链路不同,它需要一整套面向场景的合规方案,这方面蓝象也积累了大量的经验。第三是数据价值“盲盒”的问题,数据使用前无法判断它的价值。还有数据定价和收益分配问题,金融行业我们已完全跑通了商业链路,可以按调用收费、按平台扩展收费等。最后是监管和多方协同治理的问题。

  童玲:数据产品的定价有点像二手房买卖,有报价、估价、议价的过程。蓝象的“数据价值试衣间”重点就是解决数据价值“盲盒”问题,从而确定数据定价。先由数据源报价,我们作为中介方,使用数据价值试衣间评估数据对买方的贡献值,比如告诉你这个数据到底贡献度是多少,提供对应的数据估值报告,最后买方和卖方讨价还价,达成共识。

  市场中,数据产品的定价方式有两种,一种是按照产品本身进行定价,一种是按业务效果进行收益再分配,实际上的意思就是数据二十条提出的“由市场评价贡献、按贡献决定报酬机制”。

  童玲:数据分润的难点在于,流通的数据通常由两方或者三方以上贡献,谁应该多分钱?这种情况,蓝象基于贡献度评估算法,可以分析每个数据在最后的数据产品里所产生的贡献值,这些都是我们在数据要素运营过程中积累的经验。

  童玲:每个环节都不能跳过,所以打通全链路需要有对技术和合规制度的理解,还要能跑通商业化链路。

  胆子大 ,速度快。 创业是一边跳悬崖一边造飞机,在落地前造出飞机,才能够活下来。

  如果你的项目足够优秀,希望得到36氪浙江的报道,参加36氪浙江的“未来独角兽活动”,请将你的需求和BP发至36氪浙江项目征集邮箱:,我们会及时回复。