威海拼团购房59群(237)
  • 浅浅:这个楼盘到底好不好?
  • 雪花飘飘:好的呢。
  • 零:这个楼盘周边环境设施怎么样?
  • 英雄:我去看过,很齐全。
  • 牛转乾坤:这个楼盘价格波动大么?
  • 日记本:这个楼盘性价比高。
  • 回忆:我建议你们去楼盘看看。
  • 大头:也可以直接咨询置业管家。
  • 吃了么:什么时候大家一起去看看啊。
  • 蓝天:上周我已经签合同了。
196人申请入群

惠新宸:数据在实际生产活动中保持鲜活性

发布时间: 2017-12-23 09:27:22

来源: 和讯房产

分类: 行业动态

2569次浏览


  和讯房产消息 2017年,中国房地产进入新时代的转折之年,以“房住不炒”为导向的房地产调控让市场加速分化,以“租购并举”为核心的住房体系深刻地改变了行业的运行逻辑,把脉房地产市场的发展趋势成为业界广泛讨论的新课题。12月21日,由链家研究院主办的思享会于北京凯宾斯基酒店举行。会上,链家集团技术副总裁惠新宸惠新宸对于备受关注的链家数据获取及数据驱动问题进行了分享。

  以下为现场实录:

  惠新宸:大家好!

  杨博士说得很对,从2014到2017年这三年的时间,我们整个的生活发生了很大的变化,比如台湾的人羡慕我们北京、深圳(楼盘),手机给我们带来了完全数字化的生活,再比如前段时间有一个英国的小伙子跑到深圳不带钱包生活了几天以后,他拍摄了一个视频,他讲这才是理想中的城市等等。

  因为从2014年、2015年开始智能手机的普及,好像把我们拉到了移动互联网时代,而我们身处这个时代,很多人可能感受不到。比如我自己以前的很多手机都是诺基亚,在以前的时候,比如三年前问你,你三天没有手机,OK吗?你肯定没问题。但是现在如果说你三天不用手机,OK吗?其实是不OK的。你有没有在这三年过程中,突然间有一天,你有没有意识到有一个点,就从某一天开始我离不开手机了,其实是没有,我们都是温水煮青蛙,我们感受不到。

  因为我们身处在这个时代,所以我们看不到。大家觉得我们的生活就是这样的。比如我女儿,今年三岁了,她只要看到任何发光的东西,她就去点。她从小的感觉就是,所有的电子屏都应该是能点的。那么下一代的产品应该是什么样的,下一代的人机交互应该是什么样的,很值得我们去想。也许三年就能带来一个全新的时代,也许五年。身为从业者,大家一定要去关注新科技能给我们带来什么。

  其实互联网在一年以前大家还觉得互联网代表了一个跳出我们这个圈子的技能,但在未来互联网就是一种生产工具,就像汽车一样,汽车给我们带来了多大的变化,互联网也是,就像一个生产工具一样。我小的时候,每次有人来找我爸妈技能。这与今天的大数据、AI本质上是一样的。 链家数据建设的基本逻辑、基本思路,包括数据驱动的一些尝试,再介绍一些成果,再讲一下未来怎么去做数据驱动。

  其实数据的建设,本质上是说鲜活的数据一定要用起来,一定要来自于你的生产活动中。有一些互联网同学经常做的事情就是爬数据,因为国内集中化的信息确实不健全,很多信息没有统一的、实时的标准的出处,所以只能通过互联网到处找。这些数据抓来以后,经过少则一个月、多则半年地清洗这些数据全都变成垃圾了。你的数据没有被用起来,不是来自实际的生产活动中,所以数据保持不了鲜活性。

  链家的所有数据均来自于业务系统,而这些生产出来的数据反哺业务系统,并指导业务系统依靠数据来做评判,让数据在整个闭环中流动起来,这样才能保证数据的鲜活性,并且让它产生价值。

  什么是数据驱动呢?要定义这个问题还是比较难的,有时候就像一个做事方法、一个思考的方法来反映对数据的重视程度。举个例子,比如我们家楼下的小卖部的阿姨,他们那个小卖部做得很好,为什么呢?我经常在那买烟,我发现有这么一个很有趣的现象:我抽的烟在我们那个小区里边相对来说比较小众,我第一次去问那个阿姨,你这里有没有南京(楼盘)的雨花石,他说没有,我说换一个。我第二次问她,你这里有没有南京的雨花石,她还说没有。等到我第三次去的时候就有了。其实她很会关注这个东西。这个老板会记录下来今天有什么用户来我这问了什么东西,当达到一定量的时候,他就会把货存起来卖给你。这就是做事的方式,你重不重视数据,数据代表什么?代表用户的需求。

  还要从未来的年轻人交互的模式来看现在的产品到底是不是符合他们的。包括你的app或PC,用户的误点率多高,用户的点击热点、观察热点到底在哪里,这些数据你如果不去关注、不去收集,你这个产品永远都不会迭代。所以有时候数据驱动只是一种思路,我能不能去重视数据;但这个数据具体是什么,不知道。因为所有的数据包括我们做策略的核心的点是思考你的指标是什么,你到底为了提高什么,这是你要定义的。为了提高销量和为了提高用户体验,这是两种完全不同的目的,所要的数据体系也是完全不同的,策略方式也是完全不同的。所以你到底想干什么,想提升什么指标,你围绕这个,要收集你的结论,应用到产品中,不断去迭代。

  链家从2008年开始就有ES系统,有了线上的系统,就有数据的产生。我们那时候做最大的楼盘字典,每套房子300多个特征,都要通过人去数,把它做出来。这是因为我们重视这部分基础的数据。但我们为什么要重视基础数据?因为有应用场景,比如真房源,如果没有这套基础设施,真房源是做不出来的。核心的点就是这个数据一定要用起来,我们花几个亿把全国7500万套房子进行盘点,正是因为我们有了这些数据,我们对市场比较了解,我们可以描述别人描述不出来的东西。比如用户到这里搜,我希望客厅里边带飘窗的房子,如果我收集了这个信息,我就可以给到他。如果我没有这个数据,就没有这个能力。所以基础数据有时候也是你能力的表现,你没有基础数据就没有能力,但是基础数据要收集就是又苦又累又耗时的事情。

  我们建设系统为了什么?系统交互就是数据的产生。你带着思路去建设系统的话,就觉得这个事情挺容易的。我们会围绕人、房、客三方面,我们希望把他们所有的沟通和交流,所有能在任何场合下表达出用户的需求,我们真正的线上用户还有服务的经纪人,只要能有一个场合表达出他的需求来,我就希望能把它做到线上化。因为只有线上化了,我才可以知道它的数据。只要有了数据,才可以接下来后续一系列的工作,当然这个能力是逐步建成的,比如我们努力的去建设了IM,用户和经纪人的交互,我们的量很大,但是这种数据是非结构化数据,结构化数据大家能理解,比如我们经常讲的数据库,包括大家看的Excel,是有标题、有维度,是结构化的。但有很多数据是非结构化的,比如我跟你的交流就是非结构化的。我们以前是欠缺的,现在我们投入了大量的精力,包括组建研发团队、积累技术能力,为的是把这部分非结构化的数据结构化,便于我们去理解,这也是一个过程。

  我们的核心是围绕着人、房、客的关系,把可能产生信息交换的地方全部搬到线上来,这是我们建设系统的根本思路。有了这些系统,才会有大量的数据产生。

  这是我们的数据平台架构,有一个底层的数据仓库,数据仓库上有一系列的分析,包括用户画像、房屋画像、经纪人画像。数据做完善还是比较容易的,数据做正确真的很难,数据如果不用起来,只要放一个月就不正确了。包括你的数据里边只要有人工的参与,这个数据一定是准不了的。这都是一些经验,也是踩了很多坑。

  这是链家数据的一些优势,相对来说在这个行业里面我们是较为全面、较为实时、相对关联性比较好、扩展性较强的一个数据企业。

  从我加入链家以来,很大一部分的工作就是希望把优秀的人才带过来。到现在为止,我们还是有一个很不错的数据团队,包括孙林,我们要把非结构化数据搞起来,他是我们好不容易邀请来的专门做自然语言处理的技术大拿。还有白银,是在链家待了很多年,是北大的很聪明的孩子,比如房屋估价、交易数据、反作弊等等都是在他的推动下做起来的。我看到很多特别优秀的互联网人已经进入了房产行业,尤其是这两年,一方面是房产舍得花重金招聘人才,我们有很多海归的大博士。 原来没法采集的数据现在变得可采集了,我们现在采集数据的能力跟以前完全不一样。比如现在大家每个人都在玩自己的手机,你就不断的告诉你那些app,我现在在哪,我在干什么。尤其在移动互联网时代,真的没什么隐私。有时候我买点东西还得匿名买,我就害怕它把我的数据用了。但是没办法,这是双刃剑。

  比如我们现在做语音识别,我们是希望把任何一个经纪人和用户有交互的地方的数据都做上来,但是可能原来我们欠缺的一块是经纪人跟客户的电话,这部分原来不好做。现在我们有特殊的处理,比如把语音信息采集下来,变成文本,还有VR、AR。我们同事说,未来是不是可以拿个手机,对着小区一晃,就可以蹦出来这个小区的情况,均价等等。我说你输入一个定位就可以了。现在更方便的是我通过语音,比如各大互联网公司都在做音响,为什么做音响,包括前段时间每个互联网公司都在抢占一个家里边的路由器,每个公司都赌,路由器会成为这个家庭的智能入口,像小米等等都做路由器。结果失败了。亚马逊做完Echo智能音响,可以进行交互,很快国内一些厂商就跟着做了。虽然说基于物理定位和AR都可以实现这个功能,但是人机交互的方式不一样,这个可能更友好一些。

  这是我们建立的用户画像。用户与你的交互密集,才能形成用户画像。也就是说,用户告诉你的信息越来越多,你的信息才越来越准。这个基本假设是一定存在的。链家恰恰是在构建垂直领域较为完善的用户画像体系的建设。

  只要数据准,至于怎么去分析数据、怎么去指导你的下一步的动作,完全看你的目标是什么。有了这些数据之后,我们可以看到换房动线从哪到哪的人,这个数据对我没有意义,对其他一些人也没有意义,但有一些场景可能有意义。数据就躺在那,谁用谁的价值就不一样。

  我们从2008年到现在,就去找2008年到现在一直跟我们有交易的客户,我们对于他会比较了解,包括他一开始在哪租房,换到哪,最后他去哪里成交,又换了一个改善型的房子,整个生命期会跟我们在一起,这些数据可能在未来也会变得很有意思。

  还有一二手联动,我们今年做了一个小的尝试,叫天眼系统。确实在这个大市场的背景下,我们要在一二手联动里花点心思。因为我们有大量的数据积累,所以有了大量的用户画像。其实我们的触点很多,比如我们有15万经纪人,有300万日活,8000家门店,触点很多,能收集到的信息很多。我们花了三个月的时间做出这样的系统,给整个线上交易带来较为明显的效果。优点是渠道全、投放准。

  VR现在特别火,我们也努力在做这方面的尝试。我们有时候想有一些技术真的在未来会改变我们, VR就是这样,VR有非常值得我们投入的点,因为我们经常会讲它带来一种跨越时空的能力,就好象我可以坐在家里足不出户就可以去看尤其在租赁这样的交易场景里,也许将来真的不需要再去看房了,当然这个体验会变得很好。我现在讲VR,我们每个人心里面都有一个心里所设想的VR是什么样子,每个人想的都不一样。但是VR在一年后是什么样子,可能我们都想不到。所以未来真的有可能,这些新的技术一定会给我们带来所谓的重塑流程或者是颠覆行业、颠覆整个交易规律等等。所以一定要关注新的技术。

  持续数据驱动,我们要不断关注新的技术、新的数据采集的方式、新的渠道、新的技术能力要把技术应用起来。包括VR,其实VR是数据采集的能力,因为原来是拍两地的照片,你现在可以把整个房屋的三维结构拿出来。原来拍一张照片2兆,十张照片20兆。现在一套VR拿回来几百兆的信息。

  另外是数据场景化,如果一个数据不被场景化、不被应用起来,就不是鲜活的数据。基于这样的考虑,我们也是在考虑一个方向,我们有很多数据,但是链家的消费能力是有限的,有很多数据链家是消费不了的。我们也期望未来我们可以变得更加open,为整个行业一起来探索可能。我把我们的数据在一些方式和程度上共享出来。我们一起去在这个数据上看看能不能发挥出更大的价值来,这就是我们在数据这块的愿景,希望能为整个行业带来不一样的变化,哪怕只有稍微一点点,我都觉得很OK。

责任编辑: weihaiadmin

团购报名

最新楼讯
楼盘导购更多>>
购房指南更多>>
小编推荐
订阅楼市楼讯