如何研究房地产市场?
归根结底需要解决的问题无非是
地、房、人三大内容
然而,传统的研究方法却耗时耗力
看不全的土地——总会遗忘疏漏
想不尽的产品——依旧经验为先
读不透的客户——往往以偏概全
上海万科率先使用先进的手段颠覆传统的研究方法!
近期,由上海万科与多家高校及城市数据团合作搭建的专属于万科的大数据分析平台正式上线了。这是万科在推动房地产行业的大数据化、引领地产行业转型潮流上踏出的重要一步。
该平台以清晰易用的可视化交互方式,将复杂的大数据技术聚焦在房地产行业的实际业务当中,从『动态监测』『信息查询』『数据分析』三种不同层级,满足公司员工各业务端口的工作需求。
更清晰全面的了解城市每一块土地的
真实情况及价值潜能
更细致客观的分析市场走向
追踪一二手房真实成交情况
更深层直观的洞察人群
通勤方向、潜在需求及购买行为
”
先进
方法
据了解,此次万科大数据平台整合了多家先进的数据源,通过建立先进的分析模型,对已知客观事实用先进的分析维度进行验证,同时对未知的市场及客群进行分析研究。
“
哪些先进的数据源
数据资源
参与此次万科大数据平台搭建的优质数据资源方多为各行业领先企业,提供除了传统市场数据外更多维度的:
● 城市级大数据 ——
包括人口、经济、交通、基础设施等;
● 人口移动数据 ——
包括全市地铁通勤、专车及出租车通勤等;
● 通过线上线下实时监测所获得的活跃购房客户特征数据 ——
包括人口消费习惯 、人口行为特征等。
▲ 数据来源及资源广泛
“
哪些先进的分析模型?
据介绍,万科此次搭建大数据平台的初衷,就是希望能够颠覆传统开发商所采用的分析方式与路径,通过运用先进的分析模型,对大量复杂抽象的数据进行整合分析,从而反映本质事实,揭示内部规律,辅助各项决策。
核密度分析
在进行如人口密度、基础设施密度、客流密度来源等要素密度进行分析时,万科大数据平台采用了核密度分析模型。该模型通过采集待分析标的要素的信息,设置分析半径范围,通过算法计算要素在其周围邻域中的密度。
▲ 模型分析示例:上海九大商圈客流来源
空间插值分析
在对某要素分布空间范围进行分析及预测时,万科大数据平台采用了空间插值模型。
研发人员首先假设空间位置上接近的对象具有相似的特征,于是通过自然邻域插值法,找到距查询点最近的输入样本子集,并基于区域大小按比例对这些样本应用权重进行插值,进而对区域所有位置进行预测。
▲ 插值点及邻域权重模型示意图
▲ 模型分析实例:上海成交新房按单价及总价的不同空间分布
OD/PA分析模型
在分析如城市或区域人口通勤方向及发展趋势时,则采用了OD/PA分析模型。该模型以千万级的智能移动设备大数据为基础,对全市人口出行进行拟合计算,可以了解要素流动情况。
▲ OD/PA模型示意图
▲ 模型分析实例:市民出行OD图(左)、现居地与搜索房屋距离PA图(右)
力导向布局分析模型
在研究要素关系网络、城市群相互联系时,万科大数据平台的研发人员采用力导向布局分析模型。
该模型将每个要素表现为一个点,要素间的联系表现为边,通过计算各要素间的关联度,绘制出拓扑关系网络图,表现要素间的聚集度和紧密度。
▲ 力导向布局模型示意图(左);模型分析实例(右):长三角城市群联系度力导向布局图
交通断面流量分析模型
通过对轨道交通站点客流出行方向和数量的分析,从而对断面客流量进行评估和趋势判断。
▲ 交通断面流量模型分析实例:早高峰地铁客流量
空间计量模型
城市存在空间聚集效应,要素将受到本空间单元和临近空间单元的共同影响。因此在对某特定研究对象进行要素影响分析时,平台研发人员运用空间计量模型使结果趋于客观精确。
▲ 空间计量模型分析实例:房价增幅影响要素分析
板块价值分析模型
在进行目标板块价值评估模块设计时,研发人员将万科传统的PIE模型与板块评价体系所涉及的多维度数据进行基于计量经济学模型的系统化整合,将他们分为6个大类和19项重点指标,构建板块价值计量模型。并以此为基础,通过数据预处理、回归及相关性分析后,对被解释变量进行评估及预测。
▲ 板块价值模型示意
“
哪些先进的研究维度?
多维数据交叉验证
数据源往往存在缺陷,如对人群的抽样存在偏差、年代不够新、数据维度较少等。因此,万科认为,需使用不同数据源对同一个问题进行研究,以此能够相互印证的结论才更具说服力。
如通过多维比较常住人口数据、新房销量地均密度数据和人口通勤数据,分析近十余年来上海人口转移方向。
▲ 多维印证人口外迁
自定义空间分析单元
传统分析方法往往以板块和地块作为分析单元,但在日常工作中,待分析对象则需要根据研究目的进行调整。因此万科大数据平台创建了自定义分析单元,以此拓展分析方向,发散思维,提高决策判断的准确性。
如对商业物业的选址进行决策时,会将现有商圈的势力范围作为分析单元进行研究。
▲ 以大型商圈为研究对象的势力范围研究
如对地铁上盖物业产品类型进行选择决策时,会对各地铁站早高峰客流进出占比进行研究,了解地铁站产业或居住属性特征。
▲进出比<0.8为产业区型地铁站
进出比>1.2为居住区型地铁站▲
以个体为单位的研究尺度
在对特定人群进行更细化的研究时,传统路径是采用客户调研的方法,但样本基数及回答真实性都会影响研究结果。万科大数据平台则可以根据用户的线上线下行为,利用机器学习算法,对其个人属性、职住地点、兴趣爱好等进行判断,进行多角度画像。
▲ 在沪购房者各省来源情况
▲ 一套房及二套房购房偏好分布
”
客户
导向
只有了解客户、接近客户,才能提供让客户满意的产品与服务。
值得一提的是,万科此次将智能设备采集的数据与优质合作方提供的资源进行整合,以大数据机器学习算法对全市范围内的典型活跃客户及项目到访客户数据进行深加工,对细分市场上不同消费群体的特征及分布进行了解与研究。
▲ 潜客职住热力图
此外对采集到的原始标签数据进行补全计算或赋予布尔值、类型值。再加入房地产行业客户分析逻辑,在家庭结构、置业需求、购房能力、还贷能力方面,将原始标签合并成新的标签进行计算,最后得到客户的多维度画像、存储和输出。
▲ 客户画像输出流程图
正因为有了清晰的客户画像,万科才能更好的进行产品及项目的设计定位,进而为客户提供满足他们真正需求的更好的产品与服务。
▲ 客户特征图
”
分析
案例
上海万科大数据研究案例
据上海万科负责市场研究的工作人员介绍,目前公司在拿地前都会借助该大数据平台,综合运用各类分析模型,多维度建立从宏观到微观的分析体系,对标的地块所具有的特征及变化趋势进行研究,进而支持初步判断。
万科研究示例 :上海某新城板块土地
一个具有成长型、潜力型人口特征的板块
▲ 研究版块人口学历及年龄结构
一个现代制造业和公共服务业双头并重的板块
▲ 研究版块就业行业人数及企业分布
一个职住关系处于高度分离的板块
▲ 研究版块人口职住情况
一个就业活力越来越高的板块
▲ 研究版块主要地铁站工作日早高峰客流量差值
一个承接大量外区导入就业人口的板块
▲ 研究版块职住通勤分布
根据对该板块人口、产业、经济等数据的分析,万科研究团队可以得出对板块的一个初步判断:
该板块人口年龄轻、活力强,岗位供给上不仅有大量的产业工作,也有高端的公共服务和第三产业。更重要的是,其人口的聚集速度较岗位的聚集速度更快,整个地区正在高速发展中转型。
有了初步判断后,研究团队可继续通过『板块价值类比』『未来发展潜能』及『潜在置业人口描摹』等分析模型,进一步辅助投资决策及产品定位。