专利汇可以提供一个基于多源异构数据的房地产信息可视化系统专利检索,专利查询,专利分析的服务。并且本 发明 提出一个基于多源异构数据的房地产信息 可视化 系统,其特征在于包括:房产信息模 块 、区域功能模块、交通分析模块、社会 感知 模块和综合评价模块。所述房产信息模块对房产信息进行展示。所述区域功能模块统计房产周边 基础 设施的数量与距离。所述交通分析模块统计分析房产周边交通状况、高峰时间。所述社会感知模块挖掘社交媒体数据的文本,通过词频词 云 、关键词 抽取 、主题模型等呈现房产周边的社会感知状况。所述综合评价模块,应用多元线性回归分析等统计学方法,建立了多元线性回归模型,确定房地产评价指标与方法,得出基于房地产性价比的有针对性的交易建议,以期支持更合理的购房决策。,下面是一个基于多源异构数据的房地产信息可视化系统专利的具体信息内容。
1.一个基于多源异构数据的房地产信息可视化系统,其特征在于包括:房产信息模块、区域功能模块、交通分析模块、社会感知模块和综合评价模块;
所述房产信息模块进行房产信息展示,房产信息包括基本信息、建筑属性、交易属性、户型分间,从总价和每平米单价两方面提出购房建议;
所述区域功能模块统计房产周边基础设施的数量与距离,数据获取方式分为在线单点获取和爬虫批量抓取,所述基础设施包括交通设施、公园景点、教育机构、医疗机构、餐饮休闲、商场超市,并基于统计分析结果评价房产;
所述交通分析模块对房产周边交通状况、高峰时间进行统计分析,根据所在周边区域一天之内不同时刻的行车速度记录,计算相对速度的绝对值的平均值,作为衡量拥堵程度的依据,拥堵程度分为畅通、缓行、拥堵三个等级;
所述社会感知模块挖掘相关社交媒体的文本,包括词频统计及词云展现、关键词抽取、主题模型、情感倾向分析;所述关键词抽取采用无监督学习算法,包括基于TF-IDF关键词抽取算法和基于TextRank关键词抽取算法,所述情感倾向分析包括分析愤怒、厌恶、高兴、悲伤和恐惧五类;
所述综合评价模块进行应用回归分析和主成分分析建立多元线性回归模型,确定房地产评价指标与方法,获取对房价具有显著影响的若干关键因素,产生基于房地产性价比的有针对性的交易建议,给出合理的购房决策;所述多元线性回归模型的变量包括:周边基础设施(如交通出行、教育、餐饮、公园等)的数量与距离、交通拥堵程度、社交媒体中的相关文本的情绪分布等。
2.根据权利要求1所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述房产信息模块,从总价和每平米单价两方面提出购房建议,具体步骤为:
步骤2a,基于网络爬虫,收集主流房地产网站(网站地址可由人工配置)发布的房地产信息;
步骤2b,使用房地产数据进行统计,所述统计包括数据频数分析、集中趋势分析、离散程度分析、分布以及其他基本的统计图形;
步骤2c,基于所述描述性统计,以总价和每平方米单价为评价房价的主要指标,分别选取房价分布的25、50、75百分位数作为阈值,并据此将房价等级划分为非常便宜、稍便宜、稍昂贵、非常昂贵四个等级。
3.根据权利要求1所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述区域功能模块中使用在线单点获取方式的具体实现过程为:
步骤3a,用户在浏览器中点击房屋,触发浏览器向服务器发送请求;
步骤3b,服务器返回当前房屋的地理位置;
步骤3c,浏览器调用服务请求API,向第三方地图服务商发送请求,使用房屋坐标搜索周边信息;
步骤3d,对于每一类基础设施,在查询到结果后立即向服务器发送查询结果;
步骤3e,服务器在接收到数据后,传递数据给前端展示;
所述区域功能模块中使用爬虫批量抓取方式的具体实现过程为:
步骤4a,遍历系统数据库中已有的房屋数据,获取地理坐标;
步骤4b,以房屋的地理坐标作为参数,调用Web服务API,从第三方地图服务商检索周边基础设施;
步骤4c,对于每一类基础设施,在查询到结果后立即统计数量、计算平均距离,并存储到数据库;
所述区域功能模块中基于统计分析结果评价房产的具体实现过程为:
步骤5a,统计分析得到每套房屋周边设施的数量和平均距离,分析房屋所在地区的功能,所述功能分类为办公区、生活区、教育区、娱乐区四类;
步骤5b,根据统计分析结果,分别选取周边设施数量分布的25、50、75 百分位数作为阈值,并据此划分周边基础设施的数量等级,数量等级具体分为很少、略少、略多、很多四个等级;
步骤5c,根据统计分析结果,分别选取周边设施距离分布的33、66百分位数作为阈值,并据此划分周边基础设施的距离等级,所述距离等级分为稍远、中等、很近三类;
步骤5d,依据周边基础设施的数量等级和距离等级,对房价作出评价。
4.根据权利要求1所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述交通分析模块完成房产周边交通状况、高峰时间的统计分析,所述统计分析的步骤为:
步骤6a,收集交通记录数据,主要包含不同时间段的交通速度信息;
步骤6b,根据行车轨迹的绝对速度值变化,计算相对速度;
步骤6c,将相对速度作为衡量拥堵程度的依据,分别选取行车相对速度分布的50、80百分位数作为划分等级的阈值,并据此将拥堵程度分为畅通、缓行、拥堵三个等级。
5.根据权利要求1所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述社会感知模块,完成对微博数据的文本挖掘,所述文本挖掘包括词频统计及词云展现、关键词抽取、主题模型建立,具体步骤为:
步骤7a,获取一定时间段内带地理定位信息的社交媒体文本数据;
步骤7b,对社交媒体文本数据进行过滤与清洗;
步骤7c,统计词频,选取分值最高的若干个候选词;
步骤7d,采用无监督学习方法进行关键词抽取,主要包括基于TF-IDF的关键词抽取算法和基于TextRank算法的关键词抽取算法;
步骤7e,根据词频统计,应用LDA话题模型,发现主要话题;
步骤7f,对每个社交媒体文本进行情感分析,并计算情绪分布。
6.根据权利要求5所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,在所述步骤7b中,对所述社交媒体文本数据实现过滤与清洗的具体步骤为:
步骤8a,进行分词处理后,去除停用词、标点符号和特殊字符;
步骤8b,采用正则表达式检索,去除网址和表情等无效文本内容;
步骤8c,只保留词性为名词的词语,去除其他词性的词语。
7.根据权利要求5所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述步骤7e的具体步骤为:
步骤9a,每条社交媒体文本作为一个文档,相关文档构成文档集;
步骤9b,遍历所述文档集中所有的文档,为每个不重复的单词分配一个单独的ID,同时收集该单词出现次数以及相关的统计信息;
步骤9c,构建单词-文本矩阵,该矩阵每一行对应文档集中的一篇文档,每一列对应一个单词,矩阵用于描述文档词频。
步骤9d,应用LDA模型,建立主题模型,并发现主要话题。
8.根据权利要求5所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述步骤7f的具体步骤为:
步骤10a,对每个社交媒体文本进行情感分析,情绪倾向分为五种类别,所述类别包括愤怒、厌恶、高兴、悲伤、恐惧;
步骤10b,统计每种情绪倾向的数量,计算其占总量的百分比,作为衡量情绪分布的依据;
步骤10c,选取所占百分比最高的一类情绪作为对应房产周边的主要情绪。
9.根据权利要求1所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述综合评价模块基于多源异构数据融合的房地产性价比评价,具体步骤为:
步骤11a,以房地产每平方米单价为因变量,以房屋周边的交通设施、公园景点、教育机构、医疗机构、餐饮休闲、商场超市的数量和平均距离,交通拥堵程度,不同情绪所占百分比等多方面指标为变量,应用回归分析方法;
步骤11b,用逐步法排除对房价无显著影响的变量,模型最终保留部分预测变量,所述保留的预测变量为教育数量(教育机构数量),公园数量,厌恶情绪占比,交通距离(到交通设施的平均距离),商场数量,拥堵程度,恐惧情绪占比,餐饮距离(到餐饮机构的平均距离),餐饮数量(餐饮机构数量),医疗数量(医疗机构数量),教育距离(到教育机构的平均距离),医疗距离(到医疗机构的平均距离),公园距离(到公园的平均距离),愤怒情绪占比,商场距离;
步骤11c,建立多元线性回归模型,获得关于房地产每平方米单价的多元线性回归方程,确定房地产评价指标与方法。
10.根据权利要求11所述的一个基于多源异构数据的房地产信息可视化系统,其特征在于,所述综合评价模块对房屋购买决策进行推荐,并得出对房产评价具有显著影响的关键因素,具体步骤为:
步骤12a,对于每一套房产,将其相关参数代入多元回归分析方程,计算得到房价期望值,将期望值与实际值做对比,若期望值高于实际值,则房地产的性价比高,给出“购买”的决策推荐;若期望值低于实际值,则房地产的性价比低,给出“观望或协商”的决策推荐;
步骤12b,对房产属性及其周边多视角特征,具体包括房屋总价、房屋单价、交通数量(交通设施数量)、交通距离(到交通设施的平均距离)、公园数量、公园距离(到公园的平均距离)、教育数量(教育机构数量)、教育距离(到教育设施的平均距离)、医疗数量(医疗机构数量)、医疗距离(到医疗机构的平均距离)、餐饮数量(餐饮设施数量)、餐饮距离(到餐饮设施的平均距离)、商场数量、商场距离(到商场的平均距离)、交通拥堵指数、愤怒情绪微博比例、厌恶情绪微博比例、高兴情绪微博比例、悲伤情绪微博比例、恐惧情绪微博比例,进行主成分分析并确定最关键的前5项(这里阈值5可以进行调整),以期找出影响房产评价的关键因素;
步骤12c,对于步骤12a中的所有房产相关变量,利用发现的5项主成分,计算这些变量与5项主成分之间的相关关系,实现不同变量的重新组合,以实现主成分的主观解释,具体地,5项主成分对应的房产属性分别为:教育设施、公园、交通设施、周边情绪分布及房产价格,因此,在对房产进行综合评价时,应从上述五个方面进行综合描述与系统比较。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
视频动态推荐装置 | 2020-05-13 | 988 |
具有搜索功能的移动装置 | 2020-05-16 | 708 |
一种面向法律领域的动态法律事件图谱构建方法 | 2020-05-14 | 1002 |
基于上下文图随机游走及音形码的微博文本规范化方法 | 2020-05-16 | 28 |
一种基于中智集的上下文感知兴趣点推荐方法及系统 | 2020-05-11 | 48 |
基于大数据的国际产能合作风险评估与决策服务系统 | 2020-05-24 | 152 |
一种公司形象提升系统的数据监测分析系统 | 2020-05-08 | 495 |
基于用户在线生成内容的产品提升策略获取方法和系统 | 2020-05-14 | 444 |
AI智能名片 | 2020-05-15 | 835 |
行为模式数据的发布方法、装置、终端设备及介质 | 2020-05-21 | 231 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。