airbnb上房源数据分析
发布日期:2022-03-04 11:48:27 浏览次数:13 分类:技术文章

本文共 968 字,大约阅读时间需要 3 分钟。

数据分析部分

The purpose of the analysis is as follows:

  1. Compare prices by region by looking at Airbnb on a New York City map.
  2. Analyze whether there is a difference in price by room type.

第一步:将数据从kaggle上下载,并导入到excel, tableau。

在这里插入图片描述

第二步:熟悉数据

Id:房号

Name:房子的名称

Host Id:房主号

Neighborhood Group:社区组

Latitude:纬度

Longitude:经度

Room Type: 房型

Price:价格

Minimum Nights:最少住宿晚数

Number of Reviews:评论数

Last Review:最新的评论时间

Reviews Per Month:平均每月评论数

Calculated Host Listing Count:每个房主拥有的房间数

Availability_365:可以预定的天数

第三步:数据清洗——异常数据处理

因为用到的有价格和房型,先检查这两个数据有没有空值和异常值。

经检查发现,价格有0的情况,作为一个租房网,这种情况不太容易出现,删除。

在这里插入图片描述
房型没有空值,异常值,很好。
在这里插入图片描述
作为region的neiborhood_group,也没有异常值,完美。

在咱们的项目中,Host Name,Name,Id, Host Id,是用不到的,以及后边用不到的数据,进行隐藏。

在这里插入图片描述

第四步:进行数据可视化分析。

在这里插入图片描述

问题1:Compare prices by region by looking at Airbnb on a New York City

我们将Neighborhood_Group和Price进行分析,得到,Manhanttan地区房价最高的结论,如图。

在这里插入图片描述

问题2:Analyze whether there is a difference in price by room type.

在这里插入图片描述

如图,我们对同一地区的不同房型的价格进行分析,得出结论,不论在哪个地区,entire home/apt这种房型的价格总是要高一些。也就是说,房型跟价格有直接关系。

转载地址:https://blog.csdn.net/xxy_yinji/article/details/115664022 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:豆瓣前250个电影的相关分析
下一篇:爬虫学习总结

发表评论

最新留言

留言是一种美德,欢迎回访!
[***.207.175.100]2024年04月02日 09时31分21秒