爬取两万多条租房数据算算在广州你能「活到」
发表时间:2019-09-16

  此前,笔者曾用 Python 爬取 1.7 万条租房数据,并据此撰文揭示了深圳房价飙升背后的生存压力。此番再析广州租房价格现状,在升级爬虫技术之余,也完善了更多细节,源码颇值细细探究。此次分析采集了广州 11 个区,23339 条数据,如下图:

  其中后半部分地区数据量偏少,是由于该区房源确实不足。因此,此次调查也并非非常准确,权且当个娱乐项目,供大家观赏。

  我们且先看统计结果,然后再看技术分析。广州房源分布如下(按区划分),其中天河占据了大部分房源,但这块地的房租可谓不菲。

  可以看出天河、越秀、海珠都越过了 50 大关,分别是 75.042 、64.249、59.621 ,是其他地区的几倍。

  隔断时间下个馆子,每个月买些衣服,交通费,谈个女朋友,与女朋友出去逛街,妥妥滴加个 2500:

  隔断时间下个馆子,每个月买些衣服,为啥前世修行过?没把前世修,交通费,谈个女朋友,与女朋友出去逛街,妥妥滴加个 2500:

  月薪一万还是有点存款的,比深圳好一点,但是可能广州的薪资就没有深圳那么高了。

  户型主要以 3 室 2 厅与 2 室 2 厅为主。与小伙伴抱团租房是最好的选择了,不然与不认识的人一起合租,可能会发生一系列让你不舒服的事情。字体越大,代表户型数量越多。

  其中 30 - 90 平方米的租房占大多数,如今之计,也只能是几个小伙伴一起租房,抱团取暖了。

  这是爬取的租房描述,其中字体越大,标识出现的次数越多。其中【住家、全套、豪华、齐全】占据了很大的部分,说明配套设施都是挺齐全的。

  wordcloud.render()距离上一篇租房市场的分析已经 3、4 个月了,笔者的技术水平也得到了一定的提高。所以努力编码才是成长的捷径。最后,应对外界条件的变动,我们还是应该提升自己的硬实力,北京新房交契税需要什么资料。这样才能提升自己的生存能力。