Part1.论文解读:如何利用最近很火的深度学习来识别建筑年代和风格?——《通过深度学习了解建筑年代和风格》

本文为《通过深度学习了解建筑年代和风格》(详细引用信息见文末)论文复现的第一篇——论文解读,主要是介绍建筑论文的大致逻辑,创新点和结论。

论文简单来说是利用深度学习技术来识别建筑的属于哪一个年代的以及是什么风格。

你可能会想,为什么不直接请个建筑师来看看不就完了吗?

但实际上,一个建筑师需要学习大量的建筑知识、进行实地考察才能准确的判断建筑所属的年代和风格,而且也不一定是百分百准确,而深度学习可以为我们提供一个自动化、高效的解决方案,可以大量且准确的识别一个街区,甚至一个城市的所有建筑。

当你顶着炎炎夏日出去实地调研的时候,隔壁组会深度学习的设计师已经在办公室,一边吹着空调、喝着咖啡,一边等待着电脑跑完模型等待识别结果了。最近几年的城市规划、建筑、GIS、景观、等学科论文与计算机学科融合的越来越紧密,学会使用编程方法实现城市空间数据分析成为了这些学科研究人员了必备技能。不仅在学术研究中如此,在房地产行业工作的设计师们掌握编程之后,也能够助你效率提升。

📘 本系列文章分为 6 个部分,我会手把手带你走完论文所有流程,教你如何用 Python 和 ArcGIS Pro 复现此篇论文,并且提供相关数据集和完整代码。不要觉得写代码是一件很难的事情,其实 Python 语言简洁明了,代码可读性高,容易入门。

一、文章目录

所有文章均可在我的博客和微信公众号(renhailab)中找到,欢迎关注!

📌 收录进专栏:【SCI 论文复现】《通过深度学习了解建筑年代和风格》


回到论文,作者提到了为什么要进行此项研究:

建筑风格及其演变对于建筑史研究具有至关重要的意义。然而,传统的了解风格及其演变的方法需要领域专业知识、实地调研和大量的手动处理。最近,深度学习和计算机视觉的火热,让通过影像分析城市环境成为可能。

文章提出了一个基于深度学习的框架,通过解析街景图像中的建筑立面来理解建筑的风格和年代。这个框架分为两个阶段:深度“学习”建筑和深度“解读”建筑的年代和风格。在深度“学习”阶段,设计了一个深度卷积神经网络模型,自动从街景图像中学习建筑立面的年代特征。在深度“解读”阶段,提出了三个组件来从不同的角度理解建筑的年代和风格。

“在深度学习阶段,我们设计了一个深度卷积神经网络(DCNN)模型,能够自动学习建筑立面的年代特征。通过深入分析建筑中的视觉要素,我们的模型能够从中提取出有关年代的重要信息。

在深度解读阶段,我们提出了三个组成部分,以便准确理解不同视角下建筑年代和风格之间的差异。这些组成部分能够有效地揭示建筑元素风格的演变以及建筑年代和风格之间的空间和时间关系。”——论文

为了验证我们的框架,作者选定了研究区域:阿姆斯特丹 Amsterdam 和斯德哥尔摩 Stockholm。选择这两座城市中,目的是理解建筑元素风格的演变以及建筑年代和风格之间的关系。更重要的,这些城市有公开的建筑数据!

阿姆斯特丹👈     👉斯德哥尔摩

以上文章解读肯定很深奥 😵。我们从应用角度简单来说:

想象一下,你正在街上散步,突然看到了一个非常有特色的建筑,你非常好奇它是什么年代的,是什么风格的。这时,你只需要拿出手机,拍一张照片,然后通过这个深度学习模型,就可以知道这座建筑的年代和风格了!是不是很神奇?

而且,这个模型不仅仅可以用在阿姆斯特丹或斯德哥尔摩,理论上,只要有足够的数据,它可以应用在世界上的任何一个城市。这就意味着,无论你身在何处,只要有这个模型,你都可以成为一个“建筑鉴赏师”。

阿姆斯特丹建筑足迹

我们可以将研究应用到国内的建筑上,下次当你走在街上,看到一栋建筑,不妨想想,也许在不久的将来,你的手机就可以告诉你这栋建筑的年代和风格了!

二、技术流程

文章来源于Cities,有 sci 论文权限的可以点击https://doi.org/10.1016/j.cities.2022.103787直达原文,完整引用信息请查看文章末尾。

Fig. 4
  1. 数据收集:

    • 为了预测建筑年龄和风格,首先需要收集关于建筑的数据,如建筑年代数据、街景参数、建筑足迹以及建筑风格数据集。
    • 这些数据被用来训练两个深度学习模型:一个用于预测建筑年代,另一个用于预测建筑风格。
  2. 深度学习模型训练:

    • 使用收集的数据,通过深度学习算法训练出两个模型:Building Age ModelBuilding Style Model
    • 这两个模型分别可以预测建筑的年龄和风格。
  3. 深度解释:

    • 一旦模型被训练,接下来的步骤是解释这些模型。这是通过“深度解释”部分来完成的。
    • 对于给定的城市(如 City X 和 City A),模型的预测结果与真实数据进行比较,生成Confusion Matrix(混淆矩阵)。
    • 使用Class Activation Map(类激活图)来查看模型是如何对不同的输入作出决策的。
    • Deep Feature代表模型提取的关键特征。
  4. 特征分析:

    • Salient Feature Mining是为了找出对模型预测最具影响力的特征。
    • Feature Interpretation是对这些关键特征进行解释,以理解其对预测的贡献。
  5. 建筑风格分析:

    • 该过程还研究了各个城市之间的建筑风格同质性、建筑元素的探索与演化、建筑风格的关系以及建筑风格的演化。

三、准备工作

3.1 环境配置

  1. 直接安装 Python、或者使用 Anaconda、Pycharm、VScode 安装。
  2. pytorch 推荐单独安装,详见PyTorch 环境配置
  3. 其余依赖使用pip install -r requirements.txt

3.2 研究区域

论文选定的研究区域为荷兰的最大城市阿姆斯特丹(Amsterdam)和瑞典首都斯德哥尔摩(Stockholm)

为什么会选择阿姆斯特丹?因为阿姆斯特丹的城市发展可以追溯到 12 世纪,在 700 多年的发展中,阿姆斯特丹形成了多元化的建筑风格。更重要的是,此城市有公开的房产数据集(如下图,同样也被称为建筑足迹 building footprints数据),其中包含了建筑的几何数据,当然也包含有建筑年代数据和建筑风格数据。

而选择斯德哥尔摩 Stockholm 是为了测试我们的建筑年代预测方法是否具有普适性(generalizability)和可迁移性(transferability),更重要的是我们可以对比这两个城市之间的建筑风格和年代的差异。

此外,斯德哥尔摩还包含 2000 年至 2020 年间的真实建设记录,这些记录来自于当地最大的两个房产商:Hemnet 和 Booli。并且斯德哥尔摩的建筑数据集在Open Stockholm。不过这两个数据都是付费数据,本次论文不考虑使用。

3.3 数据源

数据源的获取会在下一篇文章《获取数据集——《通过深度学习了解建筑年代和风格》论文复现(二)》详细说明。

  1. BAG 建筑足迹——用于获取建筑的几何数据以及建筑年代数据

  2. 剑桥大学建筑风格图集和相应数据

  3. 基于 PyTorch 的 MIT ADE 20 K 数据集语义分割

四、代码和成果

4.1 完整仓库代码(后续提供):

4.2 阿姆斯特丹建筑足迹数据

ArcGIS Pro中处理建筑足迹

4.3 阿姆斯特丹 36G 大小 7 万多张筛选后的阿姆斯特丹的街景图像:

街景文件

4.4 原始论文

《Understanding architecture age and style through deep learning》 截图

4.5 部分代码、notebook

BAG建筑足迹处理

selenium获取街景图像代码

使用ArcGIS的notebook代码

4.6 模型过程训练

训练挨骂

云GPU模型训练

tensorboaed查看结果(仅用于演示,图中模型欠拟合)


👉 下一篇:Part2.下载和预处理建筑足迹数据集——《通过深度学习了解建筑年代和风格》


因为其他平台不能同步修改,论文解读文章将最先在我的博客发布,你可以点击阅读原文获得查看博客上的原文。

如果你觉得本系列文章有用,欢迎关注博客,点赞 👍 和收藏,也欢迎在评论区讨论,也欢迎访问我的爱发电支持我,或者对此文章进行赞赏。

donate

其他平台账号:
donate

写在最后

论文引用:

Maoran Sun, Fan Zhang, Fabio Duarte, Carlo Ratti,
Understanding architecture age and style through deep learning,
Cities,
Volume 128,
2022,
103787,
ISSN 0264-2751,
https://doi.org/10.1016/j.cities.2022.103787.
(https://www.sciencedirect.com/science/article/pii/S0264275122002268)


Part1.论文解读:如何利用最近很火的深度学习来识别建筑年代和风格?——《通过深度学习了解建筑年代和风格》
https://blog.renhai.online/archives/understanding-architecture-age-and-style-through-deep-learning-part1
作者
Renhai
发布于
2023年10月22日
更新于
2024年06月16日
许可协议