使用ArcGIS Python检测洪水影像的区域
洪水发生之后,有时候需要快速分析卫星影像,及时确定被洪水淹没的区域。在本文中,利用了 Python 自动化识别卫星影像中的洪水区域。首先,会在 ArcGIS Pro 中使用 notebook,一步步实现洪水检测的目的。然后,会将代码转换为脚本工具,给其他没有编程基础的人使用。
1.准备工作
本课程需要了解Python
和Arcpy
,并且对遥感有一定了解,如果不熟悉Python
,请查看:
- 有关 Python 的快速介绍,请参阅使用 ArcGIS Notebooks 学习 Python 中的前三课。
- 有关 ArcGIS 中遥感的详细信息,请参阅影像和遥感课程。
流程:
1.下载相应影像
首先,在去欧空局官网下载哨兵 2 多光谱卫星影像。
如何下载影像以及相关基础知识可以查看4.2.8-栅格数据.md。
本课程使用的影像是来自欧盟哥白尼地球观测计划中哨兵卫星计划的处理后的影像,分为洪水前和洪水后。
本示例使用以下数据,点击 Sentinel_2_Clipped.zip进行下载。
下载后,将其解压缩到您的计算机上。解压缩后,您将看到三个文件夹,分别包含 Before, After, 和 Output:洪水前和洪水后的影像以及输出文件夹。
2.波段合成
(1)导入所需的 Python 模块和包
import os
from glob import glob # 支持简单的路径名匹配和列表生成。
import arcpy
from arcpy.sa import * # 空间分析模块 扩展模块
(2)设置环境变量
# 设置一个工程项目文件夹所在的路径
home_dir = os.path.join(os.getcwd(), "resource", "Classify_Imagery_with_Python") # 此处要修改
# 洪水前影像所在的文件夹
before_img_folder = os.path.join(home_dir, "Sentinel_2_Clipped\\Before")
# 洪水后影像所在的文件夹
after_img_folder = os.path.join(home_dir, "Sentinel_2_Clipped\\After")
# 最后成功输出的文件夹
final_output_folder = os.path.join(home_dir, "Sentinel_2_Clipped\\Output")
# gdb
gdb = os.path.join(home_dir, "Classify_Imagery_with_Python.gdb")
# 因为我是外部notebook编辑,所以需要设置工作空间
arcpy.env.workspace = gdb
arcpy.env.overwriteOutput = True # 覆盖输出
(3)波段合成
为了方便后续的调用,我们定义一个函数,用于返回相应的合成波段。
Sentinel-2 影像通常与存储在单独的 JPEG 2000 (.jp2) 文件中的每个波段一起提供。每个波段文件都以波段编号作为文件名的一部分结尾。例如,红色波段、波段 4、文件名以“B04.jp2”结尾。考虑到这种格式,您将创建一个 Python 函数,该函数将包含波段影像的文件夹作为输入参数,并返回一个变量,该变量引用计算机上每个波段的绝对路径。
def create_sen2_band_variables(in_folder):
"""识别指定文件夹中相应哨兵2卫星光谱波段的文件,并将这些文件的路径存储在变量中。
参数:
in_folder: 指定文件夹
返回值:
Blue: 蓝光波段
Green: 绿光波段
Red: 红光波段
Red_Edge_1: 红边波段1
NIR: 近红外波段
SWIR2: 短波红外波段
"""
# 使用 arcpy.AddMessage 函数用于在程序中输出信息,方法同print
arcpy.AddMessage("Creating variables for image bands...")
# 使用 glob 模块获取输入文件夹中所有.jp2图像文件的列表
band_list = glob(in_folder + "/*.jp2")
# 使用列表推导查找与各种 Sentinel-2 波段对应的文件,并将其路径存储在具有各自名称(如 Blue 、、 Green Red 或 NIR )的变量中。
Blue = [x for x in band_list if x.endswith("B02.jp2")][0]
Green = [x for x in band_list if x.endswith("B03.jp2")][0]
Red = [x for x in band_list if x.endswith("B04.jp2")][0]
Red_Edge_1 = [x for x in band_list if x.endswith("B05.jp2")][0]
NIR = [x for x in band_list if x.endswith("B08.jp2")][0]
SWIR2 = [x for x in band_list if x.endswith("B12.jp2")][0]
# 返回包含图像文件路径的波段变量。
return Blue, Green, Red, Red_Edge_1, NIR, SWIR2
# 提取洪水后影像的相应的波段变量
after_Blue, after_Green, after_Red, after_Red_Edge_1, after_NIR, after_SWIR2 = create_sen2_band_variables(after_img_folder)
print(after_Red)
print(after_NIR)
选择波段索引的合成方式
合成波段索引可以用波段合成、栅格计算、栅格代数、栅格函数等方式实现。
例如我们可以使用空间分析中的栅格函数compband_raster = arcpy.sa.CompositeBand([raster,...])
来查看洪水合成彩色红外图像:
# 运行下面的合成洪水后的假彩色红外图像
after_composite_img = CompositeBand([after_NIR, after_Red, after_Green])
after_composite_img
假彩色红外图像中植被区域呈现红色,水呈现充满活力的蓝色:
选择合适波段、波段索引来提取水元素: SWI 和 NDWI
要识别影像中的水,您将使用波段索引。光谱指数应用数学计算来计算影像中每个像素的不同波段之间的比率,目的是突出显示特定现象。我在4.2.8-栅格数据.md已经介绍过。
为了保证结果的准确性,我们将使用两个指数:Sentinel-2 水指数( SWI )和归一化差值水指数 (NDWI)。
SWI 通过计算短波红外(SWIR)和近红外(NIR)波段之间的比率来突出显示水。SWIR 波段可以穿透云层,因此 SWI 可以在云层下检测水。
-
SWI 依赖于 Red Edge 1 和 SWIR2 频段。此指数的公式为: SWI = (Red_Edge1 - SWIR2) / (Red_Edge1 + SWIR2)对应波段是(B05-B12)/(B05+B12)
-
NDWI 使用绿色和近红外(NIR)波段。此指数的公式为: NDWI = (Green - NIR) / (Green + NIR),对应波段是(B03-B08)/(B03+B08)
此处不能使用合成彩色红外相同的方法合成,针对 NDWI 有相应的波段索引函数arcpy.sa.NDWI (raster, {nir_band_id}, {green_band_id})
,但是 SWI 没有对于的波段,为了代码统一,我们都使用栅格计算工具arcpy.sa.RasterCalculator (rasters, input_names, expression, {extent_type}, {cellsize_type})
。
计算 SWI
after_swi_calc = RasterCalculator([after_Red_Edge_1, after_SWIR2],
["x", "y"],
"(x - y) / (x + y)", "IntersectionOf")
arcpy.AddMessage("SWI Successfully Generated")
# 可选 保存到数据库 无需后缀
# !!! 养成好习惯 一定要在数据库处理
# after_swi_calc.save("after_swi")
after_swi_calc
计算 NDWI
after_ndwi_calc = RasterCalculator([after_Green, after_NIR],
["x", "y"],
"(x - y) / (x + y)")
arcpy.AddMessage("NDWI Successfully Generated")
# 可选 保存
#after_ndwi_calc.save("after_ndwi.tif")
after_ndwi_calc
保存之后添加到地图可以检查影像:
像素值较高的区域对应于水,偏向白色。
2.创建阈值函数分离水域
(1)如何分离非水像素或水像素?
解决此问题的常用方法是使用直方图阈值化(histogram thresholding),这是一种常见的图像处理技术,用于将图像转换为二值图像。该技术基于图像的像素值分布,通过选择适当的阈值来将图像中的像素分为两个类别,通常是前景和背景( 0 或 1)。
直方图阈值化的过程涉及计算图像的像素值直方图,该直方图显示了不同像素值的频率分布。通过分析直方图的形状和峰值,可以选择一个合适的阈值来将图像分割为两个部分。所有低于阈值的像素被标记为一个类别(通常是背景),而高于阈值的像素被标记为另一个类别(通常是前景)。
直方图阈值化在 GIS 中广泛应用于图像分割、特征提取、目标检测等领域。它是一种简单而有效的技术,可以帮助提取感兴趣的图像区域,并进行后续的分析和处理。
通常临界点是很主观的,不过也有相对科学的方法。ArcPy 空间分析模块包含阈值函数arcpy.sa.Threshold()
,该函数使用 Otsu 方法自动确定栅格数据集二元分类的最佳阈值。
# 分离 SWI
after_swi_thresh_calc = Threshold(after_swi_calc)
# 保存到数据库 然后添加到地图查看
after_swi_thresh_calc.save("after_swi_thresh")
可以看到,栅格被分为了两个类别,其中 1 表示水,0 表示非水。
此时数据是这样的,可以清晰地看到水的空间分布,
# 分离 NDWI
after_ndwi_thresh_calc = Threshold(after_ndwi_calc)
# 可选 保存
after_ndwi_thresh_calc.save("after_ndwi_thresh")
(2)提取水域并合并 SWI 和 NDWI 栅格
您需要将阈值栅格相加以比较阈值步骤的结果。生成的栅格将具有三个可能的值:
像素值 | 说明 |
---|---|
0 | 两个指数均未将其识别为水的像素 |
1 | 只有一个指数标记为水的像素 |
2 | 两个指数均将其识别为水的像素 |
可以将结果视为置信度栅格。如果两个指数都指示某个像素是水,则与只有一个指数将其分类为水相比,您对结果的置信度更高。
要将两个栅格相加,可以使用 Raster()
创建栅格对象,然后使用栅格代数的运算符将它们相加。您将此过程存储在稍后可以再次调用的函数中。
# 栅格代数运算符
after_water_confidence_raster = after_swi_thresh_calc + after_ndwi_thresh_calc
# 可选 保存
after_water_confidence_raster.save("after_water_confidence_raster")
在软件中查看如图所示:
我们下一步需要提取高置信度值的像素,这些像素是我们最终的洪水区域。
(3)提取高置信度值的像素
使用重分类工具Reclassify()
,将 0 和 1 重分类为 0,将 2 重分类为 1。
# 创建重映射对象,将1重映射为0
remap_value = RemapValue([[1, 0]]) # 用法为[[oldValue, newValue],...]
# Reclassify
after_water_mask_reclass = Reclassify(in_raster=after_water_confidence_raster,
reclass_field="value",
remap=remap_value)
after_water_mask_reclass
图中黄色则为我们重分类后洪水影像的区域。
3.按照相同方法处理洪水前的影像
整合之前的代码然后将 after 替换为 before,就可以处理洪水前的影像了。
# 提取洪水前影像的相应的波段变量
before_Blue, before_Green, before_Red, before_Red_Edge_1, before_NIR, before_SWIR2 = create_sen2_band_variables(before_img_folder)
# 1.计算SWI
before_swi_calc = RasterCalculator([before_Red_Edge_1, before_SWIR2],
["x", "y"],
"(x - y) / (x + y)", "IntersectionOf")
arcpy.AddMessage("SWI Successfully Generated")
# 2.计算NDWI
before_ndwi_calc = RasterCalculator([before_Green, before_NIR],
["x", "y"],
"(x - y) / (x + y)")
# 分离 SWI
before_swi_thresh_calc = Threshold(before_swi_calc)
# 分离 NDWI
before_ndwi_thresh_calc = Threshold(before_ndwi_calc)
# 栅格代数运算符
before_water_confidence_raster = before_swi_thresh_calc + before_ndwi_thresh_calc
# 创建重映射对象,将1重映射为0
remap_value = RemapValue([[1, 0]])
# Reclassify
before_water_mask_reclass = Reclassify(in_raster=before_water_confidence_raster,
reclass_field="value",
remap=remap_value)
4.分析前后水域的变化
现在,您将确定后影像中的哪些区域是洪水,而不是预先存在的水体。为此,您需要计算两个水掩膜栅格之间的差异,从洪水后水掩膜中减去洪水前的水掩膜。
# 使用栅格运算符计算两个水掩膜栅格之间的差异
flooded_area_calc = after_water_mask_reclahttps://blog.renhai.onlineass
flooded_area_calc
# 可选 保存
flooded_area_calc.save("flooded_area_calc")
结果栅格包含三种像素值:
像素值 | 描述 | 重要性 |
---|---|---|
2 | 洪水之后的水像素 | 重要,为洪水影像的区域 |
0 | 没有水 | 不重要 |
-2 | 洪水来之前有水,来之后没水 | 不重要 |
值为 2 的像素是新淹没的区域,我们把这一部分提取出来,就是我们最终的洪水区域,其余值不重要我们赋值为"NoData",在软件中不会显示。
# 创建重映射对象,将2重映射为1,将0重映射为"NoData"
remap_value_final = RemapValue([[-2, "NoData"], [0, "NoData"]])
# Reclassify
flooded_area_final = Reclassify(in_raster=flooded_area_calc,
reclass_field="value",
remap=remap_value_final)
flooded_area_final
最终提取出来的图像如下图所示,蓝色的为洪水区域:
5.保存结果
(1)保存到地理数据库
flooded_area_final.save("Flooded_Area_Final_Raster")
(2)保存为 shapefile
复制栅格
# 处理栅格数据像素类型不是非整型的问题
# 使用复制栅格 将像素类型设为整型(8位无符号)
arcpy.management.CopyRaster(
in_raster="Flooded_Area_Final_Raster",
out_rasterdataset="Flooded_Area_Final_CopyRaster",
pixel_type="8_BIT_UNSIGNED",
format="JP2",
)
RasterToPolygon
arcpy.conversion.RasterToPolygon(
in_raster="Flooded_Area_Final_CopyRaster", # 要求是整型的像素类型 不然会报错ERROR 160333: 未找到表。
out_polygon_features=os.path.join(final_output_folder, "Flooded_Area_Final.shp")
simplify="SIMPLIFY",
raster_field="Value",
create_multipart_features="SINGLE_OUTER_PART",
max_vertices_per_feature=None
)
得到的结果和卫星图作对比:
6.清理临时图层
由于您不需要临时图层,因此可以从地图中移除这些图层。执行此操作的一种方法是手动,右键单击单个图层并单击移除。您还可以使用 Python 代码删除所有临时层。
# Get the currently open ArcGIS Pro Project
aprx = arcpy.mp.ArcGISProject("current")
# Get the map
m = aprx.listMaps("地图")[0]
# Get a list of the layers on the map
thelyrs = m.listLayers()
# Check each layer to determine if it is a temporary, in memory layer,
# and remove the layer if it is.
for lyr in thelyrs:
# 可以加入判断条件
m.removeLayer(lyr)
7. 制作脚本工具
在目录窗格中,右键单击文件夹,我们选择默认的工具箱 (.atbx)。
在目录窗格中,右键单击此工具箱,单击新建,然后单击脚本。
如图填好脚本相关参数:
常规选项卡:
参数的顺序很重要。此表中的顺序必须与您使用 arcpy 在 Python 脚本中设置的顺序匹配。GetParameterAsText.在这种情况下,变量 before_img_folder 设置为第一个参数,设置为第二个参数, after_img_folder 并 final_output_folder 设置为第三个参数。
import os
from glob import glob
import arcpy
from arcpy.sa import *
def create_sen2_band_variables(in_folder):
"""识别指定文件夹中相应哨兵2卫星光谱波段的文件,并将这些文件的路径存储在变量中。
参数:
in_folder: 指定文件夹
返回值:
Blue: 蓝光波段
Green: 绿光波段
Red: 红光波段
Red_Edge_1: 红边波段1
NIR: 近红外波段
SWIR2: 短波红外波段
"""
# 使用 arcpy.AddMessage 函数用于在程序中输出信息,方法同print
arcpy.AddMessage("Creating variables for image bands...")
# 使用 glob 模块获取输入文件夹中所有.jp2图像文件的列表
band_list = glob(in_folder + "/*.jp2")
# 使用列表推导查找与各种 Sentinel-2 波段对应的文件,并将其路径存储在具有各自名称(如 Blue 、、 Green Red 或 NIR )的变量中。
Blue = [x for x in band_list if x.endswith("B02.jp2")][0]
Green = [x for x in band_list if x.endswith("B03.jp2")][0]
Red = [x for x in band_list if x.endswith("B04.jp2")][0]
Red_Edge_1 = [x for x in band_list if x.endswith("B05.jp2")][0]
NIR = [x for x in band_list if x.endswith("B08.jp2")][0]
SWIR2 = [x for x in band_list if x.endswith("B12.jp2")][0]
# 返回包含图像文件路径的波段变量。
return Blue, Green, Red, Red_Edge_1, NIR, SWIR2
# 提取洪水前影像的相应的波段变量
def caculate_water_mask_reclass(img_folder):
"""计算洪水后影像的水掩膜,并重分类为0和1。
参数:
img_folder: 洪水后影像所在的文件夹
返回值:
water_mask_reclass: 洪水后影像的水掩膜
"""
# 当前处理的文件夹是:
current_folder = os.path.basename(img_folder)
arcpy.AddMessage("开始处理 {}...".format(current_folder))
Blue, Green, Red, Red_Edge_1, NIR, SWIR2 = create_sen2_band_variables(img_folder)
# 1.计算SWI
swi_calc = RasterCalculator([Red_Edge_1, SWIR2],
["x", "y"],
"(x - y) / (x + y)", "IntersectionOf")
arcpy.AddMessage("SWI Successfully Generated")
# 2.计算NDWI
ndwi_calc = RasterCalculator([Green, NIR],
["x", "y"],
"(x - y) / (x + y)")
arcpy.AddMessage("NDWI Successfully Generated")
# 分离 SWI
swi_thresh_calc = Threshold(swi_calc)
arcpy.AddMessage("SWI Threshold Successfully Generated")
# 分离 NDWI
ndwi_thresh_calc = Threshold(ndwi_calc)
arcpy.AddMessage("NDWI Threshold Successfully Generated")
# 栅格代数运算符
water_confidence_raster = swi_thresh_calc + ndwi_thresh_calc
arcpy.AddMessage("Water Confidence Raster Successfully Generated")
# 创建重映射对象,将1重映射为0
remap_value = RemapValue([[1, 0]])
# Reclassify
water_mask_reclass = Reclassify(in_raster=water_confidence_raster,
reclass_field="value",
remap=remap_value)
arcpy.AddMessage("Water Mask Reclass Successfully Generated")
return water_mask_reclass
if __name__ == '__main__':
# 洪水前影像所在的文件夹
# before_img_folder = os.path.join(home_dir, "Sentinel_2_Clipped\\Before")
before_img_folder = arcpy.GetParameterAsText(0)
# 洪水后影像所在的文件夹
# after_img_folder = os.path.join(home_dir, "Sentinel_2_Clipped\\After")
after_img_folder = arcpy.GetParameterAsText(1)
# 最后成功输出的文件夹
# final_output_folder = os.path.join(home_dir, "Sentinel_2_Clipped\\Output")
final_output_folder = arcpy.GetParameterAsText(2)
flooded_area_calc = caculate_water_mask_reclass(after_img_folder) - caculate_water_mask_reclass(before_img_folder)
# 创建重映射对象,将2重映射为1,将0重映射为"NoData"
remap_value_final = RemapValue([[-2, "NoData"], [0, "NoData"]])
# Reclassify
flooded_area_final = Reclassify(in_raster=flooded_area_calc,
reclass_field="value",
remap=remap_value_final)
arcpy.AddMessage("Flooded Area Final Raster Successfully Generated")
# 使用复制栅格 将像素类型设为整型(8位无符号)
arcpy.management.CopyRaster(
in_raster=flooded_area_final,
out_rasterdataset="Flooded_Area_Final_CopyRaster",
pixel_type="8_BIT_UNSIGNED",
format="JP2",
)
arcpy.AddMessage("Flooded Area Final Copy Raster Successfully Generated")
# 保存为shapefile
arcpy.conversion.RasterToPolygon(
in_raster="Flooded_Area_Final_CopyRaster", # 要求是整型的像素类型 不然会报错ERROR 160333: 未找到表。
out_polygon_features=os.path.join(final_output_folder, "Flooded_Area_Final.shp"),
simplify="SIMPLIFY",
raster_field="Value",
create_multipart_features="SINGLE_OUTER_PART",
max_vertices_per_feature=None)
arcpy.AddMessage("Flooded Area Final Polygon Successfully Generated")
# 删除复制的栅格数据集
arcpy.management.Delete(
in_data="Flooded_Area_Final_CopyRaster",
data_type="")
工具箱脚本可改进的地方:
- 可以加入判断条件,如果输入的文件夹中没有影像,就不进行计算。
- 给工具箱增加元数据说明,方便使用者使用。
使用条款
This tutorial was originally developed by Esri’s Learn Team.
You can find the official maintained version at this location : Classify Imagery to detect flooding with Python.
You can find other tutorials in the tutorial gallery [https://learn.arcgis.com/en/gallery/].
This notebook has been edited by me. If you wish to reproduce it, please provide attribution according to the Creative Commons 许可 (CC BY-SA-NC).
本教程最初由 Esri 的学习团队开发。
你可以在这个位置找到官方维护的版本:使用 Python 进行影像分类以检测洪水。
你可以在教程库中找到其他教程:[https://learn.arcgis.com/en/gallery/]。
本 notebook 经过本人的编辑,转载请依据 Creative Commons 许可 (CC BY-SA-NC) 协议注明出处。
文章索引
【ArcGIS Python 系列】系列笔记为学习 ArcGIS Pro 和
Arcpy
过程中的总结,记下来方便回看,最新版本会优先发布在我的博客和GITHUB。
【ArcGIS Python 系列】教程部分:
- 一、Arcpy 介绍和安装【ArcGIS Python 系列】
- 二、ArcGIS Pro 和 ArcMap 的区别【ArcGIS Python 系列】
- 三、Arcpy 基础【ArcGIS Python 系列】
- 四、探索空间数据【ArcGIS Python 系列】
- 五、处理地理数据异常【ArcGIS Python 系列】
- 六、处理几何数据【ArcGIS Python 系列】
- 七、处理栅格数据【ArcGIS Python 系列】
- 八、制图模块【ArcGIS Python 系列】
- 九、自定义工具箱【ArcGIS Python 系列】
- 十、ArcGIS_Pro 常见问题【ArcGIS Python 系列】
- 利用 ArcGIS Python 批量处理地理数据的坐标系
- 使用 ArcGIS Python 检测洪水影像的区域
- 利用 ArcGIS_Python 制作考虑路况的交通等时圈
- 利用 ArcGIS Pro 制作弧线 OD 图【ArcGIS Python 系列】
- 使用 ArcGIS Pro 对卫星图进行建筑轮廓识别和车辆检测
- ArcGIS_Pro 官方课程整理
- 持续更新…
【ArcGIS Python 系列】jupyter notebook:
- 4.2.3-arcpy 基础(代码练习).ipynb
- 4.2.4-探索空间数据(代码练习).ipynb
- 4.2.5-示例 1:使用 Arcpy 进行 GIS 人口空间分布数据探索.ipynb
- 4.2.7-处理几何数据代码练习和示例 2.ipynb
- 4.2.8-栅格数据(代码练习).ipynb
- 4.2.9-制图模块.ipynb
- 4.2.12-实操 1-利用 Python 批量处理地理数据的坐标系.ipynb
- 4.2.13-实操 2-使用 Python 对图像中的洪水进行分类.ipynb
- 4.2.14-实操 3-制作考虑路况的交通等时圈.ipynb
如果你觉得本系列文章有用,欢迎关注博客,点赞 👍 和收藏,也欢迎在评论区讨论,也欢迎访问我的爱发电支持我,或者对此文章进行赞赏。