WPS/WRF/GSI ERROR
1. v_cfl 积分错误
问题描述
rsl.out.0000 出现下面日志
d03 2022-11-06_06:04:40 1444 points exceeded v_cfl = 2 in domain d03 at time 2022-11-06_06:04:40 hours
d03 2022-11-06_06:04:40 Max W: 6 1 33 W: -3.07 w-cfl: 3.89 dETA: 0.01
解决办法
修改嵌套区域,让 d02 和 d03 不重合
2. GSI 同化失败
问题描述
ifort
可能打印以下堆栈问题
forrtl: severe (174): SIGSEGV, segmentation fault occurred
Image PC Routine Line Source
gsi.x 0000000001961669 Unknown Unknown Unknown
libpthread-2.28.s 0000151EFCD88C20 Unknown Unknown Unknown
gsi.x 000000000131381F frfhvo_ 63 smoothzrf.f90
gsi.x 0000000001086A52 bkgcov_ 67 bkgcov.f90
libiomp5.so 0000151EF5934A43 __kmp_invoke_micr Unknown Unknown
libiomp5.so 0000151EF58F7CDA Unknown Unknown Unknown
libiomp5.so 0000151EF58F723B Unknown Unknown Unknown
libiomp5.so 0000151EF5934EB1 Unknown Unknown Unknown
libpthread-2.28.s 0000151EFCD7E17A Unknown Unknown Unknown
libc-2.28.so 0000151EF462CDC3 clone Unknown Unknown
解决办法
增加 OpenMP
的堆栈大小(ifort
默认 4M)
3. MPI 问题
问题描述
可执行文件调用 Intel MPI
时出现下面错误
Abort(1094031) on node 0 (rank 0 in comm 0): Fatal error in PMPI_Init: Other MPI error, error stack:
MPIR_Init_thread(607)......:
MPID_Init(793).............:
MPIDI_NM_mpi_init_hook(667): OFI addrinfo() failed (ofi_init.h:667:MPIDI_NM_mpi_init_hook:No data available)
解决方法
添加 OFI 环境变量以链接到 libfabric
, 进而链接到 Intel MPI
4. real.exe ERROR
问题描述
国家数据集 CMA-GFS real.exe rsl.error.0000 出现下面的错误
解决方法
sf_surface_physics(默认使用的 CONUS 套装 = 2) 更改为 1
之后又可以正常运行
5. metgrid.exe ERROR: Error in ext pkg write field
问题描述
2024 年美国 GFS 数据集运行 metgrid.exe 时失败,2023 年的数据可以正常运行,log.metgrib 出现下面错误
解决方法
gfs 数据集有问题,更换其他天数的数据集
6. CMA-GFS 数据集 ungrib.exe 运行慢
问题描述
运行24小时的情况下:
国家数据集精度是 0.125°,用时 20~30 分钟
美国数据集精度是 0.25°,用时 2~3 分钟
正常应该慢4倍左右,实际慢10倍左右
解决方法
暂无,使用多台机器并行