并行执行¶
关于并行执行¶
概述¶
Abaqus 的并行执行使用三种不同方案实现:线程、消息传递和两者的组合。线程是可以在同一应用程序内同时执行不同任务的轻量级进程。线程可以通过共享相同的内存池相对容易地进行通信。线程并行化在所有共享内存平台上都很容易获得。
使用消息传递的并行化使用多个通过消息传递接口 (MPI) 相互通信的分析进程。这需要安装 MPI 组件。
混合并行化结合了多个分析进程之间的基于 MPI 的消息传递和每个分析进程中线程之间的共享内存通信。这需要安装 MPI 组件。
Abaqus 功能的并行处理支持¶
以下 Abaqus/Standard 功能可以并行执行:分析输入预处理、直接稀疏求解器、迭代求解器、特征求解器和单元操作。
共享内存计算机上的并行执行¶
Abaqus/Standard 和 Abaqus/Explicit 可以通过使用线程或 MPI 在共享内存计算机上并行执行。
计算机集群上的并行执行¶
Abaqus 可以通过使用基于 MPI 的并行化在计算机集群上并行执行。对于计算机集群上的并行执行,机器列表或主机通过 mp_host_list 环境文件参数给出。
使用 GPGPU 硬件的并行执行¶
Abaqus/Standard 中的直接求解器、AMS 特征求解器和模态频率响应求解器可以在配备支持计算的 GPGPU 卡的计算机上并行执行。
与用户子程序一起使用¶
用户子程序可以在并行运行作业时使用。在分布式运行中,整个模型被分解为单独的域(分区)。每个域由单独的 MPI 进程服务。
Abaqus/Standard 中的并行执行¶
概述¶
Abaqus/Standard 中的并行执行: - 减少大型分析的运行时间 - 可用于共享内存计算机和计算机集群 - 可以使用 GPGPU 硬件
调用并行处理¶
Abaqus/Standard 支持共享内存计算机和计算机集群的并行化。并行化使用 cpus 选项调用,表示处理器总数;以及 threads_per_mpi_process 选项,表示这些处理器的分配方式。
基于线程的并行化¶
您可以在计算集群的一个节点内以线程模式执行 Abaqus/Standard。
两种基于线程的并行化选项可用:混合直接稀疏求解器和纯线程直接稀疏求解器。纯线程直接稀疏求解器在许多工作流中提供比混合直接稀疏求解器更好的性能。
基于 MPI 的并行化¶
Abaqus/Standard 也可以在 MPI 模式下执行,这使用消息传递接口在机器主机之间进行通信。
混合并行化¶
您可以在 MPI 并行化在主机之间执行和线程并行化在每个主机内执行时进一步改进混合模式的性能。
GPGPU 加速¶
GPGPU 加速在直接稀疏求解器、AMS 特征求解器和模态频率响应求解器中得到支持。
稳态动态分析的并行执行¶
稳态动态分析提供由于谐波激励在给定频率下的系统稳态响应。对于大型有限元系统,频率响应计算可能非常耗时。
结果一致性¶
某些物理系统可能对小扰动高度敏感。当模拟此类物理敏感系统时,您可能会看到在不同处理器数量下运行的作业之间的数值结果差异。
Abaqus/Explicit 中的并行执行¶
概述¶
Abaqus/Explicit 中的并行执行: - 减少需要大量增量的分析的执行时间 - 减少包含大量节点和单元的分析的执行时间 - 产生的分析结果与用于分析的处理器数量无关 - 可用于共享内存计算机和计算机集群
调用并行处理¶
Abaqus/Explicit 中的并行化以两种方式实现:域级和循环级。默认且最有效的方法是域级并行化方法。
域级并行化¶
域级方法将模型分割成多个拓扑域。这些并行域包含节点和单元的子集以及计算解决方案所需的所有建模功能。域在可用处理器之间均匀分布。
循环级并行化¶
循环级方法仅并行化单元和接触对代码中的低级循环。
测量并行性能¶
并行性能通过比较在单个处理器上运行所需的总时间(串行运行)与在多个处理器上运行所需的总时间(并行运行)来衡量。
输出¶
没有输出限制。
原文来源:Abaqus 2025 FD02 Execution Guide