matlab运行速度太慢,MATLAB是科学计算中广泛使用的一种软件,在处理大量数据和计算复杂算法时不可避免地会遇到程序运行速度过慢的问题。如何优化MATLAB程序运行速度成为当前科学计算研究中需要解决的重要问题之一。针对这一问题,笔者将介绍一些MATLAB程序优化的技巧,帮助研究人员更加高效地开展研究工作。
如何优化MATLAB程序运行速度
文中的代码测试环境为MATLAB R2019a,CPU为Intel 8700,睿频至4.3GHz。
1.预分配内存对于MATLAB新手来说,这是最容易犯的错误之一。
MATLAB中的数组在使用之前不需要明确地定义和指定维数。当赋值的元素下标超出现有的维数时,MATLAB 就为该数组或矩阵扩维一次,这样就会大大降低程序的执行效率。因此,在循环前,预分配内存,可以有效提高程序执行速度。
function test fprintf('f1 is finished in %.4f second.\n',timeit(@f1)); fprintf('f1_pro is finished in %.4f second.\n',timeit(@f1_pro)); % f1 is finished in 3.0272 second. % f1_pro is finished in 0.0571 second. end function A = f1 for ii = 1:1e3 for jj = 1:1e4 A(ii,jj) = ii + jj; end end end function B = f1_pro B = zeros(1e3,1e4); for ii = 1:1e3 for jj = 1:1e4 B(ii,jj) = ii + jj; end end end
这种低级错误在循环次数很大时,运行时间会成倍增长。
2.优先使用built-in函数MATLAB大部分内置函数是m文件,本身也是MATLAB程序,执行效率较低。但有一部分底层的基本函数是built-in函数,执行效率更高,如sum、max、find、exp、fft等等,优先使用built-in函数能够获得更快的执行速度。
一个例子是sum和mean函数,求数组平均值时,sum之后除以数组长度比直接调用mean函数快。
function test A = randn(1e4,1e5); fprintf('f2 is finished in %.4f second.\n',timeit(@()f2(A))); fprintf('f2_pro is finished in %.4f second.\n',timeit(@()f2_pro(A))); %f2 is finished in 0.4895 second. %f2_pro is finished in 0.4875 second. end function [B,C] = f2(A) B = mean(A,1); C = mean(A,2); end function [B,C] = f2_pro(A) B = sum(A,1)/size(A,1); C = sum(A,2)/size(A,2); end
判断一个函数是否是built-in function最直接的手段就是执行edit命令,如
edit exp
编辑器会打开exp.m文件,里面没有代码,只有注释,清楚的写明这是一个built-in函数。
3.列优先MATLAB继承了Fortan按列储存的特点,意味着按列计算时,内存命中率更高,速度更快。
function test A = randn(1e4,1e4); fprintf('f3 is finished in %.4f second.\n',timeit(@()f3(A))); fprintf('f3_pro is finished in %.4f second.\n',timeit(@()f3_pro(A))); % f3 is finished in 0.7349 second. % f3_pro is finished in 0.3419 second. end function B = f3(A) B = fft(A,[],2); end function B = f3_pro(A) B = fft(A,[],1); end
上述例子中,对矩阵按列做fft,比按行做fft快一倍。
4.使用局部函数MATLAB调用函数时,需要搜索该函数并进行匹配。搜索的优先级按照如下:
变量import导入的包函数当前函数内的嵌套函数当前文件内的局部函数私有函数对象函数@文件夹中的类构造函数加载的 Simulink模型当前文件夹中的函数路径中其他位置的函数可以看到,搜索时,文件夹内的函数优先级时很低的,如果改用局部函数,则会更快地搜索该函数。
function test A = randn(1e4,1e4); fprintf('f4 is finished in %.4f second.\n',timeit(@()f4(A))); fprintf('f4_pro is finished in %.4f second.\n',timeit(@()f4_pro(A))); % f4 is finished in 4.2265 second. % f4_pro is finished in 2.4430 second. end function B = f4(A) for ii = 1:size(A,1) for jj = 1:size(A,2) B = myFun(A(ii,jj)); %myFun函数与localFun函数内容一致,但位于文件夹内的myFun.m中 end end end function B = f4_pro(A) for ii = 1:size(A,1) for jj = 1:size(A,2) B = localFun(A(ii,jj)); end end end function y= localFun(x) y = abs(x); end5.稀疏矩阵
一个矩阵中,如果只有少量的非0值,则可以将其用稀疏矩阵来表示。稀疏矩阵仅记录了矩阵中的非0值。当矩阵的稀疏度足够大时,将矩阵转化成稀疏矩阵,可以降低内存占用空间,同时减少计算量。
function test A = diag(1:1e4); % A占用内存约800MB fprintf('f5 (full matrix) is finished in %.4f second.\n',timeit(@()f5(A))); B = sparse(A); % B占用内存约240KB fprintf('f5 (sparse matrix) is finished in %.4f second.\n',timeit(@()f5(B))); % f5 (full matrix) is finished in 0.0246 second. % f5 (sparse matrix) is finished in 0.0000 second. end
注意:若矩阵的稀疏度不大,强行转换成稀疏矩阵反而会导致内存占用空间变大,执行效率降低。
6.向量化编程在新版本的MATLAB中,for循环的执行效率得到很大的提高。但是对于在for循环中进行一些复杂的操作,比如在for循环中改变数组的维数,向量化仍是提升MATLAB执行效率的有效手段。
这里举一个例子,有一个1e6*1的数组A,现在需要去掉数组中索引为1e3的倍数的数,形成一个9.99e5*1的数组。
function test A = randn(1e6,1); fprintf('f6 is finished in %.4f second.\n',timeit(@()f6(A))); fprintf('f6_pro is finished in %.4f second.\n',timeit(@()f6_pro(A))); % f6 is finished in 4.7358 second. % f6_pro is finished in 0.0049 second. end function A = f6(A) for ii = 1:numel(A)/1000 A(ii*999+1) = []; end end % 时间已过 5.909668 秒 function A = f6_pro(A) A = reshape(A,1000,[]); A(end,:) = []; A = A(:); end
更新:为何不直接写成A(1e3:1e3:end)=[]的形式,主要是因为MATLAB对大数索引的效率比较低。这里也做一个对比。
function test A = randn(1e8,1); fprintf('f6_pro is finished in %.4f second.\n',timeit(@()f6_pro(A))); fprintf('f6_extra is finished in %.4f second.\n',timeit(@()f6_extra(A))); % f6_pro is finished in 0.5674 second. % f6_extra is finished in 0.8525 second. end function A = f6_pro(A) A = reshape(A,1000,[]); A(end,:) = []; A = A(:); end function A = f6_extra(A) A(1e3:1e3:end) = []; end7.C/C++混合编程8.并行计算parfor/spmd9.GPU加速10.分布式计算11.终极方案
仅凭软件优化已经无法满足你的需求了,你需要寻求硬件上的升级。i7换至强,内存32G起,CPU/GPU/主板超频,更大规模的本地计算机集群,购买AWS或者Azure等等。
或者,课题组有钱的话,可以直接联系天河一号(天津)、天河二号(广州)、神威太湖之光(无锡)等等。
国家超级计算天津中心
国家超级计算广州中心 - 首页
国家超级计算无锡中心
优化MATLAB程序的运行速度可以通过多方面的方法来实现,包括矢量化、适当使用函数、并行计算以及编译成mex文件等。只要我们针对具体问题进行分析和优化,就能够提高MATLAB程序的运行效率,更快地完成任务。
电脑教程推荐
win10系统推荐
Copyright © 2012-2024 win10系统家园 版权声明