UnrealEngine4使用反汇编来确定该进行优化的地方 - 纳金网
联系我们

给我们留言

联系我们

地址:福建省晋江市青阳街道洪山路国际工业设计园纳金网

邮箱:info@narkii.com

电话:0595-82682267

(周一到周五, 周六周日休息)

当前位置:主页 > 3D教程 > 图文教程

UnrealEngine4使用反汇编来确定该进行优化的地方

来源: 52vr | 责任编辑:传说的落叶 | 发布时间: 2019-06-13 08:38 | 浏览量:

Unreal Engine 4 —— 使用反汇编来确定该进行优化的地方

 
这篇文章翻译自Robert Troughton的博客Using the Disassembler to Highlight Optimization Targets,已征得原作者同意。
 
This post is translated from English. You can find the original English language version here: http://coconutlizard.co.uk/blog/ue4/using-the-disassembler/
 
UE4中有很多的字符串处理的函数,这些函数会在UE4中的各种情况下被调用 —— 例如无论在编辑器、cooking或者运行游戏时,都会有一大堆的字符串函数被调用。
 
在最近的测试中,我们着重测试了一下FPaths::IsRelative()函数,这个函数可以在Paths.cpp中被找到:
 

[代码]:

1 bool FPaths::IsRelative(const FString& InPath)
2 {
3   const bool IsRooted = InPath.StartsWith(TEXT("\\"), ESearchCase::CaseSensitive)   ||
4               InPath.StartsWith(TEXT("/"), ESearchCase::CaseSensitive)  ||
5               InPath.StartsWith(TEXT("root:/")) |
6               (InPath.Len() >= 2 && FChar::IsAlpha(InPath[0]) && InPath[1] == TEXT(':'));
7   return !IsRooted;
8 }
 
以上的代码看起来是无害的,只是一些很普通的字符串测试来判定InPath是相对路径(eg. “../engine/myfile.uasset”) 还是绝对路径 (eg. “c:\myfile.uasset”)。
 
为了研究这段代码,我启动Debugger,在函数中设置了断点并且查看其汇编代码。此时发生了非常恐怖的事,以下只是汇编代码中的一小段:
 

[代码]:

01 00007FF6DFF97B4E  mov         ecx,2 
02 00007FF6DFF97B53  xor         edi,edi 
03 00007FF6DFF97B55  xor         edx,edx 
04 00007FF6DFF97B57  mov         r8d,ecx 
05 00007FF6DFF97B5A  mov         qword ptr [rsp+70h],rbx 
06 00007FF6DFF97B5F  mov         dword ptr [rbp+28h],edi 
07 00007FF6DFF97B62  mov         qword ptr [rbp-10h],rdi 
08 00007FF6DFF97B66  mov         qword ptr [rbp-8],2 
09 00007FF6DFF97B6E  call        DefaultCalculateSlack (07FF6DFEC7DD0h) 
10 00007FF6DFF97B73  movsxd      rcx,eax 
11 00007FF6DFF97B76  mov         rax,qword ptr [rbp-10h] 
12 00007FF6DFF97B7A  mov         dword ptr [rbp-4],ecx 
13 00007FF6DFF97B7D  test        rax,rax 
14 00007FF6DFF97B80  jne         FPaths::IsRelative+46h (07FF6DFF97B86h) 
15 00007FF6DFF97B82  test        ecx,ecx 
16 00007FF6DFF97B84  je          FPaths::IsRelative+5Bh (07FF6DFF97B9Bh) 
17 00007FF6DFF97B86  mov         rdx,rcx 
18 00007FF6DFF97B89  xor         r8d,r8d 
19 00007FF6DFF97B8C  mov         rcx,rax 
20 00007FF6DFF97B8F  add         rdx,rdx 
21 00007FF6DFF97B92  call        FMemory::Realloc (07FF6DFF04CB0h) 
22 00007FF6DFF97B97  mov         qword ptr [rbp-10h],rax 
23 00007FF6DFF97B9B  lea         rdx,[ToUpperAdjustmentTable+2ABCh (07FF6E1EFFB9Ch)] 
24 00007FF6DFF97BA2  mov         r8d,4 
25 00007FF6DFF97BA8  mov         rcx,rax 
26 00007FF6DFF97BAB  call        FGenericPlatformString::Memcpy (07FF6DFED3CA0h) 
27 00007FF6DFF97BB0  lea         rdx,[rbp-10h] 
28 00007FF6DFF97BB4  xor         r8d,r8d 
29 00007FF6DFF97BB7  mov         rcx,rsi 
30 00007FF6DFF97BBA  mov         ebx,1 
31 00007FF6DFF97BBF  call        FString::StartsWith (07FF6DFEDD440h) 
32 00007FF6DFF97BC4  test        al,al 
33 00007FF6DFF97BC6  jne         FPaths::IsRelative+1BBh (07FF6DFF97CFBh)
 
以上仅仅是整个函数的汇编代码的冰山一角,而整个函数也只有一行cpp代码,这简直是恐怖。
 
此外,这个代码不仅仅只是长而已,你应该可以看到有FMemory::Realloc()函数的调用。在整个汇编代码中,FMemory::Realloc()函数调用了3次。与之对应的,FMemory::Free()函数也出现了多次。
 
还有,StartsWith()函数也不是一个很便宜的函数(注意StartsWith()只有一个关于FString的Implementation)。
 
因此,我做了如下事:
 
减少了StartsWith()函数的调用,转而使用更为直接的字符比较。
移除了runtime的TEXT()区块,取而代之的是在外部直接创建。
将其中RootPrefix测试设为在编辑器中才有效。
因此,我最终的代码如下:
 

[代码]:

01 // Paths.cpp
02  
03     #if WITH_EDITOR
04     FString FPaths::RootPrefix = TEXT("root:/");
05     #endif // WITH_EDITOR
06     bool FPaths::IsRelative(const FString& InPath)
07     {
08       const uint32 PathLen = InPath.Len();
09       const bool IsRooted = PathLen &&
10         ((InPath[0] == '/') ||
11           (PathLen >= 2 && (
12             ((InPath[0] == '\\') && (InPath[1] == '\\'))
13             || (InPath[1] == ':' && FChar::IsAlpha(InPath[0]))
14     #if WITH_EDITOR
15             || (InPath.StartsWith(RootPrefix))
16     #endif // WITH_EDITOR
17           ))
18         );
19       return !IsRooted;
20     }
 
对于.h文件,添加内容如下:
 

[代码]:

1 // Paths.h
2     private:
3     #if WITH_EDITOR
4       static FString RootPrefix;
5     #endif // WITH_EDITOR
 
重新编译后,最终的汇编代码如下:
 

[代码]:

01 00007FF7147B695A  mov         edx,dword ptr [r8+8] 
02 00007FF7147B695E  mov         rsi,rcx 
03 00007FF7147B6961  test        edx,edx 
04 00007FF7147B6963  je          FPaths::ConvertRelativePathToFull+67h (07FF7147B6997h) 
05 00007FF7147B6965  dec         edx 
06 00007FF7147B6967  je          FPaths::ConvertRelativePathToFull+67h (07FF7147B6997h) 
07 00007FF7147B6969  mov         rax,qword ptr [r8] 
08 00007FF7147B696C  movzx       ecx,word ptr [rax] 
09 00007FF7147B696F  cmp         cx,2Fh 
10 00007FF7147B6973  je          FPaths::ConvertRelativePathToFull+0A9h (07FF7147B69D9h) 
11 00007FF7147B6975  cmp         edx,2 
12 00007FF7147B6978  jb          FPaths::ConvertRelativePathToFull+67h (07FF7147B6997h) 
13 00007FF7147B697A  cmp         cx,5Ch 
14 00007FF7147B697E  jne         FPaths::ConvertRelativePathToFull+56h (07FF7147B6986h) 
15 00007FF7147B6980  cmp         word ptr [rax+2],cx 
16 00007FF7147B6984  je          FPaths::ConvertRelativePathToFull+0A9h (07FF7147B69D9h) 
17 00007FF7147B6986  cmp         word ptr [rax+2],3Ah 
18 00007FF7147B698B  jne         FPaths::ConvertRelativePathToFull+67h (07FF7147B6997h) 
19 00007FF7147B698D  call        qword ptr [__imp_iswalpha (07FF716557B48h)] 
20 00007FF7147B6993  test        eax,eax 
21 00007FF7147B6995  jne         FPaths::ConvertRelativePathToFull+0A9h (07FF7147B69D9h)
 
以上的汇编代码是在non-editor模式中的整个函数的汇编代码,我相信你我都能同意以上代码的性能要好得多。
 
优化这段代码还带来了一个很好的副作用:编译器会将这段逻辑进行inline操作,我们甚至不需要声明FORCEINLINE或者INLINE宏!
 
我的最终测试表明这段代码的性能快了将近20倍,而代码资源占用量只是原来的10%。

相关文章
网友评论

您需要登录后才可以发帖 登录 | 立即注册

关闭

全部评论:0条

推荐
热门