문득 떠오르는 궁금증에 글을 올려봅니다.


1.  한 파일에 3개의 함수(함수1, 함수2, 함수3)가 있다면


all_lowering_passes

all_ipa_passes

all_passes


과 같은 main pass(??) 에 대하여 각 함수별로 수행되는 것을 확인하였는데(아래처럼)


함수 1 의 all_lowering_passes

함수 2 의 all_lowering_passes

함수 3 의 all_lowering_passes

함수 1 의 all_ipa_passes

함수 2 의 all_ipa_passes

함수 3 의 all_ipa_passes

함수 1 의 all_passes

함수 2 의 all_passes

함수 3 의 all_passes


의문이 드는 점은 tree or rtl dump 를 하게되면 생성되는 각 출력 파일들이 몇번째 함수의 optimization을 수행하고 난 후의 dump 인지 궁금하네요. 마지막 함수(예에선 함수 3)가 호출된 후라고 예상하였는데 그렇지 않은듯한 결과가....--.


2. 생성된 RTL 은 pass_final(rest_of_handle_final)에서 recog()함수의 recognition 과정(생성된 RTL을 define_insn등에서의 RTL과 match 하는 과정)을 통해 asm code로 emission 됩니다. 


recog()함수에서 predicate와 condition(define_insn 내의) 을 체크하는 부분을 확인하였고 constraint에 대한 체크는 없는 것을 확인하였습니다.(제가 실수를 하지 않았다면요) 


그래서 constraint 의 점검은 register allocation 시 할 것으로 예상했는데 

그렇다면 이미 reg alloc 에서 constraint 점검을 끝내놓은 상황에서 코드 흐름상 나중에 있는 recog()에서  굳이 predicate을 체크해줄 필요가 있을까 입니다. 


predicate 보다 constraint 가 더 restrictive 하다고 알고 있고 어떤 자료에선 predicate로 먼저 범위를 좁혀놓는 다는 해석을 본 기억나네요.


3. 프로그램을 만들때 필요한 함수들을 한 파일안에 집어넣어 놓는 것이 performance가 더 좋다??(performance 측면에서만)


LTO 가 없다고 가정하면 컴파일러가 수행하는 IPO(interprocedural optimization)는 파일내의 function 간의 optimization 을 할텐데


그렇다면 당연히 function들을 한 파일로 만들어 버리면 성능이 좋아져야 하는데... 너무 당연한 얘기에 의문을 갖는건지 모르겠습니다.^^


(물론 다른 요인으로 인해 달라 질 수 있겠지만 IPO에만 포커스를 맞춰 보았습니다)


글이 깔끔하지 못한점은 양해를 부탁드립니다^^

XE Login