оптимизация на кубиках никак не отличается.
Я взял ваши скрипты, историю 8400 баров, 1 поток, выставил 3 параметра 6859 проходов. В каждом тесте дожидался появления 1%.

скрипт на API из code4.cs - остаток 39мин
скрипт на API из code4.cs с убраными сообщениями в лог - остаток 34мин
скрипт на кубиках - остаток 32мин
скрипт на API из OptimizationTest.dll - остаток 1 час 45мин


Отсюда выводы:
не зачем сравнивать скрипты откомплированные с отладочной информацией и без. Вывод в лог любой отладочной информации по определению съедает время.