ку!
Переделал кое-что в одном алгоритме на предмет реализации многопоточности. Что оптимизировать — смотрел профайлером, соотв. дебаг версию.
Далее реализовал многопоточность одного узкого места.
Получил такой результат:
Скомпилированный с оптимизацией(/O2) по скорости экзешник считает на 20% чем его однопоточный(/O2).
Скомпилированный БЕЗ ОПТИМИЗАЦИИ(/Od) — на 77% быстрее однопоточный(/Od).
Чем можно объяснить подобные результаты?
p.s. т.к. писал на С++, то сообщение в эту тему.