Переключиться с opencl и CUDA на многопоточный C++?
Это очень трудно использовать графический процессор, потому что пользователь должен делать сегментацию памяти и передачу, использование локальной памяти и в большинстве приложений достигается очень низкое увеличение производительности в 10-20 раз.
С другой стороны, использовать многопоточность легко и быстро.
Было бы лучше использовать 1280 потоков параллельно с использованием недорогого графического процессора, такого как GTX1060, чем любой другой SW на основе openCL или CUDA
Что я уже пробовал:
я попробовал использовать многопоточность с OpenCL в алгоритмах compuret based vision используя графическую плату Gigabyte Radeon R6 360 и GTX1060