Ответы на вопросы с тегом "технология CUDA"

Ответов: 2 Автор Member 14172841

Мне нужна помощь в создании кода cuda для продукта kronecker. Кто-нибудь может помочь?

может ли кто-нибудь преобразовать этот код c в cuda??// C code to find the Kronecker Product of two // matrices and stores it as matrix C #include <stdio.h> // rowa and cola are no of rows and columns // of matrix A // rowb and colb are no of rows and columns // of matrix B co...

Читать ответы

Ответов: 2 Автор virusx1984

Вопросы о конфликте банка общей памяти в CUDA

Я хочу знать, какое утверждение истинно (предположим, что существует блок со 128 потоками)?(или оба ложные) 1. конфликты банка памяти возникают, если два потока (в одном и том же варпе) читают/загружают один и тот же банк. И конфликты не возникнут, если два потока (не в одном варпе) читают/...

Читать ответы

Ответов: 2 Автор Subash_e-et-t

Реализация MultiGPU в расчете 2 миллионов частиц

Я хочу увеличить вычисление числа частиц. До сих пор я могу вычислить 1 миллион частиц с помощью одного графического процессора. Можно ли увеличить вычисление частиц до 2 миллионов с помощью нескольких графических процессоров? ...

Читать ответы

Ответов: 2 Автор suraty

Какие комбинации версий tensorflow и CUDA/cudnn совместимы?

Привет, Я хочу установить tensorflow-gpu на windows. Я поискал в интернете. Я нашел эти шаги: 1 - установите драйвер Nvidia 2 - Установите cuda 3 - Установите cudnn 4 - Установите tensorflow-gpu Правильно ли это? Я заметил, что некоторые новые версии TensorFlow несовместимы со старыми верси...

Читать ответы

Ответов: 2 Автор Javier Luis Lopez

Переключиться с opencl и CUDA на многопоточный C++?

Это очень трудно использовать графический процессор, потому что пользователь должен делать сегментацию памяти и передачу, использование локальной памяти и в большинстве приложений достигается очень низкое увеличение производительности в 10-20 раз. С другой стороны, использовать многопоточно...

Читать ответы

Ответов: 2 Автор Member 13789251

Как использовать Программирование CUDA для вычисления и обработки правильного числа

Bandwidth test - тест пропускной способности памяти. Особенно это важно для возможностей PCIE. У разных МБ есть разные возможности PCIE. Производительность адаптера CUDA зависит от возможностей PCIE. Это может быть узким местом производительности. В следующих упражнениях по программированию...

Читать ответы

Ответов: 2 Автор malang5

Производительность cblas gemm для разреженных матриц

Что может быть причиной того, что вызов cblas_sgemm занимает гораздо меньше времени для матриц с большим количеством нулей по сравнению с тем же вызовом cblas_sgemm для плотных матриц? Я знаю, что gemv предназначен для матрично-векторного умножения, но почему я не могу использовать gemm для...

Читать ответы

Ответов: 2 Автор virusx1984

Вопросы о конфликте банка общей памяти в CUDA

Я хочу знать, какое утверждение истинно (предположим, что существует блок со 128 потоками)?(или оба ложные) 1. конфликты банка памяти возникают, если два потока (в одном и том же варпе) читают/загружают один и тот же банк. И конфликты не возникнут, если два потока (не в одном варпе) читают/...

Читать ответы

Ответов: 2 Автор Subash_e-et-t

Реализация MultiGPU в расчете 2 миллионов частиц

Я хочу увеличить вычисление числа частиц. До сих пор я могу вычислить 1 миллион частиц с помощью одного графического процессора. Можно ли увеличить вычисление частиц до 2 миллионов с помощью нескольких графических процессоров? ...

Читать ответы

Ответов: 2 Автор suraty

Какие комбинации версий tensorflow и CUDA/cudnn совместимы?

Привет, Я хочу установить tensorflow-gpu на windows. Я поискал в интернете. Я нашел эти шаги: 1 - установите драйвер Nvidia 2 - Установите cuda 3 - Установите cudnn 4 - Установите tensorflow-gpu Правильно ли это? Я заметил, что некоторые новые версии TensorFlow несовместимы со старыми верси...

Читать ответы

Ответов: 2 Автор Javier Luis Lopez

Переключиться с opencl и CUDA на многопоточный C++?

Это очень трудно использовать графический процессор, потому что пользователь должен делать сегментацию памяти и передачу, использование локальной памяти и в большинстве приложений достигается очень низкое увеличение производительности в 10-20 раз. С другой стороны, использовать многопоточно...

Читать ответы

Ответов: 2 Автор Member 13789251

Как использовать Программирование CUDA для вычисления и обработки правильного числа

Bandwidth test - тест пропускной способности памяти. Особенно это важно для возможностей PCIE. У разных МБ есть разные возможности PCIE. Производительность адаптера CUDA зависит от возможностей PCIE. Это может быть узким местом производительности. В следующих упражнениях по программированию...

Читать ответы

Ответов: 2 Автор malang5

Производительность cblas gemm для разреженных матриц

Что может быть причиной того, что вызов cblas_sgemm занимает гораздо меньше времени для матриц с большим количеством нулей по сравнению с тем же вызовом cblas_sgemm для плотных матриц? Я знаю, что gemv предназначен для матрично-векторного умножения, но почему я не могу использовать gemm для...

Читать ответы