Ответов: 2
Автор Member 14172841
может ли кто-нибудь преобразовать этот код c в cuda??// C code to find the Kronecker Product of two
// matrices and stores it as matrix C
#include <stdio.h>
// rowa and cola are no of rows and columns
// of matrix A
// rowb and colb are no of rows and columns
// of matrix B
co...
Читать ответы
Ответов: 2
Автор virusx1984
Я хочу знать, какое утверждение истинно (предположим, что существует блок со 128 потоками)?(или оба ложные)
1. конфликты банка памяти возникают, если два потока (в одном и том же варпе) читают/загружают один и тот же банк. И конфликты не возникнут, если два потока (не в одном варпе) читают/...
Читать ответы
Ответов: 2
Автор pramithas dhakal
I am doing High Speed Data Calculation project for a CFD software.For this I have constructed an octree and pupulated it with particles.For collision detection,for each particle ,I have already calculated its neighbouring particles.For this purpose I have first calculated in which octree cu...
Читать ответы
Ответов: 2
Автор Subash_e-et-t
Я хочу увеличить вычисление числа частиц. До сих пор я могу вычислить 1 миллион частиц с помощью одного графического процессора. Можно ли увеличить вычисление частиц до 2 миллионов с помощью нескольких графических процессоров?
...
Читать ответы
Ответов: 2
Автор Javier Luis Lopez
Это очень трудно использовать графический процессор, потому что пользователь должен делать сегментацию памяти и передачу, использование локальной памяти и в большинстве приложений достигается очень низкое увеличение производительности в 10-20 раз.
С другой стороны, использовать многопоточно...
Читать ответы
Ответов: 2
Автор Member 13789251
Bandwidth test - тест пропускной способности памяти.
Особенно это важно для возможностей PCIE. У разных МБ есть разные возможности PCIE.
Производительность адаптера CUDA зависит от возможностей PCIE. Это может быть узким местом производительности.
В следующих упражнениях по программированию...
Читать ответы
Ответов: 2
Автор Member 12710061
Как мне использовать Eclipse для JCUDA, это срочно?Что я уже пробовал:
Я могу найти это с linux и mac, но я хочу это на машине windows.
...
Читать ответы
Ответов: 2
Автор virusx1984
Я хочу знать, какое утверждение истинно (предположим, что существует блок со 128 потоками)?(или оба ложные)
1. конфликты банка памяти возникают, если два потока (в одном и том же варпе) читают/загружают один и тот же банк. И конфликты не возникнут, если два потока (не в одном варпе) читают/...
Читать ответы
Ответов: 2
Автор pramithas dhakal
I am doing High Speed Data Calculation project for a CFD software.For this I have constructed an octree and pupulated it with particles.For collision detection,for each particle ,I have already calculated its neighbouring particles.For this purpose I have first calculated in which octree cu...
Читать ответы
Ответов: 2
Автор Subash_e-et-t
Я хочу увеличить вычисление числа частиц. До сих пор я могу вычислить 1 миллион частиц с помощью одного графического процессора. Можно ли увеличить вычисление частиц до 2 миллионов с помощью нескольких графических процессоров?
...
Читать ответы
Ответов: 2
Автор Javier Luis Lopez
Это очень трудно использовать графический процессор, потому что пользователь должен делать сегментацию памяти и передачу, использование локальной памяти и в большинстве приложений достигается очень низкое увеличение производительности в 10-20 раз.
С другой стороны, использовать многопоточно...
Читать ответы
Ответов: 2
Автор Member 13789251
Bandwidth test - тест пропускной способности памяти.
Особенно это важно для возможностей PCIE. У разных МБ есть разные возможности PCIE.
Производительность адаптера CUDA зависит от возможностей PCIE. Это может быть узким местом производительности.
В следующих упражнениях по программированию...
Читать ответы
Ответов: 2
Автор Member 12710061
Как мне использовать Eclipse для JCUDA, это срочно?Что я уже пробовал:
Я могу найти это с linux и mac, но я хочу это на машине windows.
...
Читать ответы