Использование разделяемой памяти платформы CUDA в параллельной реализации искусственной нейронной сети прямого распространения

Автор(и)

  • В. А. Колбасин НТУ "ХПИ", Ukraine

DOI:

https://doi.org/10.20998/%25x

Анотація

В статье рассматриваются влияние способа использования разделяемой памяти на производительность реализации искусственной нейронной сети на платформе CUDA. Рассматриваются варианты размещения нескольких окон исходных данных и весовых коэффициентов в разделяемой памяти. Показано, что из-за нерационального использования времени ожидания загрузки данных из глобальной памяти производительность этих вариантов не превосходит производительности базовой схемы распараллеливания.

Біографія автора

В. А. Колбасин, НТУ "ХПИ"

канд. техн. наук, каф. САиУ, НТУ «ХПИ»

Посилання

Бодянский Е. В. Искусственные нейронные сети / О. Г. Руденко, Е. В. Бодянский. - Х.: Компания СМИТ, 2005. - 408 с.

Осовский С. Нейронные сети для обработки информации / С. Осовский. – М. Финансы и статистика, 2004. – 344 с.

NVidia CUDA Programming Guide [Электронный ресурс] / NVidia Corp, 2008. – Режим доступа: http:// developer.download.nvidia.com/compute/cuda/3_2/toolkit/docs/CUDA_C_Programing_Guide.pdf. - 10.05.2011 г. - Загл. с экрана.

Боресков А. В. Основы работы с технологией CUDA [Текст] / А. В. Боресков, А. А. Харламов. – М.:ДМК Пресс, 2010. – 232 с.

Jang H. H. Neural Network Implementation Using CUDA and OpenMP / H. H. Jang, A. J. Park, K. C. Jung // Proceeding of Computing: Techniques and Applications, 2008. – p. 155–161.

Uetz R. Large-scale Object Recognition with CUDA-accelerated Hierarchical Neural Networks Intelligent Computing and Intelligent Systems / R. Uetz, S. Behnke // Proceeding of Intelligent computing and Intelligent Systems, 2009. – p. 536 – 541.

Колбасин В. А. Параллельная обработка данных искусственными нейронными сетями на платформе CUDA / В.А. Колбасин // Восточно-Европейский журнал передовых технологий. – Харьков, 2011. - № 3/3 (51). – С. 54-57.

##submission.downloads##

Опубліковано

2011-11-29

Як цитувати

Колбасин, В. А. (2011). Использование разделяемой памяти платформы CUDA в параллельной реализации искусственной нейронной сети прямого распространения. Вісник Національного технічного університету «ХПІ». Серія: Системний аналiз, управління та iнформацiйнi технологiї, (35), 43–46. https://doi.org/10.20998/%x

Номер

Розділ

СИСТЕМНИЙ АНАЛІЗ І ТЕОРІЯ ПРИЙНЯТТЯ РІШЕНЬ