Использование разделяемой памяти платформы CUDA в параллельной реализации искусственной нейронной сети прямого распространения

Authors

  • В. А. Колбасин НТУ "ХПИ", Ukraine

DOI:

https://doi.org/10.20998/%25x

Abstract

В статье рассматриваются влияние способа использования разделяемой памяти на производительность реализации искусственной нейронной сети на платформе CUDA. Рассматриваются варианты размещения нескольких окон исходных данных и весовых коэффициентов в разделяемой памяти. Показано, что из-за нерационального использования времени ожидания загрузки данных из глобальной памяти производительность этих вариантов не превосходит производительности базовой схемы распараллеливания.

Author Biography

В. А. Колбасин, НТУ "ХПИ"

канд. техн. наук, каф. САиУ, НТУ «ХПИ»

References

Бодянский Е. В. Искусственные нейронные сети / О. Г. Руденко, Е. В. Бодянский. - Х.: Компания СМИТ, 2005. - 408 с.

Осовский С. Нейронные сети для обработки информации / С. Осовский. – М. Финансы и статистика, 2004. – 344 с.

NVidia CUDA Programming Guide [Электронный ресурс] / NVidia Corp, 2008. – Режим доступа: http:// developer.download.nvidia.com/compute/cuda/3_2/toolkit/docs/CUDA_C_Programing_Guide.pdf. - 10.05.2011 г. - Загл. с экрана.

Боресков А. В. Основы работы с технологией CUDA [Текст] / А. В. Боресков, А. А. Харламов. – М.:ДМК Пресс, 2010. – 232 с.

Jang H. H. Neural Network Implementation Using CUDA and OpenMP / H. H. Jang, A. J. Park, K. C. Jung // Proceeding of Computing: Techniques and Applications, 2008. – p. 155–161.

Uetz R. Large-scale Object Recognition with CUDA-accelerated Hierarchical Neural Networks Intelligent Computing and Intelligent Systems / R. Uetz, S. Behnke // Proceeding of Intelligent computing and Intelligent Systems, 2009. – p. 536 – 541.

Колбасин В. А. Параллельная обработка данных искусственными нейронными сетями на платформе CUDA / В.А. Колбасин // Восточно-Европейский журнал передовых технологий. – Харьков, 2011. - № 3/3 (51). – С. 54-57.

Published

2011-11-29

How to Cite

Колбасин, В. А. (2011). Использование разделяемой памяти платформы CUDA в параллельной реализации искусственной нейронной сети прямого распространения. Bulletin of National Technical University "KhPI". Series: System Analysis, Control and Information Technologies, (35), 43–46. https://doi.org/10.20998/%x

Issue

Section

SYSTEM ANALYSIS AND DECISION-MAKING THEORY