- Введение. Существующие многоядерные системы. GPU как массивно-параллельный процессор. CUDA «hello, world».
- Архитектура Tesla и модель программирования CUDA.
- Иерархия памяти CUDA. Глобальная память. Параллельные решения задач умножения матриц и решения СЛАУ.
- Иерархия памяти CUDA. Разделяемая память. Реализация примитивов параллельного суммирования (reduce) и префиксной суммы (scan) на CUDA.
- Иерархия памяти CUDA. Текстуры в CUDA. Цифровая обработка сигналов: реализация операций свертки, быстрого преобразования Фурье.
- Нерегулярный параллелизм в цифровой обработке сигналов.
- Особенности реализации алгоритмов трассировки лучей на CUDA.
- Решение дифференциальных уравнений на CUDA на примере задач гидродинамики.
- Программирование многоядерных GPU. Кластеры из GPU.
- Вопросы оптимизации приложений на CUDA.
- Перспективы развития массивно-параллельных систем. Направления исследования.