Сами представители Nvidia указывают на три главных преимущества Cuda Toolkit 4.0 – прямая связь между ядрами графических процессоров в рамках одного сервера или рабочей станции, унифицированная виртуальная адресация для основной памяти и памяти графического процессора, а также открытые параллельные алгоритмы на языке C++. По некоторым данным, предоставляемые алгоритмы обеспечивают серьезный выигрыш в скорости исполнения стандартных параллельных процедур. Например, параллельная сортировка выполняется в 5-100 раз быстрее, чем при использовании библиотек Standard Template Library или Threading Building Blocks.
Вдобавок к библиотеке стандартных параллельных функций на языке C++ пакет Cuda Toolkit 4.0 предлагает поддержку технологии OpenMPI, которая позволяет автоматически переносить данные в память графического процессора и обратно по шине Infiniband, когда приложение выполняет MPI-запрос на получение или отправку данных. Также поддерживается одновременная работы с несколькими потоками исполнения на одном основном процессоре с общими контекстами, а один поток исполнения на центральном процессоре может использовать ресурсы сразу всех графических процессоров в системе.
Поставки Cuda Toolkit 4.0 в версии релиз-кандидат начнутся 4 марта 2011 года для зарегистрированных участников программы по разработке CUDA-ориентированных приложений. Сроки выпуска официальной версии пока не определены.
18.04.2011 22:48
Nvidia Cuda Toolkit 4.0
Компания Nvidia официально объявила о предстоящем выпуске новой версии своего инструментария Cuda Toolkit 4.0 для разработчиков параллельных приложений. Среди прочих отличий новой версии Cuda Toolkit стоит отметить включение в комплект целого набора готовых алгоритмов для параллельных вычислений с открытым исходным кодом на языке C++.
Дополнительная информация
- Источник:
Оставить коментарий
Make sure you enter the (*) required information where indicated.
Basic HTML code is allowed.



