CUDA 3.0 commence à se montrer

La prochaine version du SDK CUDA, la version 3.0, commence à se montrer. Disponible uniquement pour le moment chez quelques développeurs (qui ont reçu un e-mail contenant les informations pour le télécharger), ce SDK améliore le support de l'OpenCL et prend en charge les cartes Fermi.

Dans les améliorations de la technologie elle-même, notons :

• Gestion de la double précision
• Interopérabilité entre OpenCL et OpenGL pour une meilleure performance d'affichage
• Récupération de la Compute Capability via cl_nv_device_attribute_query
• Possibilité de contrôler les optimisations de compilations via cl_nv_compiler_options
• Support des images OpenCL pour un filtrage meilleur et plus rapide
• Support des opérations atomiques 32 bits
• Support des Bytes Addressable Stores
• Support de la révision 1.0.48 des spécifications OpenCL de Khronos
• Support des headers OpenCL de Khronos du 1/11/2009

Dans le SDK et le ToolKit, on retrouve les nouveautés suivantes :

• Interopérabilité entre le pilote CUDA et le Runtime buffer, ce qui permet aux applications utilisant l'API des pilotes CUDA d'utiliser également utiliser des librairies du Runtime CUDA C
• Une nouvelle version du Runtime CUDA C (CUDART) pour un débogage en mode émulation
• Support C++ (héritage des classes et templates) afin de faciliter la vie du développeur
• Nouvelle API unifiée pour Direct3D et OpenGL avec permettant :
- L'interopérabilité des textures OpenGL
- L'interopérabilité de Direct3D11
• Support du débogage matériel de cuda-gdb pour ceux qui utilisent l'API du pilote CUDA
• Nouvel outil de vérification de la mémoire disponible au sein de cuda-gdb et en tant qu'outil à part entière
• Les versions des librairies du CUDA Toolkit sont désormais indiquées, permettant aux applications d'exploiter une version précise ou de supporter plusieurs versions
• Les noyaux C/C++ de CUDA sont désormais compilés en respectant le format ELF

Pour les futures cartes Fermi, annoncées mais pas encore disponibles, on retrouve :

• Le support natif du 64 bits
• Le Multiply Copy Engine
• La gestion des erreurs ECC
• Le Concurrent Kernel Execution
• Le débogage matériel de Fermi via cuda-gdb

Toutes ces nouveautés devraient être disponibles publiquement d'ici quelques semaines, mais des développeurs actifs ont donc déjà accès à ces nouveautés. Rappelons que la technologie CUDA est pour le moment disponible en version 2.3, sous Linux, Windows et Mac OS X, et qu'elle permet d'utiliser des outils comme C pour CUDA, Fortran pour CUDA, etc., à travers les processeurs de flux des cartes GeForce (depuis la 8e génération), dont NVIDIA a récemment changé le nom en core CUDA.

Posez une question dans la catégorie Les news : vos réactions du forum
Cette page n'accepte plus de commentaires
7 commentaires
    Votre commentaire
  • delphi_jb
    nvidia amerliore son api propriétaire ainsi que la comptabilité avec l'openCL...

    moi ce qui m'interesse, c'est que Fermi ayant une vrai architecture memoire (cache L1, L2), on a acces au C++ maintenant.

    mais alors la ou ca blesse mechant, c'est le support des flotant en 64 bits. 2 cycles pour traiter des opération avec des floats 64 bits, comme sur un CPU !!


    mais que va donner le graphisme ?
    0
  • Serious Gilles
    @delphi_jb: oui ça serait pas mal que nvidia en dise plus pour les devs...

    Accès au C++, oui mais comment ? Pour moi il y aura tjrs un model de data parallelisme à respecter (threadgroup, dispatch etc).
    Et je pense pas que fermi soit capable d'executer n'importe quelle fonction c++ (genre qui tire sur iostream) vu que fermi pourra pas faire d'IO.
    0
  • delphi_jb
    non evidement il est clair que fermi doit se conformer au maximum potentiel de son architecture. mais je crois que pour les IO, si fermi ne les prend pas en charge, ca switchera automatiquement sur le CPU. enfin, c'est une supposition... ;-)

    Citation:
    Accès au C++, oui mais comment ? Pour moi il y aura tjrs un model de data parallelisme à respecter (threadgroup, dispatch etc).

    c'est clair que Nvidia aurait pu nous mettre une liste plus complete sur le sujet. Mais de prime abord, pour créer une application orienté compression video (par exemple), on aura bien a disposition une suite d'instruction fonctionnel, basé sans doute sur des modele probablement mais bon, ca c'est le parralélisme d'execution des thread qui veut ca.. ;-)
    0