OpenCL
OpenCL (englisch Open Computing Language) ist eine Schnittstelle für uneinheitliche Parallelrechner, die z. B. mit Haupt-, Grafik- oder digitalen Signalprozessoren ausgestattet sind. Dazu gehört die Programmiersprache „OpenCL C“. OpenCL wurde ursprünglich von der Firma Apple entwickelt, um die Leistung der aktuellen Grafikprozessoren auch für nicht-grafische Anwendungen nutzbar zu machen.
OpenCL
| |
---|---|
Basisdaten
| |
Entwickler | Khronos Group |
Erscheinungsjahr | 28. August 2009 |
Aktuelle Version | 3.0.17[1] (24. Oktober 2024) |
Aktuelle Vorabversion | 3.0 provisional (27. April 2020) |
Betriebssystem | plattformunabhängig |
Programmiersprache | C++, C |
Kategorie | Programmierschnittstelle |
Lizenz | verschieden |
www.khronos.org/opencl |
Architektur
BearbeitenEin OpenCL-System besteht aus einem Host und einem oder mehreren OpenCL-Geräten. Ein Gerät besteht aus einer oder mehreren unabhängigen Recheneinheiten (englisch „compute unit“, kurz „CU“). Dies sind bei einem Mehrkernprozessor die verfügbaren Kerne, die zusammengefasst die Central Processing Unit ergeben, und für die Grafikkarte die Shader. Die Compute Unit ist in ein oder mehrere ausführende Elemente (englisch „processing element“, kurz „PE“) unterteilt. Der Host verteilt dabei die Kernel (Programme, dt. Kerne) zur Laufzeit auf die verfügbaren Geräte.
Es gibt zwei Arten von Kernel:
- OpenCL-Kernel
- Diese sind in der Programmiersprache OpenCL C geschrieben. OpenCL C basiert auf ISO C99 und wurde um Funktionen und Datentypen zur parallelen Verarbeitung erweitert.
- Native Kernel
- Diese Kernel sind optional und implementierungsspezifisch.
Die OpenCL-Kernel werden zur Laufzeit vom OpenCL-Compiler übersetzt und danach von einem OpenCL-Gerät ausgeführt. Hierdurch braucht zur Entwicklungszeit nicht bekannt zu sein, auf welcher Hardware das Programm später ausgeführt wird.
Die Berechnungen werden zur Laufzeit von den sogenannten Work-Items durchgeführt. Diese Work-Items werden zu einem ein-, zwei- oder dreidimensionalen Gitter angeordnet, über das die Work-Items adressiert werden können. Work-Items werden zu Work-Groups gruppiert, in denen eine Synchronisation möglich ist und die auf einen gemeinsamen Speicher zugreifen können. Ein einzelnes Work-Item kann also absolut, durch seine Koordinate und relativ, durch die Koordinate der es enthaltenden Work-Group und die Koordinate innerhalb der Work-Group angesprochen werden.
Speichermodell
BearbeitenIn OpenCL werden fünf Arten von Speicher unterschieden:
- Hostspeicher (host memory): Beim Hostspeicher handelt es sich um den regulären Arbeitsspeicher des Leitprogramms. Ein OpenCL-Kernel kann darauf nicht direkt zugreifen.
- globaler Speicher (global memory): Hierbei handelt es sich um den Arbeitsspeicher der OpenCL-Kernel. Jede Instanz eines Kernels hat auf den gesamten Bereich wahlfreien Zugriff.
- konstanter Speicher (constant memory): Der konstante Speicher unterscheidet sich vom globalen Speicher darin, dass die Kernelinstanzen diesen Speicher ausschließlich lesen, aber nicht verändern können.
- lokaler Speicher (local memory): Eine Gruppe von Kernelinstanzen hat wahlfreien Zugriff auf einen kleinen Bereich von typischerweise 16 kiB lokalen Speicher. Jede Gruppe hat ihren eigenen Bereich, auf den jeweils nur die Mitglieder zugreifen können.
- privater Speicher (private memory): Dieser Speicher ist einer Kernelinstanz vorbehalten. Andere Kernelinstanzen und das Leitprogramm können nicht auf den Inhalt dieses Speichers zugreifen.
OpenCL C
BearbeitenDie Sprache OpenCL C basiert auf der Syntax von ISO C99, erweitert um zusätzliche Datentypen und Funktionen zur parallelen Verarbeitung, wurde an anderer Stelle aber auch eingeschränkt (siehe unten). Es handelt sich somit nicht um eine Obermenge von C, dennoch haben beide Sprachen viele Gemeinsamkeiten.
Ergänzend zu den C99-Datentypen unterstützt OpenCL C folgende Datentypen:
- half: 16 Bit Gleitkommazahlen nach IEEE 754r.
- Vektordatentypen: Die Datentypen char, uchar, short, ushort, int, uint, long, ulong und float gibt es als Vektoren mit 2, 4, 8 und 16 Elementen. Die Elementanzahl wird hierbei an den Namen der Datentypen angehängt, also z. B.: uchar4, float8 oder int16. Mit OpenCL 1.1 wurden zusätzlich drei-elementige Vektoren eingeführt.
- image2d_t: Ein zweidimensionales Bild.
- image3d_t: Ein dreidimensionales Bild.
- sampler_t: Ein sampler, der definiert, wie ein Bild abgetastet wird.
- event_t: Ein Ereignisbehandler.
Folgende Datentypen wurden zudem für spätere Versionen von OpenCL reserviert:
- booln: Ein Vektor mit Wahrheitswerten.
- double, doublen: 64-Bit-Gleitkommazahlen und -vektoren. Eine Erweiterung für double existiert bereits, deren Unterstützung ist aber bei OpenCL 1.0 nicht erforderlich.
- halfn: Ein Vektor mit 16-Bit-Gleitkommazahlen.
- quad, quadn: 128-Bit-Gleitkommazahlen.
- complex {half | float | double | quad}: Komplexe Zahlen mit unterschiedlicher Genauigkeit.
- complex {half | float | double | quad}n: Vektoren komplexer Zahlen mit unterschiedlicher Genauigkeit.
- imaginary {half | float | double | quad}: Imaginäre Zahlen mit unterschiedlicher Genauigkeit.
- imaginary {half | float | double | quad}n: Vektoren imaginärer Zahlen mit unterschiedlicher Genauigkeit.
- {float | double}nxm: nxm Matrizen mit 32 oder 64 Bit Genauigkeit.
- long double, long doublen: Gleitkommazahlen und -vektoren mit mindestens der Genauigkeit von double und maximal der Genauigkeit von quad.
- long long, long longn: Vorzeichenbehaftete 128-Bit-Ganzzahlen und -vektoren.
- unsigned long long, unsigned long longn: Vorzeichenlose 128-Bit-Ganzzahlen und -vektoren.
Arithmetische Operationen (+, -, *, /, %, ++, --
), Vergleichsoperationen (>, >=, ==, !=, <= <
), Bitoperatoren (&, |, ^, ~
) sowie logische Operatoren (&&, ||
) sind sowohl für skalare Datentypen definiert als auch für Vektoren. Werden sie auf Vektoren angewendet, so wird die Operation komponentenweise durchgeführt. Hier verhält sich OpenCL analog zu bekannten Shadersprachen wie zum Beispiel GLSL.
Ebenfalls den Shader-Sprachen entlehnt sind eine Reihe mathematischer Funktionen, die ebenfalls komponentenweise durchgeführt werden, beispielsweise Sinus, Cosinus, Wurzel, Minimum, Maximum etc.
Gegenüber C ist OpenCL C unter anderem in folgenden Punkten eingeschränkt:
- Es gibt keine Funktionszeiger
- Rekursion ist nicht möglich.
- Felder („arrays“) dürfen keine variable Länge haben.
Nutzung von OpenGL- und DirectX-Objekten
BearbeitenOpenCL kann direkt auf Objekte von OpenGL oder DirectX (nur unter Windows) zugreifen, etwa auf Texturen. Somit kann OpenCL genutzt werden, um beispielsweise Texturen zu ändern, ohne die Daten umkopieren zu müssen.
Erweiterungen
BearbeitenWie OpenGL kann auch OpenCL durch herstellerspezifische Erweiterungen um zusätzliche Funktionen ergänzt werden. Beispiele für bereits definierte Erweiterungen sind:
- Gleitkommazahlen mit doppelter Genauigkeit (64-Bit-Gleitkommazahlen, cl_khr_fp64).
- Vektoren von Gleitkommazahlen mit halber Genauigkeit (16-Bit-Gleitkommazahlen, cl_khr_fp16).
- Die Art des Rundens bei Gleitkommaoperationen zu definieren (cl_khr_select_fprounding_mode).
- Schreiben in 3D-Bilder (cl_khr_3d_image_writes).
Versionsgeschichte
BearbeitenOpenCL wurde ursprünglich von der Firma Apple entwickelt.
In Zusammenarbeit mit den Firmen AMD, IBM, Intel und Nvidia wurde der erste Entwurf ausgearbeitet und schließlich von Apple bei der Khronos Group zur Standardisierung eingereicht.[2] Die Spezifikation für OpenCL 1.0 wurde am 8. Dezember 2008 veröffentlicht.[3][4] Es folgte 1.1 im Juni 2010.[5][6] Am 16. November 2011 folgte die Spezifikation 1.2 mit Verbesserungen, die zu 1.0 abwärtskompatibel bleibt.[7][8] Zwei Jahre später, am 18. November 2013, wurde dann die OpenCL-2.0-Spezifikation eingeführt.[9][10]
OpenCL 1.0 wurde erstmals am 28. August 2009 von Apple mit dem Betriebssystem Mac OS X Snow Leopard 10.6 auf den Markt gebracht, die dazugehörigen Programme („Kernel“) können zur Laufzeit auf verschiedene vorhandene OpenCL-fähige Geräte verteilt werden. Derzeit wird abhängig von der Hardware nur OpenCL 1.0 bis 1.2 von Apple unterstützt.[11][12] Weiterer Hauptunterstützer ist AMD mit vorherigem AtiStream in Konkurrenz zu Nvidia mit CUDA.[13] Trotz seiner primären Unterstützung von CUDA unterstützt Nvidia wegen der Nachfrage der Nutzer auch OpenCL 1.2, später mit einigen Elementen aus 2.0 und nun 2021 auch 3.0.[14]
Mit OpenCL 2.0 kompatible Hardware unterstützt mit aktualisierten Treibern auch die höheren Versionen 2.1 und 2.2 laut Khronos-Group.[15]
OpenCL 2.1 wurde im November 2015 offiziell freigegeben.[16] Eine entscheidende Neuerung in OpenCL 2.1 ist die Integration von SPIR-V, dem SPIR-Nachfolger (Standard Portable Intermediate Representation). SPIR-V ist eine Zwischensprache mit nativer Unterstützung für Grafik-Shader und Prozessor-Kernels. Sie ermöglicht die Aufteilung der Compiler-Kette auf die unterschiedlichen Recheneinheiten. Somit können High-Level-Sprachen über SPIR-V die heterogene Architektur ansprechen, ohne sich selbst um die Übersetzung auf die unterschiedlichen Hardware-Komponenten zu kümmern. SPIR-V wird außer in OpenCL auch in der Vulkan-Grafik-API genutzt.[17][18]
OpenCL 2.2 wurde offiziell freigegeben im Mai 2017.[19][20] Als wichtigste Änderung nennt die Bekanntmachung die Integration der OpenCL C++ Kernel Language in OpenCL, was unter anderem beim Schreiben parallel arbeitender Programme helfen soll. Die im Rahmen der Open Computing Language als statische Untermenge des C++14-Standards definierte Kernel-Sprache enthält Klassen, Templates, Lambda-Ausdrücke und andere Konstrukte. Im Mai 2018 erschien ein „maintenance update“ mit Fehlerkorrekturen und Aktualisierungen in den Headern von Spir-V.[21][22][23]
In Zukunft soll OpenCL mit Vulkan so weit wie möglich verschmelzen und so noch breitere Unterstützung gewinnen.[24][25] Dies wurde mit dem Premiere Rush von Apple gezeigt, der den Open Source Compiler clspv[26] benutzt, um einen großen Teil des OpenCL C Kernel Codes für eine Vulkan-Umgebung auf Android-Geräten zu kompilieren.[27] Zuletzt wurde nun OpenCL Next für 2019 angekündigt mit neuen Informationen und dabei auch betont, dass die „roadmap“ von OpenCL von der von Vulkan unabhängig ist, also beide Projekte nicht völlig fusionieren werden.[28]
Am 27. April 2020 wurde OpenCL 3.0 (provisional) veröffentlicht.[29] Der Status Final wurde am 30. September 2020 erreicht.[30][31]
Auf der IWOCL 2021 wurde Version 3.0.7 mit einigen optionalen Erweiterungen angekündigt.[32]
Implementierungen
BearbeitenOpenCL kann für beliebige Betriebssysteme und Hardwareplattformen – genau wie OpenGL und OpenAL – implementiert werden. So ist in der Spezifikation von CPUs, GPUs, DSPs und dem Cell-Prozessor die Rede. Es existiert zudem eine Spezifikation für eingebettete Systeme mit reduzierten Anforderungen.
Aktuelle Implementierungen, in der Regel Open Source (mit Ausnahme von Nvidia):
- AMD ROCm: Im Rahmen der Initiative OpenCompute hat AMD in Zusammenarbeit mit der Open-Source-Gemeinschaft das Projekt ROCm gestartet. ROCm läuft ab Grafikkarten der Generation GCN 3 und CPUs mit PCI Express 3.0 (AMD Ryzen oder Intel Haswell). Der Funktionsumfang von OpenCL 2.2 wird unterstützt[33][34] wobei auch Image-Support enthalten ist. Dadurch läuft mit ROCm ab Version 3.7 auch Software wie Darktable oder LuxCoreRender 2.5 ohne zusätzliche Dateien von AMDGPU.[35] Seit der Version 1.8 werden experimentell auch Prozessoren mit PCIe 2.0 mit AMD GCN 3-Grafikkarten bei geringerer Rechenleistung unterstützt. ROCm-Version 2.4 hat einige Leistungsverbesserungen und Unterstützung für TensorFlow 2.0.[36] Version 2.5 unterstützt die Thrust-Bibliothek mit rocThrust.[37] Aktuell ist die Version 5.5.1. Diese unterstützt jedoch nur noch GCN gfx9, CDNA und RDNA hardware. Ältere Hardware muss auf vorherige ROCM-Versionen zurückgreifen oder zukünftig auf RustiCL.[38]
- Clover (GalliumCompute): Mit Clover[39] ist seit Mitte 2011 eine unter der GPL stehende Implementierung für Linux in der Entwicklung, die ebenfalls auf LLVM aufsetzt und eine CPU oder – indirekt über Mesa 3D – eine Grafikkarte nutzen soll. Clover wurde in das Mesa-Projekt integriert und ist Teil von GalliumCompute.[40] Einige Tests für OpenCL 1.0 bis 1.2 werden damit noch nicht bestanden. Mit dem Wechsel von TGSI auf NIR wird OpenCL in Mesa wieder stärker entwickelt, um mit Open-Source-Treibern für Grafikkarten von AMD (mit RadeonSI und R600) und nVidia (mit Nouveau) nutzbar zu sein. Weiterhin fehlt der Image-Support in den verschiedenen Stufen von OpenCL.[41] Mit der Entwicklung und Ablösung durch RustiCL wird der Support bald enden.
- Intel NEO (Compute Runtime): Unter dem Codenamen NEO wurde ein neuer Open-Source-Treiber für Hardware ab Skylake entwickelt mit OpenCL 2.1-Unterstützung (neu auch ab Broadwell).[42] OpenCL 2.2 soll in „Compute Runtime“ zeitnah folgen.[43] OpenCL 3.0 (OpenCL 1.2 mit OpenCL 2.x-Komponenten) ist seit 2020 und nun ab Broadwell (Gen 8) bis Gen 12 aktuell verfügbar.[44]
- Nvidia: Nvidia bietet eine OpenCL-Implementierung für seine GPGPU-Schnittstelle CUDA unter Linux, Windows und macOS an.[45] Diese Implementierung ist nicht Open Source, weshalb sie in gängigen Linux-Distributionen nicht enthalten ist. Die Generation der Tesla-Chips G80 und GT200 (Nvidia Tesla) unterstützt OpenCL 1.1 mit aktuellen Treibern ab Version 341.95.[46] Fermi unterstützt OpenCL 1.1. Maximal wird OpenCL 1.2 (mit den Chips der Kepler- und Maxwell-GPU) unterstützt. Auch die neue Pascal-GPU unterstützt mit den bisherigen Treibern der 370er-Reihe nur OpenCL 1.2, sowohl in der GeForce-10-Reihe als auch der Quadro- und Tesla-Serie. Mit der Treiber-Version 378.66 wird erstmals OpenCL 2.0 als Beta in wichtigen Funktionen unterstützt.[47] Seit 2021 wird 3.0 ab Kepler mit aktuellen Treibern unterstützt. Optionale Elemente aus 2.x werden wie bisher nur teilweise unterstützt.[48] Nvidia erweitert die Interaktion von Vulkan zu openCL 3.0 mit Treiberversion 510+ mit Erweiterungen für semaphores und gemeinsame Speichernutzung.[49]
- POCL: Portable OpenCL (OpenCL 1.2, OpenCL 2.0 überwiegend),[50] in der Version 1.0 mit experimentellem Nvidia Cuda Backend für die Nutzung von Nvidia GPUs. Damit ist Open Source OpenCL auf Nvidia-Hardware möglich mit erheblich mehr Möglichkeiten als bei Mesa.[51][52][53] Die Leistung ist durch fehlende Optimierung und Software teilweise schwach mit Faktor 1:5 bis 1:10 zur AMD-Windows-Implementierung: mit POCL 1.1 wird sie zum Teil stark verbessert und SPIR mit SPIR-V experimentell unterstützt.[54] Mit Version 1.2 wird HWOC 2.0 sowie nun OpenCL 1.2 vollständig unterstützt.[55][56][57][58] Mit Version 1.3 wird macOS unterstützt.[59] Version 1.4 unterstützt mehr SPIR und SPIR-V.[60] Version 1.5 unterstützt neu auch LLVM 10.0.[61] Version 1.6 zeigt große Fortschritte in der Emulation von OpenCL mit CUDA. Es ist ähnlich schnell wie der Nvidia Treiber. Dazu wird wieder Power PC 8/9 Hardware und LLVM 11 unterstützt. Das Packaging ist nun flexibler.[62] POCL ist mit manueller Optimierung auf demselben Niveau wie Intel compute runtime.[63] POCL 1.7 unterstützt nun auch Clang/LLVM 12 und erste OpenCL-3.0-Funktionen wurden implementiert.[64] POCL 1.8 ist seit Dezember 2021 verfügbar mit Clang/LLVM 13.[65] Version 3.0 implementiert OpenCL 3.0 auf minimalen Status und LLVM/Clang 14.[66][67] POCL 4.0 unterstützt als Highlight nun auch Intel ONE API Level Zero. Dazu wurde die Unterstützung von Spir-V ausgebaut und fp16 wird nun unterstützt.[68]
- RustiCL (OpenCL für Galliumcompute): RustiCL implementiert OpenCL 3.0 in Rust, und ist seit Mesa 22.3 verfügbar. Rust hat hier als Programmiersprache Vorteile in der Wartung des Codes und Vermeidung von Fehlern gegenüber C.[69] Durch den vorhandenen (optionalen) Image-Support unterstützt RustiCL im Unterschied zu Clover zum Beispiel das Programm Darktable.[70] Hardware für AMD GCN GPUs und Intel Gen8+ wird zuerst unterstützt. Dazu kommen llvmpipe in Software und Nvidia Fermi und jünger sowie ARM Panfrost. Intel Gen 12 Xe erreicht schon volle OpenCL 3.0 inklusive OpenCL 1.2 in den Khronos-Tests.[71][72] Double Precision FP64 und FP16 für KI sind in 23.2-dev experimentell verfügbar für numerische Simulationen. AMD R600 wird experimentell unterstützt in Mesa 23.3-dev. Mesamatrix zeigt den aktuellen Stand der Entwicklung auch für Clover.
- Shamrock: Ein Ableger von Clover für Android ARM V7+ ist Shamrock.[73][74] OpenCL 1.2 wird voll unterstützt. Der Khronos-Test wurde mit der „OpenCL 2.0 Samples Suite“ für die Beispiele bis 1.2 zuletzt bestanden.
- triSYCL: Freie OpenCL-2.2-Implementierung mit SYCL. Status: geringe Entwicklung, nicht komplett[75]
Eine Liste zertifizierter Produkte liegt bei Khronos vor.[76]
Diese müssen wie die Implementierungen die Tests der Khronos Conformance Test Suite (CTS) bestehen.[77]
Veraltete Implementierungen
- AMD: Die OpenCL-Implementierung von AMD ermöglicht die Nutzung von GPUs über ihre GPGPU-Schnittstelle ATI-Stream und von CPUs mit SSE3 für Linux und Windows.[78] Grafikkarten der Generationen GCN 4 (RX 400 / RX 500) sowie GCN 5 (Vega) unterstützen OpenCL 2.0 vollständig.[79] Dies gilt auch für die Grafikkarten der älteren Generationen GCN 2 und GCN 3. Die veralteten Architekturen GCN 1 sowie Terascale 2 unterstützen OpenCL 1.2. Ab der R700-Baureihe wurde OpenCL 1.1 unterstützt. Unter Windows wird ab dem Treiber 19.1.1 auch OpenCL 2.1 unterstützt. Unklar ist hier, welche Hardware hiervon profitieren kann. Vega-Chips können aktuell nur bis OpenCL 2.0 agieren.[80] OpenCL 3.0 wird für alle GCN und RDNA-Karten unterstützt. Die optionalen Elemente von OpenCL 2.x werden dabei unterschiedlich unterstützt werden wie bisher abhängig von Hardware und System.
- ARM: Weitere Implementierungen für GPUs kommen von ARM,[81] Intel,[82] S3[83] und VIA.[84]
- IBM: IBM bietet eine Implementierung für die Power-Architektur und die Cell Broadband Engine an.[85]
- Intel Beignet: Intel hat für Linux und Android das Open-Source-Projekt „Beignet“ aufgesetzt.[86][87] Zuletzt wurde im November 2016 nach der schon längeren Unterstützung von OpenCL 1.2 (ab Ivy Bridge) die Unterstützung von OpenCL 2.0 angekündigt.[88] Aktuell ist Version 1.3.2 mit optionalem OpenCL 2.0 mit Optimierungsbedarf.
- Intel OpenCL SDK: kommerzielles SDK von Intel, (OpenCL 2.0 für GPU und 2.1 für CPU ab Gen7).[89][90][91][92]
- Kallaballa Compute Runtime: Das ist ein ehemaliger inoffizieller Fork der Intel Neo (Compute Runtime), welcher die Nutzung von OpenGL-Objekten unter Linux mit Intels iGPUs mithilfe der cl_khr_gl_sharing OpenCL-Erweiterung ermöglicht. Dabei zielte das Projekt darauf ab, möglichst kompatibel zum offiziellen Treiber zu bleiben.[93] Der Prototyp wurde von Jacek Danecki (Intel) verfasst, aber auf Entscheidung Intels fallen gelassen.[94] Amir Hassan griff den Prototypen im September 2022 auf und stellte ihn weitgehend fertig. Das erste Release erfolgte am 29. Oktober 2022.[93] Intel wurde aufmerksam auf den Fork und dieser wurde mit wenigen Anpassungen am 20. März 2023 in das offizielle Projekt rückgeführt.[95] Am 17. Mai 2023 wurde die Erweiterung des implementierten Fork offiziell als Bestandteil der Intel Neo (Compute Runtime) veröffentlicht und der inoffizielle Fork war damit nicht mehr nötig.[96] Als Folge kam es zu mehreren Verbesserungen durch die Open Source Community.[97]
Anwendungssoftware
BearbeitenViele rechenintensive Programme nutzen OpenCL zur Beschleunigung:[98]
Grafikprogramme
Bearbeiten- GIMP ab Version 2.8[99][100][101][102]
- Adobe Photoshop Creative Suite[103][104]
- ImageMagick[105][106]
- PhotoScan[107][108]
- darktable[109][110][111][112]
- Blurate[113]
- MVTec HALCON[114]
- Musemage[115]
- FAST: Bildverarbeitung für Medizinanwendungen[116][117]
- KLMeansCL: Entrauscher-Plugin für AVISynth[118]
- UFO: Bildverarbeitung von Synchrotron-Spuren[119]
3D-Renderer
Bearbeiten- Autodesk Maya[120]
- Blender[121][122] Von den Entwicklern von Blender wird der aktuelle Status von OpenCL als “stalled” mit ärgerlichen Fehlern und zu uneinheitlicher Implementierung der aktuell unterstützten GPUs von AMD und Intel eingestuft und die Unterstützung von OpenCL in der Blender Version 3.0 entfernt. Version 2.93 LTS wird damit als letzte OpenCL unterstützen.[123]
- LuxCoreRender[124]
- Houdini (Software)
- mandelbulber: Software für das Rendern von 3D-Fraktalen
Audio
Bearbeiten- CUETools: Mit dem CUERipper von den CUETools können die FLAC-Dateien besonders schnell mit der Funktion FLACCL von WAV-Format in FLAC konvertiert werden mit der Nutzung von OpenCL in den modernen Grafikkarten.[125] Dabei sind Beschleunigungen von Faktor 10 bis 100 für diesen Teil des Rip-Prozesses möglich, abhängig von schnellen Grafikkarten und SSD-Datenspeichern gegenüber normaler CPU und Festplatte.
- CN24: semantisches Analysewerkzeug[126]
Video
Bearbeiten- HandBrake[127]
- FFmpeg[128]
- Final Cut Pro X[129]
- RealFlow Hybrido2[130]
- Sony Catalyst family[131]
- MAGIX Vegas (vorher Sony Vegas)[132][133][134]
- AlchemistXF[135]
- vReveal von MotionDSP[136][137]
- Total Media Theater (TMT) von ArcSoft[138]
- C4D
Simulation
Bearbeiten- Advanced Simulation Library[139]
- SecondSpace OpenCL-Programm zur Simulation von Wellen im 2D-Raum.
- PATRIC Particle-in-cell-Code[140]
- Bullet: GPU rigid body simulation using OpenCL[141][142]
- Monte-Carlo Simulation on AM57x[143]
- Intel Demo Real-Time Shallow Water Simulation[144][145]
- Intel Code Samples[146]
- GROMACS molekulare Simulationen ab Version 5.1[147][148] Ab Version 2021 wird OpenCL hier als deprecated eingestuft und zukünftig durch SYCL ersetzt.[149]
- FEM: SIEMENS NX Nastran 9.1+ und Simulia Abaqus 6.11+[150][151][152][153]
- Neuronale Netze: clgen: Deep Learning Program Generator[154]
- Neuronale Netze: nengo_ocl Gehirn-Simulationen mit Nengo[155]
- Entschlüsselung: JohnTheRipper[156]
Web
BearbeitenBibliotheken
Bearbeiten- ACL: AMD Compute Libraries[159]
- clBLAS: complete set of BLAS level 1, 2 & 3 routines[160] weiteres in BLAS
- clSparse:[161] Routinen für schwachbesetzte Matrizen
- clFFT:[162] schnelle Fourier-Transformation
- clRNG:[163] Zufallszahlengeneratoren MRG31k3p, MRG32k3a, LFSR113 und Philox-4×32-10
- AMGCL: AMG algebraischer Multi-Grid Solver[164]
- ArrayFire: is for parallel computing with an easy-to-use API with JIT-Compiler (Open Source)[165]
- Bolt: STL compatible library for creating accelerated data parallel applications[166]
- Boost.Compute: GPU/Parallel C++ Library für OpenCL[167]
- Chlorine: C++11 Bibliothek zum einfachen Nutzen von OpenCL 1.2+[168]
- CLBlast: getuntes clBlas[169]
- clMAGMA: OpenCL port of the MAGMA project, a linear algebra library similar to LAPACK but for Multicore+GPU Systems[170][171]
- DeepCL: Bibliothek für neurales Training[172]
- GEGL-OpenCL: Gimp GEGL mit OpenCL[173]
- GpyFFT: Python Wrapper for FFT mit clFFT[174]
- MOT: Maastricht Optimization Toolbox[175]
- Neanderthal: BLAS und LAPACK Implementierung für Clojure[176]
- Netlib BLAS[177] mehr in BLAS
- OpenCLGA: genetische Algorithmen mit PYOpenCL[178]
- PARALUTION[179]
- random123: Kollektion von Zufallszahlengeneratoren (counter-based random number generators (CBRNGs))[180]
- VexCL: vector expression template library (MIT-Lizenz)[181]
- ViennaCL: freie Open-Source Linear Algebra Bibliothek der TU Wien[182]
- HIP: Open Source C++ Toolkit für OpenCL und Cuda[183]
- Projekt Coriander: Konvertierung von CUDA in OpenCL 1.2 mit CUDA-on-CL[184][185]
- Projekt TF-Coriander: Tensorflow mit OpenCL 1.2[186]
Sprachenkopplung
BearbeitenWeblinks
Bearbeiten- OpenCL. Khronos Group – Offizielle Webseite (englisch).
- OpenCL. AMD (englisch).
- OpenCL. Intel (englisch).
- OpenCL. Nvidia (englisch).
- OpenCL. Texas Instruments (englisch).
- Portable OpenCL POC.
Tutorials
- OpenCL. In: informatik.uni-erlangen.de. Universität Erlangen, archiviert vom (nicht mehr online verfügbar) am 4. März 2016; abgerufen am 6. Januar 2019.
Einzelnachweise
Bearbeiten- ↑ The OpenCL Specification.
- ↑ Khronos OpenCL API Registry Spezifikation und Headerdateien (englisch)
- ↑ developer.amd.com (PDF)
- ↑ khronos.org (PDF; 1,1 MB)
- ↑ khronos.org (PDF; 2,8 MB)
- ↑ khronos.org (PDF; 0,8 MB)
- ↑ khronos.org (PDF; 2,8 MB)
- ↑ khronos.org (PDF; 1 MB)
- ↑ khronos.org (PDF; 2,5 MB)
- ↑ khronos.org (PDF; 1 MB)
- ↑ OpenCL im Mac. Heise, 2014.
- ↑ OpenCL auf dem Mac-Rechnern. Apple-Support; nur OpenCL 1.0 bis 1.2 auf den macOS-Rechnern, kein OpenCL 2.x (Stand April 2016)
- ↑ developer.amd.com (PDF)
- ↑ developer.download.nvidia.com (PDF; 1,5 MB)
- ↑ Khronos OpenCL Overview 2.1. (PDF; 0,7 MB) Überblick von OpenCL 2.1 (englisch).
- ↑ Rainald Menge-So: Khronos aktualisiert Spezifikationen für OpenCL 2.1 und SPIR-V 1.0. In: heise.de. 17. November 2015, abgerufen am 3. Februar 2024.
- ↑ khronos.org (PDF; 2,7 MB)
- ↑ khronos.org (PDF; 1,1 MB)
- ↑ Julia Schmidt: Khronos veröffentlicht vorläufige Spezifikation für OpenCL 2.2. In: heise.de. 19. April 2016, abgerufen am 3. Februar 2024.
- ↑ khronos.org
- ↑ khronos.org
- ↑ khronos.org (PDF; 3,5 MB)
- ↑ khronos.org (PDF; 1,4 MB)
- ↑ pcper.com
- ↑ phoronix.com
- ↑ github.com
- ↑ Vulkan Update SIGGRAPH 2019. (PDF) S. 24, abgerufen am 18. Mai 2020 (englisch).
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ khronos.org (PDF; 2 MB)
- ↑ khronos.org (PDF; 1,1 MB)
- ↑ iwocl.org (PDF)
- ↑ github.com
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ Michael Larabel: Radeon ROCm 2.4 Released With TensorFlow 2.0 Compatibility, Infinity Fabric Support. In: Phoronix. 8. Mai 2019, abgerufen am 8. Mai 2019 (englisch).
- ↑ phoronix.com
- ↑ ROCm 5.x-Versionen im AMD Documentation-Portal. In: docs.amd.com. AMD, abgerufen am 1. Dezember 2022 (englisch).
- ↑ Website des Clover-Projekts, Blog des Clover-Entwicklers
- ↑ x.org (PDF; 0,1 MB)
- ↑ mesamatrix.net
- ↑ github.com
- ↑ Michael Larabel: Intel Open-Sources LLVM Graphics Compiler, Compute Runtime With OpenCL 2.1+. phrononix, 16. Februar 2018, abgerufen am 22. April 2018.
- ↑ github.com
- ↑ Nvidia zu OpenCL (28. September 2009)
- ↑ de.download.nvidia.com (PDF; 2,2 MB)
- ↑ streamcomputing.eu
- ↑ geeks3d.com
- ↑ developer.nvidia.com
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ phoronix.com
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ iwocl.org (PDF)
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ portablecl.org
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ s3.amazonaws.com/connect.linaro.org ( des vom 26. Juli 2020 im Internet Archive; PDF) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.
- ↑ git.linaro.org
- ↑ github.com
- ↑ khronos.org
- ↑ github.com
- ↑ AMD zu ATI Stream und OpenCL ( vom 9. August 2009 im Internet Archive) (1. Oktober 2009)
- ↑ amd.com
- ↑ geeks3d.com
- ↑ ARM Introduces New Graphics Processor with OpenCL Support. ( vom 14. November 2010 im Internet Archive) 10. Oktober 2010
- ↑ Intel springt mit „Sandy Bridge“ auf den OpenCL-Zug auf. 13. August 2010
- ↑ S3 Graphics launched the Chrome 5400E embedded graphics processor. ( des vom 2. Dezember 2009 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. 27. Oktober 2009
- ↑ VIA Brings Enhanced VN1000 Graphics Processor. ( vom 15. Dezember 2009 im Internet Archive) 10. Dezember 2009
- ↑ OpenCL Development Kit for Linux on Power ( des vom 9. August 2011 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. (30. Oktober 2009)
- ↑ freedesktop.org
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ software.intel.com
- ↑ software.intel.com
- ↑ software.intel.com
- ↑ a b github.com
- ↑ Need cl_khr_gl_sharing · Issue #166 · intel/compute-runtime. Abgerufen am 4. Januar 2025 (englisch).
- ↑ feature: add experimental support for cl-gl sharing on Linux · intel/compute-runtime@4919c7c. Abgerufen am 4. Januar 2025 (englisch).
- ↑ Release 23.13.26032.30 · intel/compute-runtime. Abgerufen am 4. Januar 2025 (englisch).
- ↑ CL/GL sharing support more texture formats · Issue #667 · intel/compute-runtime. Abgerufen am 4. Januar 2025 (englisch).
- ↑ amd.com
- ↑ khronos.org
- ↑ tomshardware.de
- ↑ phoronix.com
- ↑ wiki.gimp.org
- ↑ amd.com
- ↑ tomshardware.de
- ↑ ImageMagick: Architecture. Abgerufen am 7. August 2015.
- ↑ imagemagick.org
- ↑ agisoft.com
- ↑ cgpress.org
- ↑ darktable.org
- ↑ darktable.org ( vom 2. Mai 2016 im Internet Archive)
- ↑ phoronix.com
- ↑ phoronix.com
- ↑ blurate.com
- ↑ halcon.com
- ↑ tomshardware.de
- ↑ github.com
- ↑ iwocl.org (PDF)
- ↑ github.com
- ↑ ufo-core.readthedocs.io
- ↑ semiaccurate.com
- ↑ streamcomputing.eu
- ↑ developer.amd.com
- ↑ Mark Mantel: Blender 3: Künftige Cycles-X-Engine des Open-Source-Renderers ohne OpenCL. In: heise.de. 3. Mai 2021, abgerufen am 3. Februar 2024.
- ↑ wiki.luxcorerender.org
- ↑ Vergleich Konvertierung mit CPU Core i7 und verschiedenen GPU mit FLACCL
- ↑ github.com
- ↑ handbrake.fr
- ↑ FFmpeg mit OpenCL. Heise.de
- ↑ support.apple.com
- ↑ streamcomputing.eu
- ↑ streamcomputing.eu
- ↑ streamcomputing.eu
- ↑ sonycreativesoftware.com
- ↑ vegascreativesoftware.com
- ↑ s-a-m.com
- ↑ tomshardware.com
- ↑ tomshardware.de
- ↑ tomshardware.de
- ↑ asl.org.il
- ↑ web-docs.gsi.de (PDF; 3,4 MB)
- ↑ multithreadingandvfx.org (PDF; 2,3 MB)
- ↑ bulletphysics.org
- ↑ ti.com (PDF; 1,8 MB)
- ↑ khronos.org (PDF; 3,2 MB)
- ↑ software.intel.com
- ↑ software.intel.com
- ↑ manual.gromacs.org
- ↑ github.com
- ↑ iwocl.org (PDF)
- ↑ cadplace.de
- ↑ amd.com (PDF)
- ↑ amd.com (PDF)
- ↑ community.plm.automation.siemens.com ( vom 14. Oktober 2016 im Internet Archive; PDF)
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ Frederic Lardinois: WebCL Will Soon Let Web Developers Harness The Power Of Multi-Core GPUs And CPUs From The Browser. In: techcrunch.com. 19. März 2014, abgerufen am 10. März 2024 (englisch).
- ↑ Frederic Lardinois: WebCL Will Soon Let Web Developers Harness The Power Of Multi-Core GPUs And CPUs From The Browser. In: techcrunch.com. 19. März 2014, abgerufen am 10. März 2024 (englisch).
- ↑ developer.amd.com ( vom 16. November 2016 im Internet Archive)
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ arrayfire.com
- ↑ developer.amd.com ( vom 16. März 2015 im Internet Archive)
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ icl.cs.utk.edu
- ↑ icl.utk.edu ( vom 29. April 2016 im Internet Archive)
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ netlib.org
- ↑ github.com
- ↑ paralution.com
- ↑ thesalmons.org
- ↑ github.com
- ↑ viennacl.sourceforge.net
- ↑ github.com
- ↑ phoronix.com
- ↑ iwocl.org (PDF)
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com
- ↑ github.com