Tensilica DNA 100 – nowy procesor IP od Cadence

Firma Cadence Design Systems przedstawiła nowy procesor programowy (IP) o nazwie Cadence Tensilica DNA 100. Jest to pierwszy akcelerator głębokiej sieci neuronowej (DNA) do zastosowań AI w postaci procesora IP. Zapewnia on jednocześnie dużą wydajność i sprawność energetyczną w całym zakresie wydajności obliczeniowej od 0,5 operacji TeraMAC (TMAC) do setek TMAC. Dzięki temu procesor DNA 100 nadaje się znakomicie do realizacji wbudowanych systemów wykorzystujących sieci neuronowe. Jego przykładowe zastosowania obejmują autonomiczne pojazdy, systemy wspomagania kierowcy (ADAS), monitoring, robotykę i drony, rzeczywistość rozszerzoną (AR) i wirtualną (VR), smartfony, inteligentne mieszkania i systemy IoT. Procesor DNA 100 zapewnia maksymalnie 4,7 razy wyższą całkowitą wydajność i do 2,3 razy lepszą wydajność w stosunku do poboru mocy w porównaniu z innymi rozwiązaniami o podobnym rozmiarze matryc realizujących operacje MAC.

Sieci neuronowe cechują się rzadkością występowania wag oraz aktywacji, przez co układy MAC w innych procesorach wykonują niepotrzebne operacje ładowania i mnożenia przez zero. Wyspecjalizowany układ obliczeniowy procesora DNA 100 eliminuje obie te czynności, pozwalając wykorzystać rzadkość operacji do zmniejszenia ilości obliczeń i w konsekwencji zwiększenia sprawności energetycznej. Dalsze uczenie sieci neuronowych pozwala dodatkowo zwiększyć rzadkość operacji sieci i uzyskać maksymalną wydajność układu obliczeń rzadkich zastosowanego w procesorze DNA 100. Dzięki temu jest on w stanie uzyskać maksymalną przepustowość przy małym rozmiarze matrycy. Korzystając z nowych układów, sieć w architekturze ResNet 50 w konfiguracji MAC 4K może zapewnić wydajność 2550 ramek na sekundę (fps) i wydajność do 3,4 TMAC/W (dla procesu technologicznego 16 nm).

Procesorowi DNA 100 towarzyszy kompletna platforma programowania AI. Kompatybilność z najnowszą wersją kompilatora Tensilica Neural Network obejmuje obsługę zaawansowanych platform AI, takich jak Caffe, TensorFlow / TensorFlow Lite oraz wielu różnych rodzajów sieci neuronowych, w tym konwolucyjnych i rekurencyjnych sieci neuronowych. Dzięki temu nowy procesor świetnie nadaje się do realizacji wbudowanych funkcji przetwarzania obrazu, mowy, danych pochodzących z radaru lub lidaru oraz systemów komunikacji. Kompilator Tensilica Neural Network wykorzystuje bogaty zestaw funkcji bibliotecznych zoptymalizowanych pod kątem sieci neuronowych, które pozwalają zmapować dowolną sieć neuronową na wykonywalny, silnie zoptymalizowany kod o dużej wydajności. Dzięki temu oprogramowanie dla procesora DNA 100 umożliwia obsługę sieci w różnych zastosowaniach, w tym w klasyfikacji, detekcji obiektów, segmentacji, rekurencji i regresji. Procesor DNA 100 obsługuje również interfejs aplikacji (API) Android Neural Network (ANN) przeznaczony do wnioskowania AI w urządzeniach z systemem Android.

Procesor DNA 100 jest w stanie obsłużyć wszystkie warstwy sieci neuronowej, w tym warstwy konwolucyjne, połączenia każdy-z-każdym, komórki LSTM, LRN oraz warstwy łączące (pooling). Pojedynczy procesor DNA 100 można łatwo skalować od 0,5 do 12 efektywnych układów TMAC. Ponadto wiele procesorów DNA 100 można łączyć, uzyskując setki układów TMAC na potrzeby najbardziej wymagających wbudowanych sieci neuronowych. Procesor DNA 100 zawiera również układ DSP Tensilica, który pozwala obsłużyć dowolną nową warstwę sieci neuronowej nieobsługiwaną przez dotychczasowe moduły sprzętowe procesora. Zapewnia on ponadto rozszerzalność i możliwości programowania rdzenia Tensilica Xtensa za pomocą zestawu instrukcji Tensilica Instruction Extension (TIE). Ponieważ procesor DNA 100 ma swój własny układ DMA, może obsłużyć inny kod sterujący bez potrzeby stosowania osobnego kontrolera.

Procesor DNA 100 będzie dostępny dla wybranych klientów już w grudniu tego roku. Dostępność dla wszystkich odbiorców jest zaplanowana na pierwszy kwartał 2019 roku. Szczegółowe informacje znajdują się na stronie produktu.

O autorze