Huawei opent het vuur op Google en Nvidia met twee eigen AI-chips met een universele Da Vinci-architectuur. Beide chips dragen de Ascend-naam en markeren een nieuwe weg die Huawei inslaat om AI-innovatie naar hun hand te zetten.
De nieuwe Ascend AI-chips hebben een universele Da Vinci-architectuur zodat ontwikkelaars maar één keer moeten programmeren over diverse toepassingen. Dang Wenshuan, Chief Strategy Architect bij Huawei: “Da Vinci zorgt voor twee opties: scale-out en scale-in. Zo kunnen ontwikkelaars klein starten en doorgroeien met dezelfde code, of net andersom wanneer je van het grootste scenario naar het kleinste wil schalen. De chips bieden ruimte voor veel geheugen met een minimale latency.”
Ascend 910
Het topproduct is de Huawei Ascend 910. Hiermee willen ze concurreren met de nieuwste TPU’s van Google en de Tesla GPU’s van Nvidia. De chip wordt op 7 nm gebakken (vermoedelijk bij TSMC) en biedt tot 256 teraflops aan rekenkracht voor AI-toepassingen. Huawei vergelijkt in zijn presentatie met de Nvidia Tesla V100 (125 teraflops) en de Google TPU 3.0 (90 teraflops).
Het biedt tevens een Ascend Cluster aan met 1.024 chips aan boord, goed voor 256 petaflops aan rekenkracht en 32 TB HBM. Ter vergelijking: een Google ‘pod’ met TPU 3.0-chips levert tot 100 petaflops. Enig probleem is dat Huawei niet duidelijk maakt waarop het cijfer gebaseerd is. Het is belangrijker om te weten hoe precies de wiskunde is, want brute rekenkracht is niet genoeg. Huawei geeft daarover voorlopig nog geen details. Systemen met de Ascend 910 zijn vanaf Q2 2019 beschikbaar in de hybrid cloud van Huawei.
Ascend 310
Vandaag kondigt Huawei de flexibele Ascend 310 aan. Deze AI-chip wordt op 12 nm gebakken en is vanaf vandaag verkrijgbaar in diverse systemen. Met Ascend 310 mikt Huawei op diverse toepassingen van kleine IoT-apparaten tot datacenters. Voor oortjes, always-on, smartphones en laptops lanceert het respectievelijk de Nano, Tiny, Lite en Mini-versies variërend van 0,02 tot 20 teraflops met een latency van minder dan 10 ms tot 500 ms.
Voor Edge-toepassingen bestaat de Ascend 310 in twee smaken: Mini en Multi-Mini. Die laatste combineert meerdere mini’s in een compacte Edgeserver met prestaties tot 100 teraflops en een verbruik tot 100 watt. De Ascend 310 krijgt ook een cloudvariant, genaamd Max, met 200+ teraflops aan rekenkracht.
Met Ascend 310 wil Huawei chips voor verschillende AI-toepassingen aanbieden. Dankzij verschillende (schaalbare) variaties heb je een minimale kost per scenario. Met een universele architectuur over de verschillende chips hoeft de ontwikkelaar zijn code amper aan te passen. Ascend 310-producten worden in vijf varianten gelanceerd dit jaar met diverse formaten, waaronder een AI-acceleratiekaart met PCI Express-aansluiting.