









风华GPU软件栈FTUCA是基于风华GPU硬件特性开发,为深度学习、大模型等AI多场景应用提供的一套高效开发和部署的软件栈,且能将CUDA程序迁移到风华GPU上运行。兼容国内外主流AI框架。

风华GPU兼容国内外主流CPU(Intel、AMD、鲲鹏、飞腾、海光、兆芯、龙芯等)、OS(Ubuntu、OpenEuler、Kylin、Uos、中科方德等),兼容多种开源深度学习框架(Pytorch、vLLM等)和算子

风华GPU软件栈包含调度管理工具、虚拟化工具、调试/调优工具、CUDA迁移工具、开源深度学习开发部署框架、自研模型推理框架、算子加速库、编译器、运行库及驱动等,满足不同类型用户需求,为深度学习开发人员提供了便利

对多种通用AI模型和AI大模型(例如:DeepSeek全系大模型、Qwen系列开源大模型、Llama系列开源大模型、百川系列开源大模型、ChatGLM系列开源大模型)都做了适配,且可以提供定制化优化服务
MobileNetV2
ResNet50
Swin Transformer
Stable Diffusion
MODNet
SCRFD
PP seg v2 lite
DeepLabv3
YOLOv5s-seg
YOLOv7-seg
YOLOv8n-seg
OpenPose
YOLOv5s pose
YOLOv8n-pose
HRNet
TSM
Lite-Mono
Fast-Depth
CSQ
Heq lighting
Hep denoise
LWNet
LungSeg
YOLOv5s-seg
YOLOv7-seg
DeepLabv3
UNet
YOLOv3
YOLOv5s
YOLOv6n
YOLOv7t
ChatGLM2
Llama 2
FastSpeech2 + mb_melgan
WeNet
C3D
PlateDet
Plate rec
PP-OCR
BERT-Base