AI算法部署

工作地点:上海

岗位职责

1、基于自研AI芯片进行相关开发和维护,重点优化大模型及相关算法,特别是在边缘计算设备上的优化实现; 

2、负责大模型在本地推理工程化落地和实现,负责大模型推理加速工作; 

3、协助客户进行大模型的部署,并对客户的需求做出评估和及时回应; 

4、参与自研芯片 model zoo 构建和 onnx op 完备性支持。 

5、深入了解大模型算法与底层硬件的关系,针对系统算力瓶颈和带宽瓶颈,提出具体的算法优化措施及改进方案。

6、参考行业内的大模型性能评估方法,制定自研芯片的大模型的性能评估指标。

岗位要求

1、有芯片级AI算法部署经验,主要部署方向为NPU,GPGPU,5年+ 

2、精通AI软件栈,包括AI框架、分布式训练框架、大模型结构、支撑工具链等,具有丰富的架构设计和开发的经验 ; 

3、较强的c++/python开发和算法工程能力,较强的论文阅读和复现能力; 

4、熟悉轻量化相关模型压缩算法,比如量化,剪枝; 

5、熟悉AI算力相关的知识,包括但不限于XPU芯片(GPU、NPU等)、算力集群、CUDA编程模型、算子等; 

6、良好的沟通协作能力,对技术挑战和业务落地充满激情; 

加分项: 1.有视觉类如图像识别,图像增强(NR,SR,HDR)经验的; 2.有算子定制及模型落地经验的;