AI算法部署

中文

工作地点：上海

1、基于自研AI芯片进行相关开发和维护，重点优化大模型及相关算法，特别是在边缘计算设备上的优化实现；

2、负责大模型在本地推理工程化落地和实现，负责大模型推理加速工作；

3、协助客户进行大模型的部署，并对客户的需求做出评估和及时回应；

4、参与自研芯片 model zoo 构建和 onnx op 完备性支持。

5、深入了解大模型算法与底层硬件的关系，针对系统算力瓶颈和带宽瓶颈，提出具体的算法优化措施及改进方案。

6、参考行业内的大模型性能评估方法，制定自研芯片的大模型的性能评估指标。

1、有芯片级AI算法部署经验，主要部署方向为NPU，GPGPU，5年+

2、精通AI软件栈，包括AI框架、分布式训练框架、大模型结构、支撑工具链等，具有丰富的架构设计和开发的经验；

3、较强的c++/python开发和算法工程能力，较强的论文阅读和复现能力；

4、熟悉轻量化相关模型压缩算法，比如量化，剪枝；

5、熟悉AI算力相关的知识，包括但不限于XPU芯片（GPU、NPU等）、算力集群、CUDA编程模型、算子等；

6、良好的沟通协作能力，对技术挑战和业务落地充满激情；

加分项： 1.有视觉类如图像识别，图像增强（NR，SR，HDR）经验的； 2.有算子定制及模型落地经验的；

上一个下一个