Engenheiro de Pesquisa em IA (Otimização de Kernel e Inferência)
TetherRemoto
Pleno
Remoto (São Paulo, São Paulo, Brasil)
Candidatar-se →Sobre a vaga
A Tether busca uma pessoa sênior para atuar como Engenheiro de Pesquisa em IA, com foco em otimização de kernels e desempenho de inferência.
Foco técnico
- Otimização de kernels GPU para workloads de IA.
- Inferência em dispositivos móveis e ambientes com restrição de recursos.
- Uso de Metal Shading Language para aceleração em GPU.
- Estratégias de paralelismo, incluindo Tensor Parallelism.
Requisitos
- Experiência sênior em pesquisa ou engenharia de IA aplicada a performance.
- Conhecimento em otimização de inferência e execução eficiente de modelos.
- Vivência com programação de baixo nível para GPU ou kernels de alto desempenho.
Modelo de trabalho
Vaga remota associada a São Paulo, São Paulo, Brasil.