Engenheiro de Pesquisa em IA (Otimização de Kernel e Inferência)

Tether
Remoto Pleno

Remoto (São Paulo, São Paulo, Brasil)

Candidatar-se →

Sobre a vaga

A Tether busca uma pessoa sênior para atuar como Engenheiro de Pesquisa em IA, com foco em otimização de kernels e desempenho de inferência.

Foco técnico

  • Otimização de kernels GPU para workloads de IA.
  • Inferência em dispositivos móveis e ambientes com restrição de recursos.
  • Uso de Metal Shading Language para aceleração em GPU.
  • Estratégias de paralelismo, incluindo Tensor Parallelism.

Requisitos

  • Experiência sênior em pesquisa ou engenharia de IA aplicada a performance.
  • Conhecimento em otimização de inferência e execução eficiente de modelos.
  • Vivência com programação de baixo nível para GPU ou kernels de alto desempenho.

Modelo de trabalho

Vaga remota associada a São Paulo, São Paulo, Brasil.