Carreiras
Remoto
PJ
160
Flexível
O desafio
Atuar diretamente na interface entre dados, produto e negócio, desenvolvendo soluções baseadas em Large Language Models (LLMs), embeddings e técnicas de Machine Learning que viabilizem análises avançadas, experimentação e a construção de aplicações de Inteligência Artificial. Atuar com autonomia, pensamento crítico e abertura ao aprendizado em entregas de complexidade intermediária, conduzindo projetos de ponta a ponta — desde a compreensão do problema, exploração de dados (incluindo consultas em SQL), prototipação e avaliação de modelos, até a integração e monitoramento em produção.
Modalidade de contratação
Pessoa Jurídica, de caráter full time (aproximadamente 160 horas mensais).
Atribuições
Criar e evoluir pipelines de dados, garantindo que a ingestão, transformação e limpeza sejam eficientes;
Modelar, transformar, estruturar e disponibilizar dados para uso em produtos e experimentos, garantindo consistência e performance;
Desenvolver, treinar, adaptar e avaliar modelos de Machine Learning, com ênfase em Large Language Models (LLMs), embeddings e técnicas de recuperação de informação, aplicados a problemas de produto e negócio;
Prototipar soluções baseadas em LLMs (ex.: RAG, classificação, extração, matching semântico) em ciclos rápidos de POC, garantindo que iniciativas aprovadas avancem para soluções robustas e monitoráveis;
Acompanhar e sustentar soluções em produção (monitoramento e investigação de falhas), propondo melhorias contínuas e realizando ajustes em modelos, prompts ou pipelines quando necessário;
Documentar experimentos, decisões técnicas, datasets e fluxos, promovendo padronização e compartilhamento de conhecimento no time.
Know Skills
Ter base sólida de fundamentos e desenvolvimento com Python: escrever código limpo e testável, organizar projetos, lidar com I/O e performance quando necessário, e fazer gestão de ambientes (isolamento por projeto, dependências e versões de bibliotecas);
Ter experiência com bases de computação para o dia a dia: conforto com terminal/CLI, escrita de scripts simples para automações e tarefas recorrentes, e entendimento geral de sistemas operacionais e redes (o suficiente para diagnosticar problemas e operar soluções);
Conhecimento prático de modelos de linguagem e representações semânticas (LLMs e embeddings): princípios de tokenização, geração de texto, vetorização e similaridade, e como esses conceitos se conectam a pipelines e produtos orientados por dados;
Experiência com construção de aplicações e pipelines de GenAI utilizando frameworks como LangChain (ou equivalentes), incluindo padrões como RAG, classificação, extração de informação e matching semântico;
Ter experiência construindo e mantendo pipelines de dados (ETL), com foco em confiabilidade, performance e rastreabilidade;
SQL em nível intermediário: consultas, joins, modelagem lógica e leitura crítica de qualidade/consistência de dados;
Cloud (básico a intermediário): familiaridade com ao menos um provedor (ex.: AWS ou Azure), entendendo serviços comuns e o ciclo de colocar algo para rodar/operar em produção;
Versionamento e colaboração: Git e rotina de trabalho com PRs/code review, testes automatizados e CI/CD.
Flex Skills
Autogestão e autonomia: conduzir entregas e assumir uma postura propositiva no cotidiano da atuação, organizando prioridades, estimando esforços, dando visibilidade de andamento/risco e mantendo constância de entrega, sempre alinhando expectativas com as partes envolvidas e interessadas;
Aprendizado rápido e adaptabilidade: aprender e aplicar novas tecnologias e abordagens com agilidade, se ajustando ao contexto e às restrições de cada projeto, e transitando bem entre dados, destravando entregas end-to-end;
Resolutividade: resolver problemas aliando capacidade de priorização em um ambiente de mudanças rápidas e com foco em soluções a longo prazo, assumindo responsabilidade pelos resultados;
Orientação a impacto: priorizar o que gera valor para o cliente e para a acaso, definindo critérios de sucesso e métricas de acompanhamento;
Mentalidade de produção: conforto em manter e evoluir soluções reais em produção, investigando falhas, monitorando comportamento e atuando em melhorias contínuas;
Comunicação: capacidade de se comunicar de forma clara e empática com pares e líderes, facilitando o aprendizado e elevando o nível do time.
Diferenciais
Experiência prática com IA/ML (projetos profissionais ou pessoais);
Interesse e familiaridade com LLMs (Large Language Models) e modelos generativos, incluindo avaliação de qualidade e trade-offs de implementação;
Experiência com projetos em ambientes de startup ou de crescimento acelerado, com ciclos curtos e mudanças frequentes;
Versatilidade e senso de execução: aprender rápido, se adaptar bem ao contexto de cada cliente e entregar com pragmatismo.