EN
Carreiras

Data Scientist Júnior

Data Scientist Júnior

Remoto

PJ

160

Flexível

O desafio

Atuar diretamente na interface entre dados, produto e negócio, desenvolvendo soluções baseadas em Large Language Models (LLMs), embeddings e técnicas de Machine Learning que viabilizem análises, experimentação e a construção de aplicações de Inteligência Artificial. Colaborar com pessoas mais experientes do time, participando de entregas incrementais — desde a exploração de dados e prototipação até o suporte em integrações e monitoramento em produção — com espaço para crescer em autonomia conforme evolui.


Modalidade de contratação

Pessoa Jurídica, de caráter full time (aproximadamente 160 horas mensais).


Atribuições

  1. Contribuir na construção e manutenção de pipelines de dados, apoiando processos de ingestão, transformação e limpeza sob orientação do time;

  2. Apoiar na modelagem, estruturação e disponibilização de dados para uso em produtos e experimentos, aprendendo boas práticas de consistência e performance;

  3. Participar do desenvolvimento e avaliação de modelos de Machine Learning, com interesse crescente em Large Language Models (LLMs), embeddings e técnicas de recuperação de informação;

  4. Colaborar em protótipos baseados em LLMs (ex.: RAG, classificação, extração, matching semântico), apoiando ciclos de POC, com supervisão de profissionais mais seniores;

  5. Apoiar o monitoramento de soluções em produção, contribuindo na investigação de falhas e aprendendo sobre manutenção e melhoria contínua de sistemas reais;

  6. Documentar experimentos, datasets e decisões técnicas, desenvolvendo o hábito de compartilhamento de conhecimento com o time. 

Know Skills

  1. Familiaridade com Python: capacidade de escrever scripts funcionais, organizar projetos simples e gerenciar ambientes e dependências básicas;

  2. Conforto mínimo com terminal/CLI: conseguir rodar scripts, navegar em diretórios, executar comandos e entender mensagens de erro;

  3. Conhecimento conceitual de LLMs e embeddings: compreender princípios de tokenização, geração de texto, vetorização e similaridade — aplicação prática é um diferencial, não obrigatória;

  4. Exposição a frameworks de GenAI como LangChain ou equivalentes, ainda que em projetos pessoais, tutoriais ou cursos aplicados;

  5. Noções de pipelines de dados (ETL): entender o fluxo básico de ingestão, transformação e entrega de dados;

  6. SQL em nível básico a intermediário: consultas simples, joins e leitura crítica de dados;

  7. Cloud em nível básico: ter ouvido falar de ao menos um provedor (AWS ou Azure) e entender o que é rodar algo na nuvem;

  8. Git: saber commitar, criar branches e abrir PRs — rotina de versionamento básico.

Flex Skills

  1. Organização pessoal e proatividade: conseguir estruturar as próprias tarefas, comunicar andamento e pedir ajuda no momento certo;

  2. Aprendizado rápido e adaptabilidade: absorver tecnologias e abordagens novas com agilidade, ajustando-se ao contexto e às restrições de cada projeto;

  3. Resolutividade: tentar resolver o problema antes de escalar, com disposição para buscar referências, testar hipóteses e aprender com os erros;

  4. Orientação a impacto: ter curiosidade sobre o que o trabalho gera de valor para o cliente e para o produto;

  5. Interesse em ambientes reais: querer entender como soluções funcionam em produção, mesmo que ainda sem experiência direta nesse contexto;

  6. Comunicação: capacidade de se comunicar de forma clara e empática com pares e líderes, fazer boas perguntas e compartilhar o que está aprendendo.

Diferenciais

  • Projetos pessoais, acadêmicos ou de portfólio com dados, ML ou IA — Kaggle, GitHub, TCC ou iniciativas próprias contam;

  • Interesse e familiaridade com LLMs e modelos generativos, incluindo curiosidade sobre avaliação de qualidade e trade-offs de implementação;

  • Experiência com projetos em ambientes de startup ou de crescimento acelerado, com ciclos curtos e mudanças frequentes;

  • Versatilidade e senso de execução: aprender rápido, se adaptar bem ao contexto de cada cliente e entregar com pragmatismo.

Human-centered
ways of working.

© acaso 2025

Human-centered
ways of working.