PT-BR
Carreiras

Data Scientist AI Solutions

Data Scientist AI Solutions

Remoto

PJ

160

Flexível

O desafio

Atuar diretamente na interface entre dados, produto e negócio, desenvolvendo soluções baseadas em Large Language Models (LLMs), embeddings e técnicas de Machine Learning que viabilizem análises avançadas, experimentação e a construção de aplicações de Inteligência Artificial. Atuar com autonomia, pensamento crítico e abertura ao aprendizado em entregas de complexidade intermediária, conduzindo projetos de ponta a ponta — desde a compreensão do problema, exploração de dados (incluindo consultas em SQL), prototipação e avaliação de modelos, até a integração e monitoramento em produção.

Modalidade de contratação

Pessoa Jurídica, de caráter full time (aproximadamente 160 horas mensais).

Atribuições

  1. Criar e evoluir pipelines de dados, garantindo que a ingestão, transformação e limpeza sejam eficientes;

  2. Modelar, transformar, estruturar e disponibilizar dados para uso em produtos e experimentos, garantindo consistência e performance;

  3. Desenvolver, treinar, adaptar e avaliar modelos de Machine Learning, com ênfase em Large Language Models (LLMs), embeddings e técnicas de recuperação de informação, aplicados a problemas de produto e negócio;

  4. Prototipar soluções baseadas em LLMs (ex.: RAG, classificação, extração, matching semântico) em ciclos rápidos de POC, garantindo que iniciativas aprovadas avancem para soluções robustas e monitoráveis;

  5. Acompanhar e sustentar soluções em produção (monitoramento e investigação de falhas), propondo melhorias contínuas e realizando ajustes em modelos, prompts ou pipelines quando necessário;

Documentar experimentos, decisões técnicas, datasets e fluxos, promovendo padronização e compartilhamento de conhecimento no time.

Know Skills

  • Ter base sólida de fundamentos e desenvolvimento com Python: escrever código limpo e testável, organizar projetos, lidar com I/O e performance quando necessário, e fazer gestão de ambientes (isolamento por projeto, dependências e versões de bibliotecas);

  • Ter experiência com bases de computação para o dia a dia: conforto com terminal/CLI, escrita de scripts simples para automações e tarefas recorrentes, e entendimento geral de sistemas operacionais e redes (o suficiente para diagnosticar problemas e operar soluções);

  • Conhecimento prático de modelos de linguagem e representações semânticas (LLMs e embeddings): princípios de tokenização, geração de texto, vetorização e similaridade, e como esses conceitos se conectam a pipelines e produtos orientados por dados;

  • Experiência com construção de aplicações e pipelines de GenAI utilizando frameworks como LangChain (ou equivalentes), incluindo padrões como RAG, classificação, extração de informação e matching semântico;

  • Ter experiência construindo e mantendo pipelines de dados (ETL), com foco em confiabilidade, performance e rastreabilidade;

  • SQL em nível intermediário: consultas, joins, modelagem lógica e leitura crítica de qualidade/consistência de dados;

  • Cloud (básico a intermediário): familiaridade com ao menos um provedor (ex.: AWS ou Azure), entendendo serviços comuns e o ciclo de colocar algo para rodar/operar em produção;

  • Versionamento e colaboração: Git e rotina de trabalho com PRs/code review, testes automatizados e CI/CD.

Flex Skills

  • Autogestão e autonomia: conduzir entregas e assumir uma postura propositiva no cotidiano da atuação, organizando prioridades, estimando esforços, dando visibilidade de andamento/risco e mantendo constância de entrega, sempre alinhando expectativas com as partes envolvidas e interessadas;

  • Aprendizado rápido e adaptabilidade: aprender e aplicar novas tecnologias e abordagens com agilidade, se ajustando ao contexto e às restrições de cada projeto, e transitando bem entre dados, destravando entregas end-to-end;

  • Resolutividade: resolver problemas aliando capacidade de priorização em um ambiente de mudanças rápidas e com foco em soluções a longo prazo, assumindo responsabilidade pelos resultados;

  • Orientação a impacto: priorizar o que gera valor para o cliente e para a acaso, definindo critérios de sucesso e métricas de acompanhamento;

  • Mentalidade de produção: conforto em manter e evoluir soluções reais em produção, investigando falhas, monitorando comportamento e atuando em melhorias contínuas;

  • Comunicação: capacidade de se comunicar de forma clara e empática com pares e líderes, facilitando o aprendizado e elevando o nível do time.

Diferenciais

  • Experiência prática com IA/ML (projetos profissionais ou pessoais);

  • Interesse e familiaridade com LLMs (Large Language Models) e modelos generativos, incluindo avaliação de qualidade e trade-offs de implementação;

  • Experiência com projetos em ambientes de startup ou de crescimento acelerado, com ciclos curtos e mudanças frequentes;

  • Versatilidade e senso de execução: aprender rápido, se adaptar bem ao contexto de cada cliente e entregar com pragmatismo.

Human-centered
ways of working.

© acaso 2025

Human-centered
ways of working.