Pessoa Cientista de Dados Sr (Foco em IA Generativa) - Remoto - 7824
Descrição da vaga
Transformando mercados com tecnologia há mais de 30 anos. Nós impactamos vidas através da Tecnologia.
Fomos pioneiros na digitalização da Justiça brasileira e seguimos expandindo os limites do que é possível com Inteligência Artificial.
Estamos desenvolvendo um produto de alto impacto para a Justiça, que combina IA generativa, segurança de dados e arquitetura escalável para apoiar magistrados e tribunais em decisões mais céleres, consistentes e explicáveis.
É um desafio inédito: aplicar IA de ponta em escala nacional, com rigor técnico, responsabilidade e impacto direto na vida de milhões de cidadãos.
Além da engenharia, buscamos alguém com perfil de evangelização técnica — capaz de documentar entregas e descobertas, apresentar resultados em fóruns internos e externos, compartilhar boas práticas e contribuir para disseminar uma cultura de IA ética, segura e orientada a impacto.
Responsabilidades e atribuições
Você fará parte da equipe que está construindo uma das arquiteturas de IA mais avançadas já aplicadas ao sistema de Justiça.
O projeto combina múltiplas camadas tecnológicas, vetorização semântica, RAG (Retrieval-Augmented Generation), multi-LLMs e pipelines distribuídos, para compreender grandes volumes de dados jurídicos de forma segura e explicável.
O impacto vai além da tecnologia: cada decisão apoiada pela nossa IA pode representar mais eficiência, menos morosidade e mais acesso à Justiça para a sociedade.
É uma jornada que une ciência de dados, engenharia de alta performance e ética no uso da IA, buscando profissionais que queiram atuar na fronteira entre inovação tecnológica e transformação pública.
Como Cientista de Dados com foco em IA Generativa, você será responsável por:
- Definir e evoluir a arquitetura de IA do produto, garantindo escalabilidade, rastreabilidade e explicabilidade.
- Liderar iniciativas com LLMs, embeddings e RAG (Retrieval-Augmented Generation) para geração de soluções seguras e contextualizadas.
- Aplicar fundamentos de estatística, probabilidade e algoritmos de Machine Learning (regressão, classificação, clusterização etc.) em análises e avaliações de performance.
- Orquestrar integrações entre sistemas judiciais, serviços em nuvem e provedores de IA.
- Projetar, implementar e monitorar pipelines envolvendo vector DBs e frameworks de GenAI (LangChain, LlamaIndex, Semantic Kernel, entre outros).
- Criar e refinar engenharia de prompts em cenários complexos e diversos.
- Traduzir resultados técnicos em insights claros e acionáveis, comunicando descobertas e limitações a públicos diversos (técnicos e executivos).
- Documentar experimentos, resultados e boas práticas, promovendo transparência e reprodutibilidade.
- Evangelizar o uso responsável e eficiente da IA, representando a empresa em talks, artigos e comunidades técnicas.
- Garantir compliance e anonimização de dados sensíveis, em linha com LGPD e regulamentações do setor público.
- Contribuir com o desenho e evolução da arquitetura distribuída (multi-workers/processors) conectada a sistemas judiciais e múltiplos LLMs.
Requisitos e qualificações
- Conhecimento em estatística, probabilidade e algoritmos de Machine Learning (regressão, classificação, clusterização etc.).
- Experiência prática com Grandes Modelos de Linguagem (LLMs) e técnicas de prompting, embeddings e RAG.
- Familiaridade com o ecossistema de GenAI, incluindo frameworks e bibliotecas que aceleram o desenvolvimento com LLMs e vector databases.
- Vivência em vector DBs (pgvector, OpenSearch, Pinecone, Milvus ou equivalentes).
- Sólida base em Python e Node/TypeScript para automações e integrações.
- Experiência em arquitetura em nuvem (AWS, Azure ou GCP).
- Conhecimento em segurança e privacidade de dados (LGPD, PII), em especial questões de anonimização.
- Capacidade de comunicar e apresentar insights complexos de forma clara para públicos técnicos e de negócio.
- Experiência anterior como arquiteto de soluções ou líder técnico em projetos complexos de IA.
Diferenciais
- Experiência com evals automatizados e guardrails (Rebuff, NeMo Guardrails, Truera).
- Experiência com IA aplicada ao setor público ou jurídico.
- Publicações, talks ou contribuições em comunidades técnicas de IA.
- Histórico de contribuição em projetos InnerSource ou open source.
Informações adicionais
Modelo de trabalho: Anywhere Office - 100% remoto
Benefícios:
- Vale-alimentação/Vale-refeição;
- Plano de saúde e odontológico;
- Auxílio Home Office;
- Participação nos Lucros e Resultados;
- Voucher para Kit Setup;
- Seguro de vida;
- Day Off aniversário;
- Programa de promoção à saúde e bem-estar;
- Parcerias e descontos.
Um dos nossos pilares é a valorização das pessoas e temos orgulho de dizer que somos uma empresa que apoia a diversidade e inclusão. Sendo assim, consideramos todos os candidatos para as nossas vagas, sem distinção de raça, cor, religião, gênero e identidade de gênero, nacionalidade, deficiência, orientação sexual, ascendência, idade, etc.
Etapas do processo
- Etapa 1: Cadastro
- Etapa 2: Mapeamento de Habilidades - Mindsight
- Etapa 3: Entrevista com a Pessoa Recrutadora
- Etapa 4: Excelência Técnica - Entrevista com a Liderança
- Etapa 5: Excelência Técnica - Desafio
- Etapa 6: Contratação
SOBRE A SOFTPLAN
Somos uma das maiores empresas de software do Brasil e uma das principais GovTechs do país.
Há mais de 35 anos, desenvolvemos soluções que apoiam a transformação digital do Setor Público.
Nosso posicionamento é claro: transformamos desafios em soluções reais, com tecnologia que promove mais transparência e eficiência, porque impactar vidas é o que nos move.
Esse impacto acontece em escala: nossas soluções fazem a diferença no dia a dia de 9 em cada 10 brasileiros (cerca de 91% da população).
SAIBA MAIS SOBRE NÓS