Tecnologia e IA

Como treinamos a IA da Recruta para recrutamento PCD

A Recruta não usa um GPT genérico em cima de um chatbot. O sistema combina três fontes de sinal: base proprietária de currículos e decisões, curadoria humana de analistas seniores e modelos combinados (determinísticos mais generativos). A governança jurídica corre em paralelo, em três camadas. Por que isso importa para PCD.

Rosana Daniele Marques (Dani)
Rosana Daniele Marques
Sócia da Protagonist · Editora da Recruta
· 24 de abril de 2026 · 12 min de leitura

Em uma frase. A IA propõe. O humano confirma. A última decisão sempre fica com o analista. O resto do texto explica como construímos a IA que faz essa proposta valer a pena.

Por que não usamos GPT genérico

Existe um padrão na primeira onda de plataformas de RH com IA. Pega um GPT pronto, encaixa um chatbot por cima e chama de "recrutamento com IA". Funciona pra demo de feira, falha em produção.

Três problemas se repetem nesse desenho:

Tom capacitista. Modelo generalista treinado em dado de internet aberta reproduz vocabulário ableísta sem perceber. Em vaga PCD, isso é fatal.

Viés de screening. Modelo que aprendeu com "currículo padrão" descarta perfis com trajetória interrompida, hiato por afastamento médico, formação alternativa. PCD em geral cai justamente nessas categorias.

Perda de candidato elegível por ruído de linguagem. Currículo escrito por candidato com deficiência visual ou cognitiva às vezes tem estrutura diferente. Modelo genérico interpreta como "menos qualificado". Não é. É só diferente.

A Recruta foi desenhada pra evitar os três. Combinando três fontes de sinal, cada uma cobrindo a fraqueza da outra.

As três fontes de sinal

FonteO que entregaO que limita
Base proprietáriaCurrículos e decisões reais da operação como ground truthVolume cresce no tempo; novo cliente entra com pouco histórico
Curadoria de analistas senioresJulgamento humano calibrado vira parte do treino, não filtro pósCaro de manter; depende de retenção do time
Modelos combinados (determinístico + generativo)Casos estáveis fecham por regra; linguagem aberta usa generativoExige tuning constante quando a regulação muda

1. Base proprietária

Currículos rotulados e decisões anteriores viram referência para o modelo. A fonte cresce a cada processo rodado pela operação. Cada vaga fechada, cada candidato aprovado e cada candidato descartado deixam um sinal que alimenta a próxima rodada.

Não é "treino offline com dump anual". É loop ativo: o que o analista decide hoje calibra o que a IA propõe semana que vem.

2. Curadoria dos analistas

Analistas de RH seniores revisam amostras e definem o que conta como match. O julgamento deles é parte do treino, não filtro a posteriori.

Isso muda completamente a dinâmica em relação a um modelo treinado só em rótulo automático. Quando o analista diz "esse candidato com deficiência visual cabe nessa função de SAC, com adaptação X", esse julgamento entra na próxima leva de treino. O modelo aprende não só o "o quê" (currículo correspondente), mas o "porquê" (qual adaptação torna o match viável).

3. Modelos combinados

Camadas determinísticas fecham casos estáveis. A IA generativa cuida da linguagem aberta. A combinação reduz alucinação e mantém consistência.

Exemplo prático: matching de formação obrigatória (CRF, CREA, OAB) usa regra dura. Não vai a modelo generativo. Avaliação semântica de "compatibilidade funcional com deficiência X" usa modelo generativo, com prompt versionado e ajustado pela curadoria.

Por que isso vale ouro em PCD. Em vaga PCD, o pior erro não é descartar bom candidato (o analista pega no review). É aprovar candidato em vaga incompatível, o que vira pedido de demissão em 60 dias e nova rodada de captação. Modelo combinado reduz exatamente esse falso positivo.

Governança em três camadas

Nenhuma saída de IA vai direto pro usuário. Existem três camadas de supervisão em tempo real.

Camada 1: IA jurídica e compliance

Supervisão em tempo real de todas as saídas. Aplica LGPD, GDPR, legislação trabalhista. Bloqueia ou marca para revisão tudo que viola tom, sai do escopo legal ou expõe dado sensível.

Camada 2: IA árbitra

Controle de qualidade e validação cruzada. Verifica consistência (a mesma pergunta gera respostas consistentes?). Faz benchmarking interno (a resposta bate com casos similares já validados pela curadoria?).

Camada 3: 15 agentes operacionais

Saídas filtradas e validadas pelos dois supervisores chegam aos agentes da operação. Esses 15 agentes cobrem todo o ciclo do ATS: criação de vaga, marketing, avaliação e engajamento. Detalhamos cada um neste post.

3 camadas
de validação antes de qualquer saída de IA chegar ao usuário

Triagem em quatro camadas

O volume típico em PCD é desproporcional. Duas mil inscrições para pouquíssimas vagas abertas. O filtro precisa subir qualidade sem perder candidato elegível.

CamadaO que avaliaQuem decide
1. Validação estruturalCurrículo íntegro, dados mínimos, aceite LGPDDeterminística (regra)
2. Match de requisitos durosFormação, registro profissional, experiênciaDeterminística (regra)
3. Aderência PCD e linguagemAvaliação da vaga frente ao perfil, cuidado de vocabulárioIA generativa supervisionada
4. Revisão do analistaCasos limítrofes, calibração para a próxima rodadaHumano (sempre)

Vagas operacionais e não-operacionais usam pesos diferentes. Farmacêutico, engenharia e áreas reguladas puxam formação e registro. Vagas de atendimento puxam mais linguagem e fit de função. Feedback do analista volta para o treino da próxima leva.

Por que isso importa para PCD

Recrutamento PCD tem cinco gargalos clássicos (banco fragmentado, documentação inconsistente, JD excludente, triagem por palavra-chave, onboarding sem adaptação). A IA combinada com governança ataca três deles diretamente.

JD excludente: camada de aderência PCD detecta linguagem capacitista no texto da vaga antes de publicar. Sugere reescrita ou marca para revisão.

Triagem por palavra-chave: a aderência clínico-funcional substitui a busca por palavra. O modelo cruza CID do candidato com atribuições reais da função, não com termo no currículo.

Documentação inconsistente: validação estrutural rejeita laudo vencido, CID ausente, grau não registrado. Antes do candidato chegar na shortlist.

Os outros dois (banco fragmentado e onboarding sem adaptação) não são problema de IA. São de operação. A Recruta resolve com banco proprietário em rede e checklist de adaptação por tipo de deficiência.

Quer ver rodando?

Veja a IA da Recruta em duas vagas reais da sua empresa

Sem cartão, sem compromisso. 2 vagas grátis no início do relacionamento. Captação, triagem, shortlist e apresentação ao gestor.

Rosana Daniele Marques (Dani)

Rosana Daniele Marques

Sócia da Protagonist e editora da Recruta. Coautora do livro "Liderança com base nas Soft Skills". 15+ anos em RH estratégico, com foco em HRBP, change management, cultura e sucessão.

Veja a IA da Recruta em ação

2 vagas grátis no início do relacionamento. Sem cartão, sem compromisso.