Novo: API pública medida · leitura de placa por webcam · motor que aprende a cada documento
Local-first · IA opcional · LGPD

Documentos viram dados estruturados — com precisão, sem alucinação.

Plataforma de OCR + extração para documentos brasileiros. OCR no servidor (PaddleOCR) ou no navegador (Tesseract), 52 modelos mapeados, validação por dígito verificador e 5 guardrails anti-alucinação. IA externa só no caso difícil — sempre avisada e com tokens contados.

Aprende e se corrige sozinho OCR no servidor e no navegador Chave de API por usuário
Documento → campos 96% confiança
NOME
RAFAEL P. GOMES
CPF
814.238.573-21
NASCIMENTO
1989-03-13
CATEGORIA
AB
PaddleOCR · VPS
OCR local · sem IA
52
Modelos de documento BR
5
Guardrails anti-alucinação
9
Camadas de precisão
100%
LGPD por padrão
52 modelos de documentos brasileiros
RG
Identidade
CNH
Habilitação
ASO
Saúde ocupacional
NF-e
Fiscal
Holerite
RH
Contrato
Jurídico
CRNM
Estrangeiro
Cartão CNPJ
Empresa
Certidão
Registro
+43 tipos
Recursos

Tudo num lugar só

Da leitura à validação, passando por contratos, placas, médico e API — um produto completo de Document AI.

OCR multi-motor
PaddleOCR/RapidOCR no servidor, Tesseract no navegador (offline/privado) e IA de visão para foto difícil. Consenso entre motores.
Anti-alucinação
Grounding (o valor tem que existir na imagem), Chain-of-Verification, JSON mode e anti prompt-injection. 5 guardrails.
52 modelos brasileiros
RG, CNH, CPF, ASO, NF-e, holerite, contratos, certidões… Identifica o tipo e mira só os campos certos.
Análise de contratos
Lê o contrato inteiro (multipágina): partes, cláusulas, obrigações, prazos e riscos. Baixo custo (Ollama) ou premium.
Placas (LPR)
Leitura por foto e webcam, e câmeras RTSP ao vivo. Validação BR (antiga/Mercosul) + correção O↔0.
Validador médico
Atestado/laudo: CID×doença (base CID-10 com 14.233 códigos), CRM/CFM, checklist e veredito. Consumo 0.
Gerador de corpus
Documentos sintéticos com gabarito (.gt.json) para medir a acurácia do OCR — PDF, scan e foto.
API pública medida
Chaves individuais, consumo por fonte (VPS/IA interna/externa), cota diária e faturamento.
Auto-aprende e auto-corrigedestaque
Confere cada campo contra a imagem, relê o que diverge e aprende com 'Reportar erro' — cada correção vira regra e cada layout vira leitura instantânea.
Como funciona

Do clique ao dado

A maior parte é resolvida sem IA. IA externa só entra em foto difícil ou se você ligar a conferência.

Passo 1
Entrada
Imagem, PDF, foto, webcam ou câmera RTSP. PDF é rasterizado.
Passo 2
OCR
PaddleOCR (VPS) ou Tesseract (navegador). Foto difícil: IA de visão.
Passo 3
Estrutura
Identifica o tipo (52) e extrai campos por regra + layout + sinônimos.
Passo 4
Valida
Dígito verificador CPF/CNPJ, chave NF-e, datas reais. Auto-conserto.
Passo 5
Confere
Grounding + re-leitura focada + consenso. Campos a revisar marcados.
IA
Em ação

O documento vira campos conferidos

Cada campo com bolinha de confiança, validação por dígito e selo de assertividade. O que precisa de revisão fica destacado — nada de chute silencioso.

Confiável (validado/grounded) A revisar
ASO — Atestado de Saúde Ocupacional94% assertividade
NOME
MARIA G. DE MEDEIROS
CPF
043.660.014-54
NASCIMENTO
02/02/1979
RESULTADO
APTO
CRM
SP-54321
MATRÍCULA
revisar
Aprende e se corrige sozinho

Uma interface que se ensina e se corrige a cada documento.

O sistema aprende o layout e guarda casos golden — quando reconhece um modelo já dominado, resolve só com regra, sem IA, custo zero. E se corrige: confere cada campo contra a imagem (grounding + dupla leitura) e tem a aba Reportar erro — você cola o documento que falhou e ele aprende na hora, sem mais perguntas.

Confere (grounding)Aprende (golden)Melhora
Ver a stack técnica
Fingerprint de layout
Impressão digital dos rótulos reconhece o emissor/modelo do documento.
Cache de layout
Layout já dominado pula a IA nas próximas leituras — resposta instantânea.
Auto-correção (CoVe)
Confere cada campo contra a imagem e relê o que não bate — duas leituras que concordam viram confiáveis.
Reportar erro → aprende
Cola/anexa o doc que falhou + o tipo; extrai, grava o gabarito e reconhece o layout. Sem mais perguntas.
Gate de completude
Só chama IA se faltar campo — mede lidos vs esperados.
Corpus golden
Extrações boas viram regressão + few-shot do tipo.
Confiança

5 guardrails anti-alucinação

A confiança 'verbalizada' da IA é fraca. O forte é cruzar com a imagem e re-verificar.

1
JSON mode + retry
Força saída JSON válida e re-tenta se vier torta.
2
Grounding
O valor extraído tem que existir no texto da imagem — senão marca 'não confere'.
3
Revisão por campo
IA devolve baixa-confiança; junta com inválido + não-confere em 'Campos a revisar'.
4
Chain-of-Verification
Campo sem grounding dispara re-leitura focada da imagem.
5
Anti prompt-injection
Trata o documento como dado; ignora 'instruções' embutidas.
Golden set de 52 espécimes + gate de regressão (acurácia por campo) — npm run eval.
API

Extração como serviço, medida

Endpoint público com chave própria por usuário, consumo por fonte e cota diária.

Chave individual
ocrf_live_… guardada só como SHA-256; cada um gere a sua.
Cota + 429
Teto diário de tokens e de chamadas por chave.
Consumo por fonte
VPS · IA interna (Ollama) · IA externa (OpenAI) contam separado.
POST /api/v1/extract
$ curl -X POST https://ocrfactory.com.br/api/v1/extract \
-H "Authorization: Bearer ocrf_live_…" \
-F file=@cnh.jpg
{
"tipo": "cnh",
"campos": { "nome": "RAFAEL P. GOMES",
"cpf": "814.238.573-21" },
"fonte": "vps", "assertividade": 0.96
}
Infraestrutura

Onde cada coisa roda

Local-first no cliente; orquestração na Vercel; cérebro na VPS dedicada própria.

Navegador
Tesseract · canvas · webcam
Vercel · Next.js
UI · API · orquestra
VPS dedicada
PaddleOCR · Ollama · LPR · PDF
Neon Postgres — usuários · chaves · consumo · golden · CID-10 (14.233)
Navegador
  • UI (React)
  • Tesseract.js
  • Pré-processo + deskew
  • Webcam
Vercel · Next.js 16
  • UI + páginas
  • Rotas /api
  • API medida /v1
  • Proxy seguro
Neon · Postgres
  • Usuários + chaves
  • Consumo + extrações
  • CID-10 (14.233)
  • Aprendizado
VPS dedicada
  • PaddleOCR /ocr
  • Ollama qwen2.5
  • fast-alpr /lpr
  • Gerador de corpus
Segurança & LGPD

Dado sensível, tratado com cuidado

Privacidade por padrão e segredos sempre fora do cliente.

Imagens não guardadas
Só o texto/dados extraídos e metadados.
Chaves cifradas
API e senhas RTSP em AES-256-GCM no Neon; nunca voltam ao cliente.
OCR local privado
Com Tesseract, a imagem não sai do navegador.
Acesso por papel
Login com masters + membros; chave de API e consumo por usuário.

Comece a extrair com precisão

Acesso por convite. Peça a um administrador ou entre se já tem conta.