Documentos viram dados estruturados — com precisão, sem alucinação.
Plataforma de OCR + extração para documentos brasileiros. OCR no servidor (PaddleOCR) ou no navegador (Tesseract), 52 modelos mapeados, validação por dígito verificador e 5 guardrails anti-alucinação. IA externa só no caso difícil — sempre avisada e com tokens contados.
Tudo num lugar só
Da leitura à validação, passando por contratos, placas, médico e API — um produto completo de Document AI.
Do clique ao dado
A maior parte é resolvida sem IA. IA externa só entra em foto difícil ou se você ligar a conferência.
O documento vira campos conferidos
Cada campo com bolinha de confiança, validação por dígito e selo de assertividade. O que precisa de revisão fica destacado — nada de chute silencioso.
Uma interface que se ensina e se corrige a cada documento.
O sistema aprende o layout e guarda casos golden — quando reconhece um modelo já dominado, resolve só com regra, sem IA, custo zero. E se corrige: confere cada campo contra a imagem (grounding + dupla leitura) e tem a aba Reportar erro — você cola o documento que falhou e ele aprende na hora, sem mais perguntas.
5 guardrails anti-alucinação
A confiança 'verbalizada' da IA é fraca. O forte é cruzar com a imagem e re-verificar.
npm run eval.Extração como serviço, medida
Endpoint público com chave própria por usuário, consumo por fonte e cota diária.
$ curl -X POST https://ocrfactory.com.br/api/v1/extract \-H "Authorization: Bearer ocrf_live_…" \-F file=@cnh.jpg{"tipo": "cnh","campos": { "nome": "RAFAEL P. GOMES","cpf": "814.238.573-21" },"fonte": "vps", "assertividade": 0.96}
Onde cada coisa roda
Local-first no cliente; orquestração na Vercel; cérebro na VPS dedicada própria.
- UI (React)
- Tesseract.js
- Pré-processo + deskew
- Webcam
- UI + páginas
- Rotas /api
- API medida /v1
- Proxy seguro
- Usuários + chaves
- Consumo + extrações
- CID-10 (14.233)
- Aprendizado
- PaddleOCR /ocr
- Ollama qwen2.5
- fast-alpr /lpr
- Gerador de corpus
Dado sensível, tratado com cuidado
Privacidade por padrão e segredos sempre fora do cliente.
Comece a extrair com precisão
Acesso por convite. Peça a um administrador ou entre se já tem conta.