Novo: API pública medida · leitura de placa por webcam · motor que aprende a cada documento

Local-first · IA opcional · LGPD

Documentos viram dados estruturados — com precisão, sem alucinação.

Plataforma de OCR + extração para documentos brasileiros. OCR no servidor (PaddleOCR) ou no navegador (Tesseract), 52 modelos mapeados, validação por dígito verificador e 5 guardrails anti-alucinação. IA externa só no caso difícil — sempre avisada e com tokens contados.

Acessar a plataforma Ver como funciona

Aprende e se corrige sozinho OCR no servidor e no navegador Chave de API por usuário

Documento → campos 96% confiança

NOME

RAFAEL P. GOMES

CPF

814.238.573-21

NASCIMENTO

1989-03-13

CATEGORIA

PaddleOCR · VPS

OCR local · sem IA

Modelos de documento BR

Guardrails anti-alucinação

Camadas de precisão

100%

LGPD por padrão

52 modelos de documentos brasileiros

Identidade

CNH

Habilitação

ASO

Saúde ocupacional

NF-e

Fiscal

Holerite

Contrato

Jurídico

CRNM

Estrangeiro

Cartão CNPJ

Empresa

Certidão

Registro

+43 tipos

Recursos

Tudo num lugar só

Da leitura à validação, passando por contratos, placas, médico e API — um produto completo de Document AI.

OCR multi-motor

PaddleOCR/RapidOCR no servidor, Tesseract no navegador (offline/privado) e IA de visão para foto difícil. Consenso entre motores.

Anti-alucinação

Grounding (o valor tem que existir na imagem), Chain-of-Verification, JSON mode e anti prompt-injection. 5 guardrails.

52 modelos brasileiros

RG, CNH, CPF, ASO, NF-e, holerite, contratos, certidões… Identifica o tipo e mira só os campos certos.

Análise de contratos

Lê o contrato inteiro (multipágina): partes, cláusulas, obrigações, prazos e riscos. Baixo custo (Ollama) ou premium.

Placas (LPR)

Leitura por foto e webcam, e câmeras RTSP ao vivo. Validação BR (antiga/Mercosul) + correção O↔0.

Validador médico

Atestado/laudo: CID×doença (base CID-10 com 14.233 códigos), CRM/CFM, checklist e veredito. Consumo 0.

Gerador de corpus

Documentos sintéticos com gabarito (.gt.json) para medir a acurácia do OCR — PDF, scan e foto.

API pública medida

Chaves individuais, consumo por fonte (VPS/IA interna/externa), cota diária e faturamento.

Auto-aprende e auto-corrigedestaque

Confere cada campo contra a imagem, relê o que diverge e aprende com 'Reportar erro' — cada correção vira regra e cada layout vira leitura instantânea.

Como funciona

Do clique ao dado

A maior parte é resolvida sem IA. IA externa só entra em foto difícil ou se você ligar a conferência.

Passo 1

Entrada

Imagem, PDF, foto, webcam ou câmera RTSP. PDF é rasterizado.

Passo 2

OCR

PaddleOCR (VPS) ou Tesseract (navegador). Foto difícil: IA de visão.

Passo 3

Estrutura

Identifica o tipo (52) e extrai campos por regra + layout + sinônimos.

Passo 4

Valida

Dígito verificador CPF/CNPJ, chave NF-e, datas reais. Auto-conserto.

Passo 5

Confere

Grounding + re-leitura focada + consenso. Campos a revisar marcados.

Em ação

O documento vira campos conferidos

Cada campo com bolinha de confiança, validação por dígito e selo de assertividade. O que precisa de revisão fica destacado — nada de chute silencioso.

Confiável (validado/grounded) A revisar

ASO — Atestado de Saúde Ocupacional94% assertividade

NOME

MARIA G. DE MEDEIROS

CPF

043.660.014-54

NASCIMENTO

02/02/1979

RESULTADO

APTO

CRM

SP-54321

MATRÍCULA

revisar

Aprende e se corrige sozinho

Uma interface que se ensina e se corrige a cada documento.

O sistema aprende o layout e guarda casos golden — quando reconhece um modelo já dominado, resolve só com regra, sem IA, custo zero. E se corrige: confere cada campo contra a imagem (grounding + dupla leitura) e tem a aba Reportar erro — você cola o documento que falhou e ele aprende na hora, sem mais perguntas.

LêConfere (grounding)Aprende (golden)Melhora

Ver a stack técnica

Fingerprint de layout

Impressão digital dos rótulos reconhece o emissor/modelo do documento.

Cache de layout

Layout já dominado pula a IA nas próximas leituras — resposta instantânea.

Auto-correção (CoVe)

Confere cada campo contra a imagem e relê o que não bate — duas leituras que concordam viram confiáveis.

Reportar erro → aprende

Cola/anexa o doc que falhou + o tipo; extrai, grava o gabarito e reconhece o layout. Sem mais perguntas.

Gate de completude

Só chama IA se faltar campo — mede lidos vs esperados.

Corpus golden

Extrações boas viram regressão + few-shot do tipo.

Confiança

5 guardrails anti-alucinação

A confiança 'verbalizada' da IA é fraca. O forte é cruzar com a imagem e re-verificar.

JSON mode + retry

Força saída JSON válida e re-tenta se vier torta.

Grounding

O valor extraído tem que existir no texto da imagem — senão marca 'não confere'.

Revisão por campo

IA devolve baixa-confiança; junta com inválido + não-confere em 'Campos a revisar'.

Chain-of-Verification

Campo sem grounding dispara re-leitura focada da imagem.

Anti prompt-injection

Trata o documento como dado; ignora 'instruções' embutidas.

Golden set de 52 espécimes + gate de regressão (acurácia por campo) — npm run eval.

API

Extração como serviço, medida

Endpoint público com chave própria por usuário, consumo por fonte e cota diária.

Chave individual

ocrf_live_… guardada só como SHA-256; cada um gere a sua.

Cota + 429

Teto diário de tokens e de chamadas por chave.

Consumo por fonte

VPS · IA interna (Ollama) · IA externa (OpenAI) contam separado.

POST /api/v1/extract

$ curl -X POST https://ocrfactory.com.br/api/v1/extract \
  -H "Authorization: Bearer ocrf_live_…" \
  -F file=@cnh.jpg
{
  "tipo": "cnh",
  "campos": { "nome": "RAFAEL P. GOMES",
              "cpf": "814.238.573-21" },
  "fonte": "vps", "assertividade": 0.96
}

Infraestrutura

Onde cada coisa roda

Local-first no cliente; orquestração na Vercel; cérebro na VPS dedicada própria.

Navegador

Tesseract · canvas · webcam

Vercel · Next.js

UI · API · orquestra

VPS dedicada

PaddleOCR · Ollama · LPR · PDF

Neon Postgres — usuários · chaves · consumo · golden · CID-10 (14.233)

Navegador

UI (React)
Tesseract.js
Pré-processo + deskew
Webcam

Vercel · Next.js 16

UI + páginas
Rotas /api
API medida /v1
Proxy seguro

Neon · Postgres

Usuários + chaves
Consumo + extrações
CID-10 (14.233)
Aprendizado

VPS dedicada

PaddleOCR /ocr
Ollama qwen2.5
fast-alpr /lpr
Gerador de corpus

Segurança & LGPD

Dado sensível, tratado com cuidado

Privacidade por padrão e segredos sempre fora do cliente.

Imagens não guardadas

Só o texto/dados extraídos e metadados.

Chaves cifradas

API e senhas RTSP em AES-256-GCM no Neon; nunca voltam ao cliente.

OCR local privado

Com Tesseract, a imagem não sai do navegador.

Acesso por papel

Comece a extrair com precisão

Acesso por convite. Peça a um administrador ou entre se já tem conta.

Entrar Ver a stack