Espacio de trabajo / Más información

Más información

Nuevo
Cómo funciona Maskify

Tus datos, bajo tu control de principio a fin.

Maskify enmascara información personal en documentos antes de compartirlos. La detección la hacemos en nuestra propia infraestructura — sin terceros — y nunca almacenamos un documento sin enmascarar.

Sin documentos en claro

Nunca conservamos el texto original. Solo guardamos la versión ya enmascarada.

El mapa lo guardas tú

El mapa de reversión que permite recuperar los originales se genera en tu navegador y se descarga sólo a tu disco.

Detección en nuestra casa

Tu texto se procesa en nuestros propios servidores, sin pasar por APIs externas ni terceros.

El recorrido de un documento

Cinco pasos. Lo único que sale de tu navegador es texto que pasa por nuestro detector y vuelve enmascarado.

01

1. Subes tu documento

El archivo se lee en tu propio navegador. No se guarda en disco ni se envía a ningún servidor todavía.

02

2. Detectamos los datos privados

Tu texto pasa por nuestros servidores y lo analizamos con dos capas complementarias: un modelo de IA propio (sin terceros) que entiende contexto, y reglas con validación matemática (IBAN, DNI, tarjetas, claves API…). Tú eliges en cada documento si usas ambas o solo las reglas. El texto vive en memoria mientras procesamos: nada se guarda.

03

3. Eliges qué enmascarar

En el editor activas o desactivas cada tipo y cada coincidencia. Toda la edición ocurre en tu navegador — el borrador vive solo en esta pestaña.

04

4. Descargas el resultado

El archivo enmascarado y el mapa de reversión se generan en tu navegador y se descargan a tu disco. El mapa nunca toca nuestros servidores.

05

5. Solo guardamos lo ya enmascarado

Cuando descargas, creamos en el historial un registro con el documento ya enmascarado. El original nunca se conserva, ni los valores que se detectaron en él.

El caso especial del PDF

Los PDF llevan maquetación, imágenes y firmas que merece la pena conservar. Para ofuscar de verdad — sin que los datos se queden escondidos en el archivo — los tratamos de una manera especial: cada página se convierte en imagen y los datos sensibles se tapan antes de guardarla.

01

1. Lectura del PDF

El PDF se abre en tu propio navegador. Extraemos sólo el texto y dónde está cada palabra; imágenes, firmas y maquetación se quedan tal cual dentro del archivo — no salen de tu equipo.

02

2. Edición como texto

El editor trata el PDF como cualquier documento de texto: detección automática, activar o desactivar tipos, hacer clic en cada coincidencia. El PDF original se mantiene a buen recaudo en tu navegador y nunca se sube a ningún servidor.

03

3. Exportación: PDF como imagen

Al descargar el PDF redactado, cada página se convierte en una imagen con recuadros blancos sobre los datos sensibles. El nuevo archivo no contiene el texto original: copiar y pegar no recupera nada.

04

4. Lo que pierdes (y lo que ganas)

Pierdes la selección de texto y la nitidez de los gráficos vectoriales: el PDF redactado es una imagen. A cambio ganas privacidad real — los datos no están escondidos detrás de un rectángulo, simplemente no existen en el archivo. Si quieres también el texto, descarga el .txt enmascarado.

05

5. Recuperar y volver a redactar

Tu PDF original se guarda únicamente en este navegador (los más recientes). Al reabrirlo desde el Historial con tu mapa de reversión, regeneramos el PDF redactado tal cual la primera vez. Si lo abres desde otro navegador o dispositivo, el editor te ofrece volver a subirlo.

Lo que sí hacemos
  • Borramos los bytes del texto sensible: el PDF redactado no contiene los datos originales.
  • Conservamos imágenes, firmas y maquetación de cada página.
  • El PDF original nunca toca nuestros servidores: vive solo en tu navegador.
Lo que pierdes
  • El PDF redactado es una imagen: no se puede seleccionar texto en él.
  • Los gráficos y diagramas pierden algo de nitidez al convertirse a imagen.
  • Cada página pesa un poco más que la del PDF original.
Recuperación
  • Mismo navegador: con el mapa .json regeneramos el PDF redactado al instante.
  • Otro navegador / dispositivo: el editor te pide volver a subir el PDF original junto al mapa.
  • Sin PDF original disponible: descargas el .txt enmascarado o un PDF de solo texto.

El caso del .docx

A diferencia del PDF, el .docx queda editable: borramos los bytes del texto sensible directamente en el XML en lugar de rasterizar la página. Cubrimos cuerpo, cabeceras, pies, notas y comentarios; opcionalmente limpiamos también los metadatos del autor.

01

1. Lectura del .docx

Un .docx es un ZIP de XML. Lo descomprimimos en tu navegador y recorremos las partes con texto: cuerpo, cabeceras, pies, notas al pie y comentarios. Nada sale del equipo.

02

2. Detección sobre texto plano

Concatenamos el texto extraído y lo pasamos por el mismo detector que usamos para TXT y PDF. La maquetación, fuentes, tablas e imágenes del .docx se quedan tal cual.

03

3. Reemplazo en sitio

Cada coincidencia se sustituye dividiendo el run XML correspondiente. El formato del texto que rodea la marca se conserva. Los bytes originales del dato sensible se eliminan del archivo — a diferencia del PDF, no hace falta rasterizar.

04

4. Metadatos del autor (opcional)

Word guarda el autor, la última persona que editó y la empresa en propiedades del archivo. Si activas «Limpiar metadatos del autor» en el editor, esos campos se vacían junto a la redacción del texto.

05

5. Re-edición

El .docx original se cachea sólo en tu navegador (los más recientes). Al reabrirlo desde el Historial con tu mapa de reversión, regeneramos el .docx redactado con el estilo que elijas. Desde otro navegador, el editor te ofrece volver a subirlo.

Lo que sí hacemos
  • Recorremos cuerpo, cabeceras, pies, notas y comentarios.
  • Borramos el contenido de los cambios marcados con eliminación (tracked deletions) y vaciamos el autor de los comentarios.
  • Opcional: limpiamos los campos Autor, Última modificación y Empresa que Word guarda en las propiedades del archivo.
Lo que no procesamos
  • Texto dentro de imágenes embebidas (no hacemos OCR).
  • El formato .doc binario heredado: pídele a Word que lo guarde como .docx.
  • Documentos con macros (.docm) o protegidos con contraseña.
Re-edición
  • Mismo navegador: con el mapa .json regeneramos el .docx redactado en el estilo que elijas.
  • Otro navegador / dispositivo: el editor te pide volver a subir el .docx original junto al mapa.
  • El .docx descargado sigue siendo editable en Word/LibreOffice.

Cuando el detector se queda corto

El modelo es bueno, pero no infalible: nombres poco comunes, códigos internos de tu empresa, frases que solo tú sabes que son delicadas. Para esos casos hay un botón «+» en cada tipo del editor — y, opcionalmente, una memoria a tu medida que respeta la privacidad por diseño.

01

1. Selecciona el texto

Si el detector deja escapar un nombre, una clave interna o cualquier dato que sólo tú sabes que es sensible, márcalo a mano: arrastra el cursor sobre el texto en el editor.

02

2. Pulsa «+» en el tipo

Cada tipo de dato (Persona, Email, Teléfono, Secreto…) tiene un botón «+». La selección se convierte al instante en una etiqueta enmascarada del tipo elegido.

03

3. ¿Recordarlo?

Justo después aparece una sola pregunta: «¿Recordarlo para futuros documentos?». Te decimos exactamente dónde se guardaría antes de que confirmes.

04

4. Dos rutas, según el dato

Si el dato tiene una estructura (un teléfono, un IBAN, una clave con prefijo), guardamos solo el patrón regex — el valor concreto nunca cruza la red. Si es texto libre (un nombre, una dirección), el valor literal se queda en este navegador y no sale de él.

05

5. Detección continuada

La próxima vez que cargues un documento, tu lista personal se aplica encima del detector estándar. Lo gestionas todo desde tu Perfil — borras lo que ya no necesites cuando quieras.

En tu cuenta

Patrones derivados

Solo el esqueleto del valor. El contenido concreto que marcaste se descarta antes de salir de tu navegador.

  • Teléfono
    Móviles +34 …
    /\b\+34\s\d{3}\s\d{3}\s\d{3}\b/g
  • Cuenta
    IBAN ES…
    /\bES\d{2}(?:[\s-]?\d{4}){5}\b/g
  • Secreto
    Claves sk_live_…
    /\bsk_live_[A-Za-z0-9_-]{16,28}\b/g
Disponibles en cualquier dispositivo donde inicies sesión.
Lo que se almacena: sólo regex y etiquetas. Cero valores.
En este navegador

Valores literales

Para texto libre que no se puede generalizar sin filtrar el contenido. Nunca cruza la red.

  • Persona
    «Juan Martínez Ortega»
    guardado en IndexedDB
  • Persona
    «Lucía Pereira Ruiz»
    guardado en IndexedDB
  • Dirección
    «Calle Mayor 12, 28013 Madrid»
    guardado en IndexedDB
Sólo en este equipo y este navegador. No sincroniza.
Borrar datos del sitio en tu navegador vacía esta lista.
Cuándo va a tu cuenta

Cuando el dato tiene un esqueleto reutilizable: prefijo + grupos de dígitos (teléfonos), país + dígitos (IBAN), prefijo de clave conocida (sk_live_…).

  • Solo guardamos el patrón regex
  • El valor concreto nunca sale de tu navegador
  • Disponible desde cualquier dispositivo
Cuándo se queda local

Cuando el dato es texto libre y no se puede generalizar sin filtrar el contenido: nombres de personas, direcciones, frases sueltas, códigos sin estructura clara.

  • El valor literal se guarda en IndexedDB
  • Nunca cruza la red
  • Vive solo en este equipo y este navegador
Tú gestionas la memoria

Las dos listas (sincronizada y local) se ven y se borran desde tu Perfil. Nada queda atrapado: una entrada que ya no quieras desaparece en un click.

Ir a Perfil →

Bajo el capó

Stack abierto, sin trucos. Puedes inspeccionar cómo está hecha cada pieza.

openai/privacy-filter

Modelo open-source (Apache-2.0) de OpenAI para clasificación de tokens en 8 categorías de datos personales. Lo ejecutamos en nuestros propios servidores.

github.com/openai/privacy-filter →
Pesos en Hugging Face

Cuantización ONNX q4 cargada una sola vez y reutilizada para todas las peticiones. Sin descargas desde fuera en cada análisis.

huggingface.co/openai/privacy-filter →
Capa regex complementaria

IBAN (mod-97), DNI/NIE (mod-23), Luhn para tarjetas, prefijos conocidos de claves de API. Detalles que el modelo no fue entrenado para validar.

Almacenamiento mínimo

PostgreSQL guarda tu cuenta y los documentos ya enmascarados. El texto original nunca llega al disco. Cada entidad almacena su posición pero su valor original permanece vacío.

Pruébalo con un documento tuyo

Sin registro para enmascarar. Solo necesitas una cuenta gratuita si quieres recuperar el resultado desde el historial más adelante.

Subir un documento