Funciones / Detección de vídeos duplicados

Detección de vídeos duplicados

Encuentra vídeos duplicados aunque se hayan recodificado, redimensionado o convertido a otro formato.

IAVídeosCLIPDeduplicación Documentación
Página de duplicados que muestra un original HEVC de 90 MiB y una recodificación H.264 de 23 MiB detectados como duplicados con las acciones Conservar y Enviar a la papelera

El mismo vídeo, un archivo distinto

Has importado el mismo clip de vacaciones desde tres dispositivos diferentes. Uno es un original 4K HEVC, otro es una recodificación 1080p H.264 y un tercero se comprimió para WhatsApp. Se ven idénticos, pero cada byte es distinto. Gallery ahora los detecta como duplicados.

La misma IA basada en CLIP que encuentra imágenes visualmente similares funciona ahora también con los vídeos. Gallery extrae 8 fotogramas equidistantes de cada vídeo, los codifica con CLIP y promedia los embeddings en un único vector. Dos vídeos con el mismo contenido visual producen vectores casi idénticos — sin importar el códec, la resolución ni la tasa de bits.

El mismo flujo que ya conoces

Los vídeos duplicados aparecen en la misma página Utilidades > Duplicados que los duplicados de imágenes. Revísalos uno junto a otro, conserva la versión de mayor calidad, envía el resto a la papelera o agrúpalos juntos. Funcionan todas las mismas acciones — resolver, deduplicar todo o conservar todo.

No hay ningún ajuste nuevo que configurar. Si tienes activadas la búsqueda inteligente y la detección de duplicados, los vídeos se incluyen automáticamente la próxima vez que se ejecuten los trabajos.

Resuelve bien los casos límite

Los clips cortos de menos de 2 segundos reciben un único fotograma en el punto medio en lugar de los 8 habituales. Los vídeos con metadatos ausentes o corruptos se procesan igualmente con un fotograma de reserva al principio. Si no se puede extraer un fotograma, Gallery promedia los fotogramas que sí se hayan obtenido en lugar de rendirse por completo.

Los vídeos solo se comparan con otros vídeos — nunca con imágenes. El umbral de detección de duplicados es la misma distancia configurable que ya usas para los duplicados de imágenes.

Lee la documentación completa en GitHub

¿Listo para ejecutar Gallery en tu propio servidor? Instálalo en 5 minutos y deja la demo para una comprobación rápida.