Noticias

Dropbox incorpora búsqueda de texto en documentos PDF e imágenes

Por segunda vez en apenas dos meses, Dropbox ha mejorado su sistema de búsqueda de tal forma que ahora es capaz de buscar texto dentro de documentos PDF e incluso en archivos de imágenes como PNG o JPG.

Dropbox: busca lo que quieras dónde quieras

Parece ser que esta es la premisa de Dropbox, la popular plataforma de almacenamiento en la nube que durante los últimos meses se ha centrado en mejorar su sistema de búsqueda. El mes pasado la compañía implementó un nuevo motor de búsqueda basado en el aprendizaje automático y ahora anuncia estar mejorando la capacidad de reconocimiento óptico de caracteres (OCR) que permitan al usuario buscar texto tanto en archivos PDF como en imágenes.

«Los formatos de imagen (como JPEG, PNG o GIF) generalmente no son indexables porque no tienen ningún contenido de texto, mientras que los formatos de documentos basados ​​en texto (como TXT, DOCX, o HTML) generalmente son indexables. Los archivos PDF quedan en medio ya que pueden contener una mezcla de texto y contenido de la imagen. El reconocimiento de texto automático de la imagen es capaz de distinguir de forma inteligente entre todos estos documentos para categorizar los datos que contiene.

A pesar de la buena noticia, por el momento esta nueva mejora se encuentra limitada en dos aspectos. Por un lado, parece estar limitada al idioma inglés:

Así que ahora, cuando un usuario realiza una búsqueda de texto en inglés que aparece en uno de estos archivos, se mostrará en los resultados de búsqueda.

Por otro lado, tal y como recoge Jon Porter en The Verge, la función está limitada a los niveles de suscripción más caros.

La nueva característica […] está disponible ahora para los usuarios Dropbox Business Advanced y Enterprise, y debe estar disponible para los suscriptores de Dropbox profesionales en los próximos meses.

El funcionamiento es similar a la tecnología ya implementada en la aplicación móvil de Dropbox el año pasado: utilizar la app para fotografiar un documento, pero ejecutando OCR al mismo tiempo para extraer el texto. Sin embargo, esto solo funcionaba con un pequeño subconjunto de los documentos.

[irp]

Al implementar las capacidades OCR directamente en el motor de búsqueda, ahora Dropbox es capaz de buscar texto dentro de todos sus archivos PDF e imágenes, sin importar la forma en que fueron escaneados o fotografiados.

Fuente
DropboxThe Verge

José Alfocea

Profesor de Historia y licenciado en Periodismo, siempre con ganas de aprender; me encanta todo lo relacionado con el pasado de la Humanidad, sus manifestaciones artísticas o el Periodismo, y muy especialmente, las nuevas tecnologías y su vinculación con el sector educativo. Soy un apasionado de Apple y de la comunicación, y por eso estoy aquí.
Los datos de carácter personal que nos facilite mediante este formulario quedarán registrados en un fichero de Miguel Ángel Navas Carrera, con la finalidad de gestionar los comentarios que realizas en este blog. La legitimación se realiza a través del consentimiento del interesado. Si no se acepta no podrás comentar en este blog. Puedes consultar Política de privacidad. Puede ejercitar los derechos de acceso, rectificación, cancelación y oposición en [email protected]
Botón volver arriba