Google introduce tecnología OCR para indexar PDF escaneados
Hasta hace poco, Google era capaz de realizar búsquedas en archivos PDF obtenidos desde un escáner pero sólo de manera parcial, sin lograr acceder al contenido del mismo, con lo cual las búsquedas podían incluir entradas que no eran las adecuadas.
Pero desde hace unos días Google comenzó a aplicar la tecnología OCR para interpretar prácticamente todo el contenido de un PDF escaneado, lo que resulta en búsquedas más exactas.
Sin embargo aún quedan problemas por resolver, ya que hay documentos escaneados con baja resolución lo que hace más díficil interpretar dicha información.
Para ver esta nueva tecnología en acción puedes acceder a este enlace y luego haz click en View as HTML.

Link: Convert Scanned PDF Documents to Text with Google OCR [Digital Inspiration]


