Cómo leer información del pdf y trabajar con pdf en Java.

En un anterior artículo hable sobre cómo obtener información de archivos Excel usando Java.

En este nuevo artículo veremos como obtener información de archivos PDF usando librerías Java.

Muchas veces como desarrolladores o programadores nos encontramos con el obstáculo o el dilema sobre cómo manejar o como solucionar el inconveniente sobre cómo trabajar con los documentos de formato PDF, pues si bien existen muchas soluciones varias de ellas son muy completas e innecesarias y al final terminamos optando por algo que de un total de sus capacidades o métodos solo usamos uno o dos.

Bueno,  entonces cuando me topé con el dilema de que hacer al solo necesitar un visualizador o simplemente cargar el texto de un PDF.

Fue entonces cuando me encontré con esta librería hecha en java que vendría a solucionar mi problema pues con unas cuantas líneas de código es posible visualizar un documento y poder acceder al texto del mismo. ¿Pero qué librería es?


La respuesta es que los señores de TeamDev han desarrollado una excelente Solución llamada, JxDocument que con solo unas cuantas líneas de código me soluciono el problema, Bueno ahora les mostrare paso a paso y Uds. podrán sacar conclusiones de la facilidad con la que podremos realizar este. El primer paso es visitar el sitio y descargar un trial para poder probar el producto desde esta dirección aquí.

Unas vez descargadas debemos descargar también la licencia para poder usarlo. Lo cual es tan fácil como ir ala página TeamDev, y seleccionar la opción Evaluate, nos pedirá que llenemos un formulario.

Una vez que descargamos la licencia estamos listos para empezar a probar, dependiendo del IDE que utilicen para el desarrollo en Java, debemos agregar la referencia a la librería, en mi caso estoy usando un NetBeans, bueno creamos un proyecto de tipo de aplicación Java, y agregamos las dos librerías la que nos llega al descargar el paquete del desarrollo y la licencia.


Una vez que hemos agregado las librerías es tan simple como esto, por ejemplo si queremos cargar un documento simplemente con una cuantas líneas de código podremos hacerlo.

Por ejemplo podemos ver en el código simplemente Cargamos el Documento, y podemos acceder a cualquier método que nos brinde la librería. File file = new File("C:\\TeamDev.pdf"); // Load PDF document from specified file Document document = new Document(file);
Y el resultado sería esto:

Yo incluí unos controles para recorrer las páginas y para saber en qué página estoy y que cantidad e paginas tengo en el documento.

Ahora si necesitamos obtener el texto de la página que necesitamos simplemente hacemos lo siguiente con unas dos líneas de código lo obtenemos:

El método getText() nos obtiene el texto de la página que necesitamos.
Bueno en conclusión la librería nos permite solucionar el dilema de visualizar y leer Documentos de Tipo PDF, es bastante sencilla de usar como pudimos ver, y les recomiendo usarla probarla y podrán ver que es bastante fácil.


Comentarios

Entradas populares de este blog

The Deep Sea: una web interactiva para explorar las profundidades el mar y descubrir las extrañas criaturas que viven en él

Detectar el usuario de Windows utilizando C#

Lo nuevo de SQL Server 2008 respecto a SQL Server 2005