Mostrando entradas con la etiqueta java. Mostrar todas las entradas
Mostrando entradas con la etiqueta java. Mostrar todas las entradas

Que es un Bash Shell

Bash Shell Es un archivo de procesamiento por lotes, que por lo general es un archivo de texto plano. Es útil e interactivo entre el usuario y el sistema operativo. El ejecutable resultante no ha de ser compilado y por la tanto es legible por el usuario, y puede ser modificado, siempre y cuando tenga permisos habilitados sobre el archivo.

Esto aporta algunas ventajas:

  • Multiplataforma: al no ser binario, se pueden ejecutar en diversas plataformas sin modificaciones, lo que es una clara ventaja si queremos que el código funcione en cualquier sistema.
  • Portabilidad: si el intérprete está listo para una plataforma, entonces el script o lenguaje interpretado funcionará en dicha plataforma.

Sin embargo, estos lenguajes interpretados también tienen sus desventajas:

  • Una de ellas es el rendimiento, ya que necesitan del intérprete siempre ejecutándose en segundo plano para que funcione.
  • La propia dependencia del intérprete.

Cada línea contiene un comando, o instrucción y sus opciones, y una vez ejecutado pasará a la siguiente línea de ejecución. Pueden ser creados para realizar una serie de operaciones utilizando los comandos del sistema operativo. O como ejecutable de un lenguaje de programación interpretado, como puede ser Java, C#, JavaScript, Visual Basic .NET y VBScript, Perl, Python, Lips, Ruby, PHP, ASP, SQL etcétera 

Fusionar archivos PDF

El formato de archivos PDF se está convirtiendo, si no lo es ya, en una estándar para el envío y recepción de documentación oficial. En mi caso concreto, debía enviar varios documentos recogidos de varias fuentes a una institución pública. El problema que tenia, era que son varios documentos los que tenía que enviar, pero no me permitían subir al sistema nada más que cuatro archivos, y no era posible comprimirlos y enviarselos. Tenían que ser legibles para poder ser firmados digitalmente.

Una de las soluciones que encontré era emparejar, fusionar, combinar, varios documentos PDF, y así cumplir con la limitación de número de archivos enviados.

PDFsam Basic nos permite, en esta versión gratuita y sin añadir marcas de agua, 

"dividir, fusionar, rotar, mezclar y extraer páginas de archivos PDF con PDFsam Basic, fuente libre y abierta, en casa o en el trabajo. Sus documentos PDF se mantienen privados en su ordenador, sin necesidad de cargarlos a un servicio de terceros."

Se encuentra disponible para los sistemas operativos

  • Mac OS
  • Linux Paquete Deb para distribuciones Linux basadas en Debian (.deb ) Archivo portable (.tar.gz )
  • Windows
Los requisitos del sistema son:
  • Sistema operativo de 64 bits, pero también disponen de versiones para 32 bits
  • 256MB of RAM
  • 70MB o más de espacio en disco

PDFsam Basic

  • Combinar
  • Dividir
  • Mezcla alterna
  • Dividir por marcadores
  • Rotar
  • Extraer páginas de documentos PDF
  • Dividir por tamaño

PDFsam Basic Combinar



Es una aplicación muy sencilla de manejar y con un diseño agradable y configurable.
Si quieres más funciones, disponen de versiones de pago, que podrás encontrar en su página oficial

Extraer tablas de datos en documentos PDF

Los archivos PDF se han vuelto muy populares a la hora de compartir documentos, son multiplataforma, su contenido no se desvirtualiza a la hora de ser visualizados, no es posible posible alterar su contenido y es muy complicado la extracción de datos.


Tabula es un programa multiplataforma que nos facilitará la extracción de tablas de archivos PDF y podremos extraerlas en formato texto o CSV (Valores Separados por Comas) y así exportarlo a una hoja de cálculo, para poder editarla.

Los datos podrán ser extraídos siempre y cuando sean texto incrustados. No es posible exportar tablas si han sido añadidas al PDF como imágenes.

Descargamos la versión correspondiente a nuestro sistema operativo. Al realizar la descarga del archivo comprimido nos encontraremos con un ejecutable para la plataforma JAVA.

Una vez ejecutado nos creará un servicio web al que accederemos mediante nuestro navegador a la dirección:

http://localhost:8080/


Añadiremos el archivo del que queremos extraer la tabla. Podremos seleccionarla o permitir que el propio programa localice aquellas tablas de las que podremos obtener sus datos


Previsualizaremos la tabla que hemos obtenido y nos permitirá exportarlo en el formato adecuado. Para importarlo o incorporarlo a, por ejemplo, una hoja de cálculo


Año,Marca,Modelo,Descripción,Precio

1997,Ford,E350,"ac, ABS, moon",3000.00

1999,Chevy,Venture,Extended Edition,4900.00

1999,Chevy,Venture,"Extended Edition, Very Large",5000.00

1996,Jeep,Grand Cherokee,"MUST SELL! air, moon roof, loaded",4799.00

En mi caso he extraído la tabla contenida en el documento PDF y la exportado en un archivo CSV para importarlo a una hoja de cálculo mediante la suite Libre Office.