risposta-alla-domanda-sullo-sviluppo-web-bd.com

Visualizzatore pdf CLI per linux

Ehi, da un po 'di tempo, sto cercando un visualizzatore di pdf per la riga di comando.

Dato che mi piace lavorare senza X su Linux e spesso su una macchina remota, vorrei avere uno strumento per leggere i pdf. Ci sono molti programmi grafici davvero buoni (evince, okular, acroread, ...) per fare il lavoro, quindi ho pensato che ci dovrebbe essere almeno uno strumento decente in modalità testo. Ma non ne conosco nemmeno uno schifoso!

Attualmente, avvio X solo per leggere i pdf o uso pdftohtml + lynx. Tuttavia, quest'ultimo non produce un risultato molto buono e la maggior parte dei documenti è illeggibile, soprattutto se contiene una formula matematica.

Google è pieno di persone che dicono che non è possibile o che suggeriscono la versione pdftohtml.

Mi rendo conto che questa non è esattamente una domanda di programmazione, ma attualmente sto prendendo in considerazione l'idea di avviare un progetto per attuare un tale programma, a meno che non ce ne sia già uno valido.

Grazie per eventuali suggerimenti.

57
bitmask

Ciao, penso che non sia necessario scrivere un programma per il tuo scopo, intendo leggere il file pdf in modalità console perché il comando "less" lo fa già per te. Quindi usalo e divertiti.

meno "il nome del file pdf"

73
Kasra

Ok, hai chiesto di conoscere anche quelli "schifosi". Eccone due (decidi te stesso riguardo alle loro rispettive schifezze):

Primo: Ghostscript'stxtwrite dispositivo di output

 gs \
   -dBATCH \
   -dNOPAUSE \
   -sDEVICE=txtwrite \
   -sOutputFile=- \
   /path/to/your/pdf

Secondo: XPDFpdftotext Utilità CLI (migliore di Ghostscript):

 pdftotext \
   -f 13 \
   -l 17 \
   -layout \
   -opw supersecret \
   -upw secret \
   -eol unix \
   -nopgbrk \
   /path/to/your/pdf
   - |less

Verrà visualizzato l'intervallo di pagine 13 (fprima pagina) a 17 (la pagina), preservare il layout di una doppia password protetta denominata PDF (utilizzando password utente e proprietario segreto e supersecret), con la convenzione EOL Unix, ma senza inserire interruzioni di pagina tra PDF, inviate tramite meno ...

pdftotext -h visualizza tutte le opzioni della riga di comando disponibili.

Naturalmente, entrambi gli strumenti funzionano solo per le parti di testo dei PDF (se ne hanno). Oh, e anche la formula matematica non funzionerà troppo bene ... ;-)


Modifica: Ho sbagliato a digitare il comando sopra (originariamente usando pdftops invece di pdftotext).

17
Kurt Pfeifle
5
Giacomo

A proposito, sono sempre nella stessa situazione e uso mc (comandante di mezzanotte) che gestisce molto bene il pdf del testo ... Basta vedere il file (F3) in mc

5
mlwn

C'è anche il verde PDF visualizzatore. C'è una demo su YouTube .

4
user287424

fbpdf è un visualizzatore di pdf framebuffer.

C'è anche un fork, jfbpdf , ma al momento non sono in grado di farlo funzionare.

3
user3714903

Funzionerebbe solo se il tuo documento PDF è strutturato, ovvero è un PDF con tag = documento.

Ciò è necessario per ottenere l'ordine di lettura corretto degli oggetti di testo nel documento.

Taggato PDF ti consentono anche di reindirizzare il documento anche se non sono a conoscenza di alcuno strumento che lo faccia con l'output della riga di comando.

0
Dirk Vollmar