Impostazioni avanzate per PDF in Excel e conversione online

 In Blog

La pratica di estrazione di dati da PDF online è molto popolare tra i professionisti che lavorano con l’inserimento dati, le piccole imprese e molti altri settori verticali. Tipicamente gli utenti hanno bisogno di un convertitore per estrarre una varietà di dati in PDF. La gamma include da PDF a Excel online per PDF in XML e molti altri, tra cui PDF in formato CSV, PDF a HTML, PDF a testo e PDF in JPG. In particolare, se si considera la conversione di PDF in Excel on-line abbiamo scoperto che la maggior parte dei servizi on-line limitano la libertà degli utenti di decidere i dettagli della conversione.

In questo breve articolo viene descritto come funziona il nostro convertitore online da PDF in Excel, Tabex, le impostazione di conversione e come gli utenti possono migliorare i risultati di estrazione di dati per risparmiare tempo nel processo.

Per caricare un file o più su Tabex, verrà offerta un intera area  per l’upload del file. Per accedervi l’utente non dovrà ancora effettuare il login. Passando col cursore su ogni file, apparirà il bottone “opzione”. È necessario fare clic su questo file se si vuole accedere al convertitore di PDF in Excel Tabex e alle impostazioni avanzate.

Dopo aver fatto clic sulla scheda del file, apparirà una nuova barra con un numero di comando di pulsanti di azione in alto  nella pagina come appare nell’immagine successiva. La barra delle impostazioni avanzate vale sempre per il file del gruppo di file selezionati in un determinato momento.

PDF_conversion_to_Excel_online_advanced_settings

L’utente può impostare in quale intervallo di pagina il documento dovrebbe essere elaborato e quali no. Per fare questo date un’occhiata alle immagini qui sotto. Selezionare “Select page” e inserire l’intervallo di pagina che vi interessa. Questa particolare impostazione applicata a tutti i formati di output, ovvero da PDF a Excel, PDF a XML, PDF a csv, pdf in html e pdf in testo. Il valore predefinito è sempre impostato su “tutte le pagine”.

PDF_conversion_to_Excel_online_advanced_settings-select-pages

L’impostazione della lingua in realtà si applica solo ai file che richiedono l’elaborazione OCR.

Una flessibilità molto importante nella creazione di output di file XLS è quella che dovrebbe interessare tutti i formati. Il convertitore di PDF in Excel Tabex offre la possibilità di estrarre le tabelle di dati da PDF ed esportarle in due modi diversi. L’output può essere sintetizzata in un unico foglio di lavoro MS Excel o ogni singola tabella estratta può essere aggiunta a un foglio di calcolo Excel. Le impostazioni di default consiglia di esportare tutti i dati estratti in un singolo file foglio di Excel. Questa particolare impostazioni si applica solo per la conversione di PDF in Excel e non in pdf a XML o altre conversioni.

OCR Language Settings UI

 

PDF_conversion_to_Excel_online_advanced_settings-select-single-or-multiple-sheets

Le impostazioni OCR dei servizi offerti da Tabex non sono così ovvii. Le impostazioni OCR permettono all’utente di decidere quale algoritmo utilizzare per elaborare i file con una grande quantità di pagine. Generalmente file di grandi dimensioni hanno una combinazione di pagine che sono state scansionate e le pagine che sono state generati in digitale. Il trattamento API Tabex deve decidere se inviare un file a un OCR. L’elaborazione OCR è in genere presume un alto consumo di risorse se si vuole ridurre al minimo il tempo da spendere per analizzare i file che non hanno bisogno di essere convertiti in OCR. In questo caso offriamo tre opzioni: nella prima, il file che abbiamo scelto attraverso una determinazione automatica che ci consiglia quali file hanno bisogno dell’ OCR e quelli che non ne avranno mai bisogno. L’opzione “never option” significa invece che il vostro progetto bypasserà sempre l’OCR. Infine, l’approccio “per ogni pagina” è ottimo per assicurarsi che nessuna pagina che necessiti l’OCR passi inosservata.

PDF_conversion_to_Excel_online_advanced_settings-select-OCR-Settings

Il separatore decimale US è generalmente un puntino mentre per le migliaia è tipicamente una virgola. La conversione è esattamente opposta in Europa. Tabex vi da anche la possibilità di impostare la conversione degli Stati Uniti.

PDF_conversion_to_Excel_online_advanced_settings-select-OCR-Language

 

 Infine Tabex vi da la possibilità di ripristinare tutte le impostazioni e cancellare file, come mostrato nella figura di seguito.

PDF_conversion_to_Excel_online_advanced_settings-select-Reset-settings-or-remove-file

This post is also available in: Inglese Spagnolo

Recommended Posts

Leave a Comment