Cara OCR Dokumen PDF

Saat Anda memindai dokumen kertas ke PDF, Anda secara efektif membuat foto dokumen tersebut dan isinya. Dalam praktiknya, ini berarti Anda tidak dapat mencari atau memilih teks apa pun dari PDF yang dihasilkan jika Anda ingin menyalin atau membuat anotasi. Alasannya adalah komputer Anda tidak mengenali teks dalam file PDF gambar yang dipindai itu.

Agar PDF Anda dapat dicari atau mengonversinya ke format file lain untuk diedit dan diproses seperti Word dan Excel, Anda harus menjalankan OCR terlebih dahulu. OCR adalah singkatan dari Optical Character Recognition. Teknologi ini memungkinkan komputer Anda mengenali dan membaca teks yang terkunci di dalam gambar.

Biarkan kita menunjukkan kepada Anda bagaimana Anda dapat dengan cepat OCR PDF yang Anda pindai.

Langkah pertama adalah mendapatkan konverter PDF OCR yang andal. Untuk tujuan panduan cara ini, kita menggunakan Able2Extract Professional, perangkat lunak desktop OCR PDF. Anda menginstalnya seperti kebanyakan alat desktop lainnya di komputer Anda, mulai dan buka file PDF gambar Anda di dalamnya.

Langkah selanjutnya adalah menentukan apakah Anda ingin menjalankan OCR di seluruh dokumen ( Pilihan Semua ) atau hanya satu area ( Pilih Area ). Kita memilih untuk OCR seluruh PDF.

Setelah menentukan pilihan, buka menu File dan pilih Convert to Searchable PDF.

Able2Extract akan dengan cepat melakukan OCR pada PDF Anda dan Anda kemudian dapat mencari dan memilih teks dari PDF Anda seperti yang Anda lihat pada tangkapan layar di bawah ini:

Untuk membuka kunci teks dari PDF gambar dan mengekspornya ke format yang dapat diedit seperti MS Word, setelah memilih konten seperti yang dijelaskan di atas, Anda perlu mengklik ikon Word Anda di toolbar utama Able2Extract di bawah Convert to File Type. Perangkat lunak melakukan OCR secara default dan mengekstrak teks dari file gambar.

Hasil konversi OCR adalah dokumen Word yang diformat dengan teks yang dapat diedit sepenuhnya. Dengan cara yang persis sama, Anda dapat mengonversi tabel PDF yang dipindai menjadi Excel atau presentasi gambar PDF menjadi PowerPoint, dan banyak lagi.

Fitur Utama dari Able2Extract Professional OCR PDF

Able2Extract adalah solusi PDF lengkap untuk menangani PDF. Ini adalah perangkat lunak lintas platform yang tersedia untuk distribusi Mac, Windows, dan Linux. Terlepas dari kemampuannya untuk OCR PDF, ini memungkinkan user untuk:

  • Buat PDF biasa dan dilindungi password dari semua format file yang dapat dicetak.
  • Konversi kustom PDF ke Excel: atur tabel sesuai keinginan user sebelum konversi, termasuk opsi untuk melihat pratinjau hasil konversi.
  • Edit PDF secara instan: tambahkan atau hapus konten, edit informasi pribadi dan sensitif, pisahkan dan gabungkan PDF, dll.
  • Batch mengkonversi PDF.
  • Anotasi PDF dengan selusin jenis anotasi yang berbeda.
  • Isi dan edit formulir PDF untuk pengumpulan dan distribusi data yang mudah.
  • Tambahkan penomoran Bates khusus untuk memudahkan identifikasi dan pengambilan informasi PDF.
  • Konversi PDF asli dan gambar ke lebih dari 10 format file termasuk MS Office, AutoCAD, HTML, dll.

Meskipun ini bukan perangkat lunak yang sepenuhnya gratis, ia menawarkan uji coba tujuh hari yang dapat Anda unduh dari Investintech.com

Pengarang: Investintech