OCR (Optical Character Recognition) adalah sebuah
sistem komputer yang dapat membaca huruf, baik yang berasal dari sebuah
pencetak (printer atau mesin ketik) maupun yang berasal dari tulisan tangan.
Adanya sistem pengenal huruf ini akan meningkatkan fleksibilitas ataupun
kemampuan dan kecerdasan system komputer. Dengan adanya sistem OCR maka user
dapat lebih leluasa memasukkan data karena user tidak harus memakai papan ketik
tetapi bias menggunakan pena elektronik untuk menulis sebagaimana user menulis
di kertas. Adanya OCR juga akan memudahkan penanganan pekerjaan yang memakai
input
tulisan seperti penyortiran surat di kantor pos, pemasukan data buku di
perpustakaan, dan lain-lain. Adanya sistem pengenal huruf yang cerdas akan
sangat membantu usaha besar-besaran yang saat ini dilakukan banyak pihak yakni
usaha digitalisasi informasi dan pengetahuan, misalnya dalam pembuatan koleksi
pustaka digital dan koleksi sastra kuno digital. OCR dapat dipandang sebagai
bagian dari pengenal otomatis yang lebih luas yakni pengenal pola otomatis
(automatic pattern recognition). Dalam pengenal pola otomatis, sistem pengenal
pola mencoba mengenali apakah citra masukan yang diterima cocok dengan salah
satu citra yang telah ditentukan. Sistem ini misalnya dipakai untuk mendeteksi
sidik jari, tanda tangan, bahkan wajah seseorang. Ada banyak pendekatan yang
dapat dipakai untuk mengembangkan pembuatan pengenal pola otomatis antara lain
memakai pendekatan numerik, statistik, sintaktik, neural dan, aturan produksi
(rule-based). Secara umum metode-metode tersebut dapat digolongkan menjadi dua
kelompok metode yakni metode berbasis statistik dan metode berbasis struktur.
Dalam metode yang berbasis statistik, setiap pola ditransformasi ke dalam
vektor yang memakai ukuran dan karakteristik tertentu. Karakteristik ini
seringkali lebih bersifat statistik misalnya distribusi pixel ataupun jarak
pixel. Sedang dalam metode yang berbasis struktur, setiap pola yang diproses
dinyatakan sebagai gabungan beberapa struktur elementer. Pengenalan selanjutnya
dilakukan dengan mencocokkan komposisi struktur elementer dengan struktur yang
sudah disimpan memakai aturan tertentu misalnya memakai pendekatan teori bahasa
formal dan automata. Adapun software yang dapat mendukung teknik OCR adalah
sebagai berikut :
a.
ExperVision TypeReader dan OpenRTK
b.
ABBYY FineReader
c.
CuneiForm
d.
Puma.NET
e.
Microsoft Office Document Imaging
f.
Microsoft Office OneNote 2007
g.
Alt-N Technologies'
h.
RelayFax Network Fax Manager
i.
SmartScore
j.
Tesseract
k.
GOCR
Tidak ada komentar:
Posting Komentar