OCR 是光學文字辨識,是從英文 Optical Character Recognition 翻譯而來,而OCR取自這三個英文字的第一個英文字,OCR的主要目的是將圖像中文字轉化成電腦能夠是別的電子訊號。
假設您的文件,以經利用相機、掃描器硬體設備等輸入到電腦系統中,並且該文件來源無特別污損,文字無模糊或是破損的狀況,OCR 的軟體處理流程主要如下列所示:
- 分割單字:
OCR 會將所有的文字、數碼和標點符號切割出來。
- 單字細線化:
意即將單字的線條變細,讓字體剩下骨架,藉以消除可能造成誤判與不必要的資料量。
- 擷取單字的特徵點:
OCR 運用各種方法來擷取單字最特別、最明確的部分,可以用來辨明與其他單字不同的地方,來對這些只剩下個架子的字體做編碼的工作,一般來說,每一個字都 同時採用幾種特徵擷取的技術。
- 比對:
OCR 軟體有一套文字的資料庫,當一個字被辨識與編碼之後,會向這個文字資料庫來進行比對的動作,來察看這個編譯過後的訊號,所對應的最接近文字為何,而這個文字即是最後所辨識出來的結果。
- 輸出辨識結果:
最後每一個文字都辨識完了之後,即產出這一次的 OCR 的文字檔案。

貼心小叮嚀:
- 如果您的使用重點在於較高的文字辨識效率,建議您在輸入數位化的文件時,採用黑白模式(Text mode),較高的解析度(300 dpi以上)。
- 假使您的使用重點在於保留圖文一致的文件,並且利於後續的搜索,建議您在數位化文件時,直接選擇產出 Searchable PDF 檔案格式,您可以兼顧「視覺」與「搜尋」兩個目的。
- 建立各種知識資料庫:輸入大量各種報紙、中文書刊、雜誌等。
- 節省人力個別打字的時間:如早期出版或發行的文章及圖書,利用 OCR 輸入至電腦,文字也可重新編排。
- 結合語音輸出:將文字利用 OCR 辨識之後,利用電腦的語音輸出,可以讓不識字、視覺障礙、年長使用者以聽覺方式聽到文章。如:Plustek Book Reader.
- 文字翻譯:使用者可以利用 OCR,將希望翻譯的文字段落或文章輸入電腦,另外再配合翻譯的軟體等,快速地將文字翻譯成其他語言。
資料來源:PLUSTEK 公司