什麼是 OCR?

OCR 是光學文字辨識,是從英文 Optical Character Recognition 翻譯而來,而OCR取自這三個英文字的第一個英文字,OCR的主要目的是將圖像中文字轉化成電腦能夠是別的電子訊號。

OCR 的主要辨識流程

假設您的文件,以經利用相機、掃描器硬體設備等輸入到電腦系統中,並且該文件來源無特別污損,文字無模糊或是破損的狀況,OCR 的軟體處理流程主要如下列所示:

  1. 分割單字:
    OCR 會將所有的文字、數碼和標點符號切割出來。
     
  2. 單字細線化:
    意即將單字的線條變細,讓字體剩下骨架,藉以消除可能造成誤判與不必要的資料量。
     
  3. 擷取單字的特徵點:
    OCR 運用各種方法來擷取單字最特別、最明確的部分,可以用來辨明與其他單字不同的地方,來對這些只剩下個架子的字體做編碼的工作,一般來說,每一個字都 同時採用幾種特徵擷取的技術。
     
  4. 比對:
    OCR 軟體有一套文字的資料庫,當一個字被辨識與編碼之後,會向這個文字資料庫來進行比對的動作,來察看這個編譯過後的訊號,所對應的最接近文字為何,而這個文字即是最後所辨識出來的結果。
     
  5. 輸出辨識結果:
    最後每一個文字都辨識完了之後,即產出這一次的 OCR 的文字檔案。

 

貼心小叮嚀:

  • 如果您的使用重點在於較高的文字辨識效率,建議您在輸入數位化的文件時,採用黑白模式(Text mode),較高的解析度(300 dpi以上)。
  • 假使您的使用重點在於保留圖文一致的文件,並且利於後續的搜索,建議您在數位化文件時,直接選擇產出 Searchable PDF 檔案格式,您可以兼顧「視覺」與「搜尋」兩個目的。

OCR 的應用範圍

  • 建立各種知識資料庫:輸入大量各種報紙、中文書刊、雜誌等。
  • 節省人力個別打字的時間:如早期出版或發行的文章及圖書,利用 OCR 輸入至電腦,文字也可重新編排。
  • 結合語音輸出:將文字利用 OCR 辨識之後,利用電腦的語音輸出,可以讓不識字、視覺障礙、年長使用者以聽覺方式聽到文章。如:Plustek Book Reader.
  • 文字翻譯:使用者可以利用 OCR,將希望翻譯的文字段落或文章輸入電腦,另外再配合翻譯的軟體等,快速地將文字翻譯成其他語言。

 資料來源:PLUSTEK 公司

 發布時間:2009年9月12日

相關文章

網站資料搜尋

  •    

pagetop