什麼是 OCR? 名詞解釋-蘋果網-

OCR 是光學文字辨識，是從英文 Optical Character Recognition 翻譯而來，而OCR取自這三個英文字的第一個英文字，OCR的主要目的是將圖像中文字轉化成電腦能夠是別的電子訊號。

OCR 的主要辨識流程

假設您的文件，以經利用相機、掃描器硬體設備等輸入到電腦系統中，並且該文件來源無特別污損，文字無模糊或是破損的狀況，OCR 的軟體處理流程主要如下列所示：

分割單字：
OCR 會將所有的文字、數碼和標點符號切割出來。
　
單字細線化：
意即將單字的線條變細，讓字體剩下骨架，藉以消除可能造成誤判與不必要的資料量。
　
擷取單字的特徵點：
OCR 運用各種方法來擷取單字最特別、最明確的部分，可以用來辨明與其他單字不同的地方，來對這些只剩下個架子的字體做編碼的工作，一般來說，每一個字都同時採用幾種特徵擷取的技術。
　
比對：
OCR 軟體有一套文字的資料庫，當一個字被辨識與編碼之後，會向這個文字資料庫來進行比對的動作，來察看這個編譯過後的訊號，所對應的最接近文字為何，而這個文字即是最後所辨識出來的結果。
　
輸出辨識結果：
最後每一個文字都辨識完了之後，即產出這一次的 OCR 的文字檔案。

　

貼心小叮嚀：

如果您的使用重點在於較高的文字辨識效率，建議您在輸入數位化的文件時，採用黑白模式（Text mode），較高的解析度（300 dpi以上）。
假使您的使用重點在於保留圖文一致的文件，並且利於後續的搜索，建議您在數位化文件時，直接選擇產出 Searchable PDF 檔案格式，您可以兼顧「視覺」與「搜尋」兩個目的。

OCR 的應用範圍

建立各種知識資料庫：輸入大量各種報紙、中文書刊、雜誌等。
節省人力個別打字的時間：如早期出版或發行的文章及圖書，利用 OCR 輸入至電腦，文字也可重新編排。
結合語音輸出：將文字利用 OCR 辨識之後，利用電腦的語音輸出，可以讓不識字、視覺障礙、年長使用者以聽覺方式聽到文章。如：Plustek Book Reader.
文字翻譯：使用者可以利用 OCR，將希望翻譯的文字段落或文章輸入電腦，另外再配合翻譯的軟體等，快速地將文字翻譯成其他語言。

資料來源：PLUSTEK 公司

發布時間：2009年9月12日

相關文章

2026年4月17日

【蘋果新聞】GoPro發表1吋感光元件 Mission 1系列正

2026年3月26日

【蘋果新聞】Auditel廣告採用Blackmagic PYXIS 12K拍攝

2024年9月22日

【蘋果新聞】New Territory Media使用ATEM SDI Extreme ISO現場直播

網站資料搜尋

pagetop