Office 內附的免費 OCR 文字辨識軟體

還在花大錢購買昂貴不實用的文字辨識軟體嗎?
其實微軟 Office 2003 附帶了一個文字掃描辨識軟體,
只要是標準字體,辨識度達到 95%以上。

安裝完 Office 2003 之後,到開始功能表裡的程式集裡,
找到【Microsoft Office】→【Microsoft Office 工具】,
裡面可以看到一個「Microsoft Office Document Imaging」。
這個就是微軟 Office 2003 裡面附帶的 OCR 文字辨識軟體。

Microsoft Office Document Imaging 只支援 mdi 和 tif 格式的圖檔,
所以使用掃描器掃描後一定要存成 tif 檔才能被辨識,
或使用 Office 2003 附送的掃描程式「Microsoft Office 文件掃描」,
直接將檔案存成 mdi 格式,只是它的功能很陽春,
可能會讓掃描器一些特殊功能無法發揮。

那如何掃描圖片裡的文字?
首先使用掃描器將書本裡的頁面掃描完成,
在設定時盡量將畫面簡單化,什麼是簡單化?
就是將不必要得東西去掉,加強文字清晰度,
比如加強對比,可以加強文字的黑色,刷淡頁面上的污漬,
掃描模式使用文件灰階模式,這樣都可以去掉一些不必要得東西,
再來就是掃描解析度至少600以上,如果效果還是不好,
在影像軟體裡,或者掃描器掃描介面有支援的話,
使用銳利化之類的工具,將強文字邊緣的清晰度,
這樣都有助於文字辨識軟體在辨識上的成功率。
如下圖(圖一是未處理前,圖二是處理過後):
圖一
scansoft.01.gif
圖二
scansoft.02.gif

在 Microsoft Office Document Imaging開啟圖檔,
接著圈選出要掃描的範圍後,選擇【工具】→【使用 OCR 辨識文字】,
完成後,再選【工具】→【傳送文字到 Word...】,如下圖:
scansoft.03.gif

如果是掃描整個頁面直接選「傳送文字到 Word...」就可以了。
如下圖:
scansoft.04.gif


如果找不到這個小工具,請重新安裝Office,並選擇完整安裝的選項。

arrow
arrow
    全站熱搜

    ALVIN 發表在 痞客邦 留言(1) 人氣()