Page 83 - 捷運技術 第32期
P. 83
捷運技術半年刊 第 32 期 94 年 2 月 73
5.2 影像文字全文檢索
當文字自影像擷取出來,即可應用於檢索上,配合搜尋引擎提供使用者全文檢索功能,
讓使用者更有效率的找尋想要的資料。因不同的資料大小與內容,應配合不的搜尋方式及表
現方法;例如,一般新聞每則多含有一明顯主題,文字量約填滿半頁或一頁 A4 紙;每篇論
文(Paper)多含一些關鍵辭,文字量約 10 頁;但營建工程之技術文件(Tech Doc)則主題與關鍵
辭甚多,文字量更常長達 200 頁以上,故我們的全文檢索提供整本技術文件與每頁出現量統
計與局部區域展示及全頁標示三種方式給使用者選用(圖 14)。
此外,配合人工智慧技術的導入,產生之分類查詢、技術文件知識地圖及主題式知識索
引地圖,提供使用者更多元與有效率之選擇(圖 5、圖 6)。
圖 14 影像文字全文檢索之應用(以技術報告為例)
六、討論與結論
一、知識是營建工程產業除人、機、料以外之非消耗性、越用越豐富的第四大資源,正確的
引進知識管理可大幅提昇營建工程業創新力與競爭力。
二、營建工程產業蒐集分散之外顯技術資料及探勘工程師內隱經驗雖較其他行業困難,但仍
為營建工程業界推展知識管理最基本、最重要、技術最成熟之起步工作。
三、以掃描方式產生「數位影像文字頁」之過程,文字辨識率無法達到100%,常遭初試者質
疑,但若考慮影像辨識率隨辨識技術提升可重新辨識、部份軟體已提供電子檔直接轉換
成影像與文字,想必認定「數位影像文字頁」為目前營建工程業界最可行與適用之最佳