Page 262 - 捷運技術 第46期
P. 262

256                       楊士林、劉惠美、張巧玲  建構捷運整體資訊檢索平台



                        不同系統支援整合檢索系統的方式不同,整合檢索系統必須依照連線需要支援不
                    同的通訊方式與資料交換格式。包括 HTTP、FTP、FILE、UNC(Universal Naming

                    Convention)等格式及各種異質資料庫。
                 3. 支援檔案常用的檔案格式
                        支援檔案各種常用的檔案格式,包括HTML、TXT、OFFICE 格式、PDF及OCR
                    (Optical character  recognition)檔等。
                 4. 支援檔案關聯檢索

                        支援檔案關聯檢索,包括File in DB、Field in DB、Url in DB及HTML內嵌檔案等等。
                 5. 檢索功能(Search Functionality)
                        整合檢索系統提供單一介面進行搜尋,需要解決不同系統所提供之索引對照,介
                    面中之各項檢索所對應的欄位範圍必須能夠依照各系統之特色進行適當的設定。整合
                    檢索系統策略上雖講求簡易操作與使用,但是在簡易操作的同時也必須考慮提供讓檢

                    索結果更加精確或回收率高的需求。一般檢索系統常見的布林邏輯運算、詞彙對照、
                    剔除字、萬用字元等,在整合檢索過程中仍舊不應被忽略。
                 6. 記錄檢索歷程與設定(User Interaction)
                        記錄檢索歷程與設定分兩層次來看,一是機構層次,另一則是檢索者個人的檢索
                    記錄。以機構層次來看,系統要能夠記錄不同(群組)使用者,使用各項資源以及使
                    用各項資源的歷程,以利管理之需求。從個人層次來看,檢索過程系統必須記錄檢索

                    者進行之檢索,檢索者並可以依照檢索需求處理檢索結果。
            (三) 系統構想
                 搜尋引擎雖然可檢索結構性與非結構性資料,但各資料源的資料欄位或METADATA、
            權限與連接方式沒有一致的共用標準,因此搜尋範圍僅侷限於同類型的資料源,無法滿足本
            局整體查詢的需求。

                 幾經思索提出新的構想,使用VIEW來規範資料欄位透通異質資料庫,配合具備文字探
            勘(Text Mining)技術的搜尋引擎,啟動Indexer Server索引作業,建立涵蓋資料庫、網頁、
            網路磁碟機的索引字典(知識倉儲清單),然後呼叫Searcher API查詢索引字典,達到各資
            料源整合的目的,以建構本局的整體查詢檢索平台(圖5)。經與搜尋引擎軟體廠商討論後
            確認該構想確實可行,但須配合客製化修改搜尋引擎的核心程式。

























                                              圖5 搜尋引擎整合資料源示意圖
   257   258   259   260   261   262   263   264   265   266   267