2013年10月5日 星期六

什麼是 Information Retrieval (資訊檢索)

最近有個同學問我,什麼是資訊檢索,這讓我回想起一年前,我也問過柯老師同樣的問題,那個時候的我對這方面也完全沒有概念。

在經過一年的訓練,修過陳老師與其他相關課程之後,在這位同學問我的當下,我依然沒有辦法以自己的口吻告訴他我心目中的資訊檢索。我舉了幾個例子,描述了一些資訊檢索中會用到的方法、說了一些資訊檢索上會遇到的問題,但是卻很片段,不是一個有整理過的想法。這樣說起來,現在的我比起一年前的我,好像只是多學了一些方法,卻不能靈活運用,似乎沒有甚麼太大進步?不過幸好,在經過幾天斷斷續續思考這個問題,漸漸浮現出自己的想法,也許不一定正確,也許離正確答案誤差很大,但是起碼,這是我自己的想法,我對這段時間的學習可以有個交代。

回到正題,什麼是資訊檢索?資訊檢索就是為了幫助使用者找到他想要的資料的方法。資訊檢索可以是 google 的關鍵字搜尋、最新的以圖搜圖、以錄音找歌、語音辨識、是圖書館的圖書編目,可以是資料庫的搜尋語句、也可以是軍隊裏面的組織編成。在所有資訊檢索當中,最特別的一個是所謂的 Boolean Model,也就是資料庫所使用的方法。所謂的boolean model,對於所有的資料只有有找到跟沒有找到的分別。但是這對於現在的應用而言,就算是圖書館的館藏搜尋系統,都不夠用,原因就在於現在的資料量太大,我們找到的東西往往都是一大批資料,因此才會有它各式各樣的方法,希望能夠找到更精準、更有價值的資料。

2013年5月28日 星期二