數(shù)據(jù)挖掘----圖書館員應(yīng)掌握的基本工具
王綠園 康梅英 廣州解放軍體育學院 510502
摘 要:本文揭示了在未來數(shù)字圖書館中圖書館員進行信息服務(wù)的一種方式;論述了數(shù)據(jù)挖掘和WEB挖掘的基本原理和方法;強調(diào)圖書館員應(yīng)掌握數(shù)據(jù)挖掘這項新技術(shù)的必要性。
關(guān)鍵詞:數(shù)據(jù)挖掘、WEB、INTERNET、信息服務(wù)、圖書館員
一、引言
隨著信息時代的到來、INTERNET技術(shù)的發(fā)展,圖書館未來的功能變得越來越多樣化。由于WEB技術(shù)的巨大成功,人們越來越多地依靠INTERNET來獲取知識、信息。顯然,人們到圖書館的次數(shù)和時間已越來越少,總有一天,人們再也不會親自跑到圖書館去借一本書或咨詢某個問題。面臨著如此巨大的挑戰(zhàn),從事圖書館工作的人們提出了數(shù)字圖書館的設(shè)想。經(jīng)過艱苦的研究已成功地建立了數(shù)字圖書館。數(shù)字圖書館是一個標準的電子信息基礎(chǔ)設(shè)施,它采用分布數(shù)據(jù)存儲,用戶可以通過各種鏈接和操作在一個較大的地域范圍內(nèi)搜索和檢索出自己所需的信息,而且整個操作對用戶是開放的。也就是說,數(shù)字圖書館能夠把數(shù)據(jù)存儲在多個站點中,用戶只須一個簡單的操作就可從這些站點中搜索信息。數(shù)字圖書館是傳統(tǒng)圖書館在信息時代的發(fā)展,它不但包含了傳統(tǒng)圖書館的功能,還提供綜合的信息訪問服務(wù)。人們希望,數(shù)字圖書館將成為未來圖書館的信息中心和樞紐。
但是,從網(wǎng)絡(luò)技術(shù)角度來看,數(shù)字圖書館與其它WEB信息源沒有兩樣,它們都是建立在INTERNET上的信息站點。從用戶的角度來看,他們關(guān)心的是從INTERNET上獲得信息和知識,他們不能體會到你是數(shù)字圖書館還是INTERNET上的一般站點。但是要從成千上萬的WEB信息站點中檢索到有用的信息是不容易的,有時甚至是不可能的,更何況信息的索要者往往沒有多少時間在茫茫的數(shù)據(jù)海洋中漫游。我們知道在數(shù)字圖書館中,圖書館員是信息專家,他們是信息組織者、信息生產(chǎn)者、信息服務(wù)者和信息管理者。正是通過圖書館員的信息服務(wù)活動使數(shù)字圖書館有別于其它信息站點。那么,圖書館員特別是院校圖書館中的圖書館員在二十一世紀的數(shù)字圖書館中應(yīng)如何進行信息服務(wù)?圖書館員須掌握什么先進技術(shù)工具為用戶服務(wù)?這是當前圖書館界應(yīng)該研究的重要問題。
二、技術(shù)的選擇
WEB是一個非常成功的信息系統(tǒng)。這個系統(tǒng)為信息在全球范圍發(fā)布和傳播提供了機會,它允許任何人在任何地點任何時間傳播和獲取信息。WEB的非結(jié)構(gòu)化信息傳播和獲取方式引發(fā)了信息爆炸。大量的非結(jié)構(gòu)化的信息分散在整個INTERNET中。大量信息在給人們帶來方便的同時也帶來了許多問題:信息過量,難以消化;信息真假難以辨識;信息安全難以保證;信息形式不一致,難以統(tǒng)一處理。在信息的海洋中,即使是最先進的 搜索引擎也只能從1/3可以索引的WEB站點中獲取信息。人們開始提出一個新的口號:“要學會拋棄信息”。人們開始考慮:“如何才能不被信息淹沒,而是從中及時發(fā)現(xiàn)有用的知識、提高信息利用率?”事實上,作為一個非專業(yè)的信息管理人員,要從茫茫的信息海洋中獲取本專業(yè)最新、最權(quán)威知識和較為全面的信息,并從中得到有用的知識幾乎變得不可能。要知道,各高等院校或研究所里的專家教授們由于研究課題計劃的緊迫,他們急需本專業(yè)領(lǐng)域的最新最權(quán)威的知識和信息,他們沒有時間在成千上萬的站點中的數(shù)不清的頁面中查找所需的信息。所以在信息的提供者與信息的消費者之間應(yīng)有一個中間環(huán)節(jié),通過這個環(huán)節(jié),信息消費者能夠快捷方便地得到想要的信息,正是這種迫切需要為圖書館員提供了展現(xiàn)才華的機會。圖書館員們運用信息管理技能,直接為用戶提供有用信息。圖書館員們應(yīng)抓住機會,認真考慮在INTERNET環(huán)境中,如何使其服務(wù)領(lǐng)域得以擴寬,從桌面咨詢服務(wù)擴展到基于WEB信息空間電子咨詢服務(wù)。
WWW是眾多情報類型中的一種,并且具有極大的特殊性。它的信息是分布在全球范圍內(nèi),并且隨時可變。這些分布在各地的信息允許任何人在任何地點任何時間傳播和獲取信息。為此,圖書館員必須選取某個工具來有效地組織和獲取WWW中的信息。傳統(tǒng)的搜索引擎根本不評估站點的內(nèi)容,而只是機械地識別WEB設(shè)計者提供的關(guān)鍵字,即使是最優(yōu)秀的搜索引擎也需要用戶親自訪問到不同的站點并對信息加以驗證。而WEB挖掘技術(shù)是克服這些缺點的最理想的工具。
三、數(shù)據(jù)挖掘和WEB挖掘
數(shù)據(jù)挖掘(Data Mining)是信息技術(shù)(IT)領(lǐng)域中最熱門話題之一。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。何為知識?從廣義上理解,數(shù)據(jù)、信息也是知識的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識。人們把數(shù)據(jù)看作是形成知識的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學的,也可以是非數(shù)學的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于信息管理,查詢優(yōu)化,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護。因此,數(shù)據(jù)挖掘是一門交叉學科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計、可視化技術(shù)、并行計算等方面的學者和工程技術(shù)人員,投身到數(shù)據(jù)挖掘這一新興的研究領(lǐng)域,形成新的技術(shù)熱點。當數(shù)據(jù)挖掘技術(shù)應(yīng)用于網(wǎng)絡(luò)環(huán)境下的WEB中就成為WEB挖掘(Web Mining),WEB挖掘可以廣義地定義為從WWW中發(fā)現(xiàn)和分析有用的信息。這個定義有兩方面的意義:一方面它描述了自動地從數(shù)以百萬計的WEB站點和在線數(shù)據(jù)庫中搜索和獲取信息和資料,這叫做WEB內(nèi)容挖掘(Web Content Mining);另一方面,發(fā)現(xiàn)和分析用戶訪問一個或多個站點和在線服務(wù)的模型叫做WEB使用挖掘(Web Usage Mining)。
WEB中的異構(gòu)型和非結(jié)構(gòu)化的數(shù)據(jù),使得發(fā)現(xiàn)、組織和管理信息變得非常困難。傳統(tǒng)的搜索、索引工具,諸如 Lycos, Alta Vista, WebCrawler, ALIWEB等,雖然它們都能為用戶提供一些方便,但它們都不提供結(jié)構(gòu)化數(shù)據(jù),也不提供分類、過濾和文檔翻譯等基本功能。近年來,研究人員正努力研究WEB內(nèi)容挖掘,開發(fā)智能化的信息檢索工具。基于代理的檢索方法正是這種智能化的信息檢索工具,它是一個人工智能系統(tǒng)。它可以代表某一特定用戶,自動地或半自動地發(fā)現(xiàn)和組織基于WEB的信息,它可以根據(jù)用戶的基本情況,自動檢索出用戶感興趣的信息,并組織和翻譯好這些信息。有些代理甚至可以自動學習用戶的愛好,并根據(jù)用戶的愛好為用戶檢索出相關(guān)信息。WEB內(nèi)容挖掘的另一種方法是基于數(shù)據(jù)庫的方法。這種方法是把WEB中異構(gòu)的非結(jié)構(gòu)化的數(shù)據(jù)集成和組織成結(jié)構(gòu)化的數(shù)據(jù),就像關(guān)系數(shù)據(jù)庫那樣,然后用標準的數(shù)據(jù)庫查詢機理和數(shù)據(jù)挖掘技術(shù)來訪問和分析這些信息。
WEB使用挖掘(Web Usage Mining)是發(fā)現(xiàn)用戶訪問模型(或稱為訪問習慣),它的數(shù)據(jù)是自動從每日的訪問日志等中收集到。WEB使用挖掘?qū)⒂脩艋厩闆r檔案非常關(guān)鍵。研究用戶在某個或多個服務(wù)器上的行為表現(xiàn),對改善WEB站點使其更有效地服務(wù)于用戶是非常必要的。
四、信息服務(wù)
WEB挖掘是一個前景非?春玫墓ぞ摺N覀冎,傳統(tǒng)的效率低下的搜索引擎檢索出的信息往往索引不完全、有大量的無關(guān)信息或沒有進行可靠性驗證。用戶能夠快速方便地從WEB中檢索出相關(guān)的可靠的信息是一個系統(tǒng)的最基本的要求。WEB挖掘不僅能夠從WWW的大量的數(shù)據(jù)中發(fā)現(xiàn)信息,而且它監(jiān)視和預測用戶的訪問習慣。這樣給設(shè)計人員在設(shè)計WEB站點時有更多的可靠的信息。WEB挖掘技術(shù)能夠幫助圖書館員在設(shè)計站點時朝著方便用戶、節(jié)省時間和高效率方向發(fā)展。WEB挖掘技術(shù)為圖書館員進行信息服務(wù)提供了先進的工具。有了這個工具,圖書館員能夠按照各個用戶的要求或習慣,為用戶組織更多、更好的高質(zhì)量信息。
例如;院校圖書館員們應(yīng)用WEB挖掘技術(shù)為本院校不同學科中的不同研究課題從WWW中檢索相關(guān)信息。該技術(shù)可以自動地檢索信息,并把信息按照課題領(lǐng)域進行分類,使它們更容易訪問。圖書館員可以通過為不同的課題領(lǐng)域建立一組特征,并以這些特征為基礎(chǔ)進行檢索和分類,從而保證得到的信息是可靠的和具有權(quán)威性的。由于WEB挖掘技術(shù)能夠自動地,不須人工干預地從WWW中發(fā)現(xiàn)和組織信息,從而使圖書館員只需花少量的時間來維護數(shù)據(jù)庫即可完成任務(wù)。用戶由于不需要花大量的時間來瀏覽成百上千的文檔,就可在相當短的時間里得到想要的信息而感到非常滿意。更重要的是,他們可以在任何時間訪問到世界任何地方的信息。事實上,這就是圖書館員把他們的咨詢服務(wù)從桌面轉(zhuǎn)移到INTERNET的具體工作表現(xiàn)。
五、結(jié)束語
在未來的數(shù)字圖書館中,圖書館員如何充分發(fā)揮其信息專家的作用,是我們每個圖書館員應(yīng)考慮的重要問題。數(shù)據(jù)挖掘技術(shù)是未來信息檢索的主要技術(shù)。為此,我們圖書館員應(yīng)該不斷地學習新技術(shù)、新方法,搞好信息服務(wù)工作,努力開拓,爭取成為真正的信息專家。
摘 要:本文揭示了在未來數(shù)字圖書館中圖書館員進行信息服務(wù)的一種方式;論述了數(shù)據(jù)挖掘和WEB挖掘的基本原理和方法;強調(diào)圖書館員應(yīng)掌握數(shù)據(jù)挖掘這項新技術(shù)的必要性。
關(guān)鍵詞:數(shù)據(jù)挖掘、WEB、INTERNET、信息服務(wù)、圖書館員
一、引言
隨著信息時代的到來、INTERNET技術(shù)的發(fā)展,圖書館未來的功能變得越來越多樣化。由于WEB技術(shù)的巨大成功,人們越來越多地依靠INTERNET來獲取知識、信息。顯然,人們到圖書館的次數(shù)和時間已越來越少,總有一天,人們再也不會親自跑到圖書館去借一本書或咨詢某個問題。面臨著如此巨大的挑戰(zhàn),從事圖書館工作的人們提出了數(shù)字圖書館的設(shè)想。經(jīng)過艱苦的研究已成功地建立了數(shù)字圖書館。數(shù)字圖書館是一個標準的電子信息基礎(chǔ)設(shè)施,它采用分布數(shù)據(jù)存儲,用戶可以通過各種鏈接和操作在一個較大的地域范圍內(nèi)搜索和檢索出自己所需的信息,而且整個操作對用戶是開放的。也就是說,數(shù)字圖書館能夠把數(shù)據(jù)存儲在多個站點中,用戶只須一個簡單的操作就可從這些站點中搜索信息。數(shù)字圖書館是傳統(tǒng)圖書館在信息時代的發(fā)展,它不但包含了傳統(tǒng)圖書館的功能,還提供綜合的信息訪問服務(wù)。人們希望,數(shù)字圖書館將成為未來圖書館的信息中心和樞紐。
但是,從網(wǎng)絡(luò)技術(shù)角度來看,數(shù)字圖書館與其它WEB信息源沒有兩樣,它們都是建立在INTERNET上的信息站點。從用戶的角度來看,他們關(guān)心的是從INTERNET上獲得信息和知識,他們不能體會到你是數(shù)字圖書館還是INTERNET上的一般站點。但是要從成千上萬的WEB信息站點中檢索到有用的信息是不容易的,有時甚至是不可能的,更何況信息的索要者往往沒有多少時間在茫茫的數(shù)據(jù)海洋中漫游。我們知道在數(shù)字圖書館中,圖書館員是信息專家,他們是信息組織者、信息生產(chǎn)者、信息服務(wù)者和信息管理者。正是通過圖書館員的信息服務(wù)活動使數(shù)字圖書館有別于其它信息站點。那么,圖書館員特別是院校圖書館中的圖書館員在二十一世紀的數(shù)字圖書館中應(yīng)如何進行信息服務(wù)?圖書館員須掌握什么先進技術(shù)工具為用戶服務(wù)?這是當前圖書館界應(yīng)該研究的重要問題。
二、技術(shù)的選擇
WEB是一個非常成功的信息系統(tǒng)。這個系統(tǒng)為信息在全球范圍發(fā)布和傳播提供了機會,它允許任何人在任何地點任何時間傳播和獲取信息。WEB的非結(jié)構(gòu)化信息傳播和獲取方式引發(fā)了信息爆炸。大量的非結(jié)構(gòu)化的信息分散在整個INTERNET中。大量信息在給人們帶來方便的同時也帶來了許多問題:信息過量,難以消化;信息真假難以辨識;信息安全難以保證;信息形式不一致,難以統(tǒng)一處理。在信息的海洋中,即使是最先進的 搜索引擎也只能從1/3可以索引的WEB站點中獲取信息。人們開始提出一個新的口號:“要學會拋棄信息”。人們開始考慮:“如何才能不被信息淹沒,而是從中及時發(fā)現(xiàn)有用的知識、提高信息利用率?”事實上,作為一個非專業(yè)的信息管理人員,要從茫茫的信息海洋中獲取本專業(yè)最新、最權(quán)威知識和較為全面的信息,并從中得到有用的知識幾乎變得不可能。要知道,各高等院校或研究所里的專家教授們由于研究課題計劃的緊迫,他們急需本專業(yè)領(lǐng)域的最新最權(quán)威的知識和信息,他們沒有時間在成千上萬的站點中的數(shù)不清的頁面中查找所需的信息。所以在信息的提供者與信息的消費者之間應(yīng)有一個中間環(huán)節(jié),通過這個環(huán)節(jié),信息消費者能夠快捷方便地得到想要的信息,正是這種迫切需要為圖書館員提供了展現(xiàn)才華的機會。圖書館員們運用信息管理技能,直接為用戶提供有用信息。圖書館員們應(yīng)抓住機會,認真考慮在INTERNET環(huán)境中,如何使其服務(wù)領(lǐng)域得以擴寬,從桌面咨詢服務(wù)擴展到基于WEB信息空間電子咨詢服務(wù)。
WWW是眾多情報類型中的一種,并且具有極大的特殊性。它的信息是分布在全球范圍內(nèi),并且隨時可變。這些分布在各地的信息允許任何人在任何地點任何時間傳播和獲取信息。為此,圖書館員必須選取某個工具來有效地組織和獲取WWW中的信息。傳統(tǒng)的搜索引擎根本不評估站點的內(nèi)容,而只是機械地識別WEB設(shè)計者提供的關(guān)鍵字,即使是最優(yōu)秀的搜索引擎也需要用戶親自訪問到不同的站點并對信息加以驗證。而WEB挖掘技術(shù)是克服這些缺點的最理想的工具。
三、數(shù)據(jù)挖掘和WEB挖掘
數(shù)據(jù)挖掘(Data Mining)是信息技術(shù)(IT)領(lǐng)域中最熱門話題之一。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。何為知識?從廣義上理解,數(shù)據(jù)、信息也是知識的表現(xiàn)形式,但是人們更把概念、規(guī)則、模式、規(guī)律和約束等看作知識。人們把數(shù)據(jù)看作是形成知識的源泉,好像從礦石中采礦或淘金一樣。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形和圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學的,也可以是非數(shù)學的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)的知識可以被用于信息管理,查詢優(yōu)化,決策支持和過程控制等,還可以用于數(shù)據(jù)自身的維護。因此,數(shù)據(jù)挖掘是一門交叉學科,它把人們對數(shù)據(jù)的應(yīng)用從低層次的簡單查詢,提升到從數(shù)據(jù)中挖掘知識,提供決策支持。在這種需求牽引下,匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫技術(shù)、人工智能技術(shù)、數(shù)理統(tǒng)計、可視化技術(shù)、并行計算等方面的學者和工程技術(shù)人員,投身到數(shù)據(jù)挖掘這一新興的研究領(lǐng)域,形成新的技術(shù)熱點。當數(shù)據(jù)挖掘技術(shù)應(yīng)用于網(wǎng)絡(luò)環(huán)境下的WEB中就成為WEB挖掘(Web Mining),WEB挖掘可以廣義地定義為從WWW中發(fā)現(xiàn)和分析有用的信息。這個定義有兩方面的意義:一方面它描述了自動地從數(shù)以百萬計的WEB站點和在線數(shù)據(jù)庫中搜索和獲取信息和資料,這叫做WEB內(nèi)容挖掘(Web Content Mining);另一方面,發(fā)現(xiàn)和分析用戶訪問一個或多個站點和在線服務(wù)的模型叫做WEB使用挖掘(Web Usage Mining)。
WEB中的異構(gòu)型和非結(jié)構(gòu)化的數(shù)據(jù),使得發(fā)現(xiàn)、組織和管理信息變得非常困難。傳統(tǒng)的搜索、索引工具,諸如 Lycos, Alta Vista, WebCrawler, ALIWEB等,雖然它們都能為用戶提供一些方便,但它們都不提供結(jié)構(gòu)化數(shù)據(jù),也不提供分類、過濾和文檔翻譯等基本功能。近年來,研究人員正努力研究WEB內(nèi)容挖掘,開發(fā)智能化的信息檢索工具。基于代理的檢索方法正是這種智能化的信息檢索工具,它是一個人工智能系統(tǒng)。它可以代表某一特定用戶,自動地或半自動地發(fā)現(xiàn)和組織基于WEB的信息,它可以根據(jù)用戶的基本情況,自動檢索出用戶感興趣的信息,并組織和翻譯好這些信息。有些代理甚至可以自動學習用戶的愛好,并根據(jù)用戶的愛好為用戶檢索出相關(guān)信息。WEB內(nèi)容挖掘的另一種方法是基于數(shù)據(jù)庫的方法。這種方法是把WEB中異構(gòu)的非結(jié)構(gòu)化的數(shù)據(jù)集成和組織成結(jié)構(gòu)化的數(shù)據(jù),就像關(guān)系數(shù)據(jù)庫那樣,然后用標準的數(shù)據(jù)庫查詢機理和數(shù)據(jù)挖掘技術(shù)來訪問和分析這些信息。
WEB使用挖掘(Web Usage Mining)是發(fā)現(xiàn)用戶訪問模型(或稱為訪問習慣),它的數(shù)據(jù)是自動從每日的訪問日志等中收集到。WEB使用挖掘?qū)⒂脩艋厩闆r檔案非常關(guān)鍵。研究用戶在某個或多個服務(wù)器上的行為表現(xiàn),對改善WEB站點使其更有效地服務(wù)于用戶是非常必要的。
四、信息服務(wù)
WEB挖掘是一個前景非?春玫墓ぞ摺N覀冎,傳統(tǒng)的效率低下的搜索引擎檢索出的信息往往索引不完全、有大量的無關(guān)信息或沒有進行可靠性驗證。用戶能夠快速方便地從WEB中檢索出相關(guān)的可靠的信息是一個系統(tǒng)的最基本的要求。WEB挖掘不僅能夠從WWW的大量的數(shù)據(jù)中發(fā)現(xiàn)信息,而且它監(jiān)視和預測用戶的訪問習慣。這樣給設(shè)計人員在設(shè)計WEB站點時有更多的可靠的信息。WEB挖掘技術(shù)能夠幫助圖書館員在設(shè)計站點時朝著方便用戶、節(jié)省時間和高效率方向發(fā)展。WEB挖掘技術(shù)為圖書館員進行信息服務(wù)提供了先進的工具。有了這個工具,圖書館員能夠按照各個用戶的要求或習慣,為用戶組織更多、更好的高質(zhì)量信息。
例如;院校圖書館員們應(yīng)用WEB挖掘技術(shù)為本院校不同學科中的不同研究課題從WWW中檢索相關(guān)信息。該技術(shù)可以自動地檢索信息,并把信息按照課題領(lǐng)域進行分類,使它們更容易訪問。圖書館員可以通過為不同的課題領(lǐng)域建立一組特征,并以這些特征為基礎(chǔ)進行檢索和分類,從而保證得到的信息是可靠的和具有權(quán)威性的。由于WEB挖掘技術(shù)能夠自動地,不須人工干預地從WWW中發(fā)現(xiàn)和組織信息,從而使圖書館員只需花少量的時間來維護數(shù)據(jù)庫即可完成任務(wù)。用戶由于不需要花大量的時間來瀏覽成百上千的文檔,就可在相當短的時間里得到想要的信息而感到非常滿意。更重要的是,他們可以在任何時間訪問到世界任何地方的信息。事實上,這就是圖書館員把他們的咨詢服務(wù)從桌面轉(zhuǎn)移到INTERNET的具體工作表現(xiàn)。
五、結(jié)束語
在未來的數(shù)字圖書館中,圖書館員如何充分發(fā)揮其信息專家的作用,是我們每個圖書館員應(yīng)考慮的重要問題。數(shù)據(jù)挖掘技術(shù)是未來信息檢索的主要技術(shù)。為此,我們圖書館員應(yīng)該不斷地學習新技術(shù)、新方法,搞好信息服務(wù)工作,努力開拓,爭取成為真正的信息專家。