什么是信息搜索?
因特網(wǎng)上的信息浩如煙海,我們怎樣才能從那么多的信息中找到所需的信息呢?一種辦法是靠自己平時(shí)隨時(shí)記錄和整理有用的萬維網(wǎng)站點(diǎn),另一種辦法就是依靠搜索引擎。
搜索引擎是一種萬維網(wǎng)站點(diǎn),他們除了提供信息內(nèi)容服務(wù)外,還提供信息檢索服務(wù)。他們提供的信息檢索服務(wù)主要有兩種方式。
一種是索引方式。這種索引將萬維網(wǎng)上的信息按照一種分類方法組織成樹狀結(jié)構(gòu),你可以一級一級地查下去,直至找到你想瀏覽的網(wǎng)頁。例如,它的第一個(gè)網(wǎng)頁上給出政治、科技、文化、藝術(shù)、體育等幾個(gè)大類的欄目。如果你對體育感興趣,則可把鼠標(biāo)移到體育欄上點(diǎn)一下。接著,它會給你展示第二層的欄目,有國內(nèi)體育和國外體育。再下一層可能是籃球、排球、足球、乒乓球、羽毛球、冰球、手球、棒球、高爾夫球、曲棍球……最后,可能在“最近一周足球比賽結(jié)果”欄目下顯示出若干篇報(bào)道文章的題目,這時(shí),你就可以選一篇來閱讀了。實(shí)際上你每選一次,瀏覽器都把你的選擇傳送給搜索引擎站點(diǎn),然后搜索引擎站點(diǎn)再將結(jié)果傳送給你。如果搜索引擎站點(diǎn)很遠(yuǎn)(如在美國),那可能得稍為費(fèi)點(diǎn)時(shí)間。
另一種方式是查找方式。提供這種服務(wù)的萬維網(wǎng)站點(diǎn)的第一個(gè)網(wǎng)頁上有一個(gè)空的欄目,供你填寫查找要求。在那兒,你可以填入要查找內(nèi)容的主題詞和關(guān)鍵詞。例如,你填了“天安門”,搜索引擎站點(diǎn)會查出有關(guān)天安門的文章。使用這種方式時(shí),關(guān)鍵的一點(diǎn)是你的要求要比較恰當(dāng),如果要求太一般,搜索引擎站點(diǎn)可能給你找出成千上萬篇文章;如果要求太嚴(yán),可能查了很長時(shí)間,結(jié)果一篇也找不到。
搜索引擎的服務(wù)能力取決于該站點(diǎn)聯(lián)系的萬維網(wǎng)站點(diǎn)的數(shù)目、數(shù)據(jù)庫更新的時(shí)間周期、信息分類方法和它的信息檢索算法。它收集的站點(diǎn)少,自然信息就少;更新周期長,信息就會陳舊;分類不合理,本來可查到的信息可能就查不到;算法不好,查找的速度就慢。搜索引擎站點(diǎn)有不少,比較著名的搜索引擎站點(diǎn)有百度、谷歌等。
信息檢索有哪些常用的檢索途徑?
1、順查法
以檢索課題的起始年代為起點(diǎn),按時(shí)間順序由遠(yuǎn)及近的查找,直到查到的文獻(xiàn)信息滿足要求為止。此法的優(yōu)點(diǎn)在于查全率高,缺點(diǎn)在于費(fèi)時(shí)、費(fèi)力。
2、追溯法
利用已有的文獻(xiàn)后面的參考文獻(xiàn),由近及遠(yuǎn)進(jìn)行追溯查找的方法。此法的優(yōu)點(diǎn)在于直觀、方便、不斷追溯可查到某一專題的大量參考文獻(xiàn),這是在沒有檢索工具或檢索工具不全的情況下擴(kuò)大信息源的一種好方法,缺點(diǎn)在于檢索效率低、查全率低、漏檢率高。
3、綜合法
又稱為循環(huán)法、分段法或交替法,是常用法和追溯法兩種方法的綜合。即利用檢索工具又利用文獻(xiàn)后邊的參考文獻(xiàn)進(jìn)行了追溯,兩種方法交替使用,知道滿足為止,它可得到較高的查全率和查準(zhǔn)率。
4、倒查法
一種逆時(shí)間由近及遠(yuǎn)地查找文獻(xiàn)的方法。這種方法多用于新開課題或有新內(nèi)容的老課題,需要的是近期發(fā)表的文獻(xiàn),以便掌握最近一段時(shí)間該課題所達(dá)到的水平及研究動向。因此,一旦掌握了所需的文獻(xiàn)信息即可中止搜索。此方法的優(yōu)點(diǎn)在于節(jié)約時(shí)間,缺點(diǎn)在于漏檢率高。
5、抽查法
針對研究課題發(fā)展的特點(diǎn),抓住學(xué)科發(fā)展迅速、發(fā)表文獻(xiàn)較多的一段時(shí)期,逐年進(jìn)行查找的一種方法。此法的優(yōu)點(diǎn)在于能以較少的檢索時(shí)間獲得較多的文獻(xiàn)信息,缺點(diǎn)在于使用此法必須熟悉學(xué)科發(fā)展特點(diǎn)為前提,否則難以取得預(yù)期效果。
信息檢索的定義
信息檢索有廣義和狹義的之分。廣義的信息檢索全稱為“信息存儲與檢索”,是指將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要找出有關(guān)信息的過程。狹義的信息檢索為“信息存儲與檢索”的后半部分,通常稱為“信息查找”或“信息搜索”,是指從信息集合中找出用戶所需要的有關(guān)信息的過程。狹義的信息檢索包括3個(gè)方面的含義:了解用戶的信息需求、信息檢索的技術(shù)或方法、滿足信息用戶的需求。
由信息檢索原理可知,信息的存儲是實(shí)現(xiàn)信息檢索的基礎(chǔ)。這里要存儲的信息不僅包括原始文檔數(shù)據(jù),還包括圖片、視頻和音頻等,首先要將這些原始信息進(jìn)行計(jì)算機(jī)語言的轉(zhuǎn)換,并將其存儲在數(shù)據(jù)庫中,否則無法進(jìn)行機(jī)器識別。待用戶根據(jù)意圖輸入查詢請求后,檢索系統(tǒng)根據(jù)用戶的查詢請求在數(shù)據(jù)庫中搜索與查詢相關(guān)的信息,通過一定的匹配機(jī)制計(jì)算出信息的相似度大小,并按從大到小的順序?qū)⑿畔⑥D(zhuǎn)換輸出。
信息檢索的途徑有哪些
信息檢索方法包括:普通法、追溯法和分段法。
1、普通法
是利用書目、文摘、索引等檢索工具進(jìn)行文獻(xiàn)資料查找的方法。運(yùn)用這種方法的關(guān)鍵在于熟悉各種檢索工具的性質(zhì)、特點(diǎn)和查找過程,從不同角度查找。普通法又可分為順檢法和倒檢法。
2、追溯法
是利用已有文獻(xiàn)所附的參考文獻(xiàn)不斷追蹤查找的方法,在沒有檢索工具或檢索工具不全時(shí),此法可獲得針對性很強(qiáng)的資料,查準(zhǔn)率較高,查全率較差。
3、分段法
是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
擴(kuò)展資料
信息檢索起源于圖書館的參考咨詢和文摘索引工作,從19世紀(jì)下半葉首先開始發(fā)展,至20世紀(jì)40年代,索引和檢索成已為圖書館獨(dú)立的工具和用戶服務(wù)項(xiàng)目。
隨著1946年世界上第一臺電子計(jì)算機(jī)問世,計(jì)算機(jī)技術(shù)逐步走進(jìn)信息檢索領(lǐng)域,并與信息檢索理論緊密結(jié)合起來;脫機(jī)批量情報(bào)檢索系統(tǒng)、聯(lián)機(jī)實(shí)時(shí)情報(bào)檢索系統(tǒng)相繼研制成功并商業(yè)化。
20世紀(jì)60年代到80年代,在信息處理技術(shù)、通訊技術(shù)、計(jì)算機(jī)和數(shù)據(jù)庫技術(shù)的推動下,信息檢索在教育、軍事和商業(yè)等各領(lǐng)域高速發(fā)展,得到了廣泛的應(yīng)用。Dialog國際聯(lián)機(jī)情報(bào)檢索系統(tǒng)是這一時(shí)期的信息檢索領(lǐng)域的代表,至今仍是世界上最著名的系統(tǒng)之一。
信息檢索按存儲載體和檢索手段方式劃分,可分為哪三種?
按存儲與檢索對象劃分,信息檢索可以分為:文獻(xiàn)檢索、數(shù)據(jù)檢索、事實(shí)檢索。
按檢索途徑劃分:直接檢索、間接檢索。
按存儲的載體和實(shí)現(xiàn)查找的技術(shù)手段為標(biāo)準(zhǔn)劃分:手工檢索、機(jī)械檢索、計(jì)算機(jī)檢索。
信息檢索(Information Retrieval)是用戶進(jìn)行信息查詢和獲取的主要方式,是查找信息的方法和手段。狹義的信息檢索僅指信息查詢(Information Search)。即用戶根據(jù)需要,采用一定的方法,借助檢索工具,從信息集合中找出所需要信息的查找過程。
擴(kuò)展資料:
一、起源
信息檢索起源于圖書館的參考咨詢和文摘索引工作,從19世紀(jì)下半葉首先開始發(fā)展,至20世紀(jì)40年代,索引和檢索成已為圖書館獨(dú)立的工具和用戶服務(wù)項(xiàng)目。
隨著1946年世界上第一臺電子計(jì)算機(jī)問世,計(jì)算機(jī)技術(shù)逐步走進(jìn)信息檢索領(lǐng)域,并與信息檢索理論緊密結(jié)合起來;脫機(jī)批量情報(bào)檢索系統(tǒng)、聯(lián)機(jī)實(shí)時(shí)情報(bào)檢索系統(tǒng)相繼研制成功并商業(yè)化,20世紀(jì)60年代到80年代,在信息處理技術(shù)、通訊技術(shù)、計(jì)算機(jī)和數(shù)據(jù)庫技術(shù)的推動下。
信息檢索在教育、軍事和商業(yè)等各領(lǐng)域高速發(fā)展,得到了廣泛的應(yīng)用。Dialog國際聯(lián)機(jī)情報(bào)檢索系統(tǒng)是這一時(shí)期的信息檢索領(lǐng)域的代表,至今仍是世界上最著名的系統(tǒng)之一。
二、主要環(huán)節(jié)
信息內(nèi)容分析與編碼,產(chǎn)生信息記錄及檢索標(biāo)識。
組織存貯,將全部記錄按文件、數(shù)據(jù)庫等形式組成有序的信息集合。
用戶提問處理和檢索輸出。關(guān)鍵部分是信息提問與信息集合的匹配和選擇,即對給定提問與集合中的記錄進(jìn)行相似性比較,根據(jù)一定的匹配標(biāo)準(zhǔn)選出有關(guān)信息。它按對象分為文獻(xiàn)檢索、數(shù)據(jù)檢索和事實(shí)檢索;按設(shè)備分為手工檢索、機(jī)械檢索和計(jì)算機(jī)檢索。
由一定的設(shè)備和信息集合構(gòu)成的服務(wù)設(shè)施稱為信息檢索系統(tǒng),如穿孔卡片系統(tǒng)、聯(lián)機(jī)檢索系統(tǒng)、光盤檢索系統(tǒng)、多媒體檢索系統(tǒng)等。
信息檢索最初應(yīng)用于圖書館和科技信息機(jī)構(gòu),后來逐漸擴(kuò)大到其他領(lǐng)域,并與各種管理信息系統(tǒng)結(jié)合在一起。與信息檢索有關(guān)的理論、技術(shù)和服務(wù)構(gòu)成了一個(gè)相對獨(dú)立的知識領(lǐng)域,是信息學(xué)的一個(gè)重要分支,并與計(jì)算機(jī)應(yīng)用技術(shù)相互交叉。
參考資料來源:百度百科-信息檢索
信息檢索的基本原理
信息檢索有廣義和狹義的之分。廣義的信息檢索全稱為“信息存儲與檢索”,是指將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要找出有關(guān)信息的過程。
狹義的信息檢索為“信息存儲與檢索”的后半部分,通常稱為“信息查找”或“信息搜索”,是指從信息集合中找出用戶所需要的有關(guān)信息的過程。狹義的信息檢索包括3個(gè)方面的含義:了解用戶的信息需求、信息檢索的技術(shù)或方法、滿足信息用戶的需求。
擴(kuò)展資料:
信息檢索四要素:
1 信息檢索的前提----信息意識:所謂信息意識,是人們利用信息系統(tǒng)獲取所需信息的內(nèi)在動因,具體表現(xiàn)為對信息的敏感性、選擇能力和消化吸收能力,從而判斷該信息是否能為自己或某一團(tuán)體所利用,是否能解決現(xiàn)實(shí)生活實(shí)踐中某一特定問題等一系列的思維過程。
2.信息檢索的基礎(chǔ)----信息源:信息源定義:在聯(lián)合國教科文組織出版的《文獻(xiàn)術(shù)語中》,將信息源定義為:個(gè)人為滿足其信息需要而獲得信息的來源,稱為信息源。
3、信息檢索的核心----信息獲取能力:通過熟練使用檢索工具來了解各種信息來源的效果。
4.信息檢索的關(guān)鍵----信息利用:獲取學(xué)術(shù)信息的最終目的是通過對所得信息的整理、分析、歸納和總結(jié),根據(jù)自己學(xué)習(xí)、研究過程中的思考和思路,將各種信息進(jìn)行重組,船造出新的知識和信息,從而達(dá)到信息激活和增值的目的。
參考資料來源:百度百科-信息檢索
本文發(fā)布于:2023-02-28 19:47:00,感謝您對本站的認(rèn)可!
本文鏈接:http://m.newhan.cn/zhishi/a/167763411468441.html
版權(quán)聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除。
本文word下載地址:信息搜索(信息搜索能力也就是確定信息的能力).doc
本文 PDF 下載地址:信息搜索(信息搜索能力也就是確定信息的能力).pdf
| 留言與評論(共有 0 條評論) |