777精品久无码人妻蜜桃-欧美在线观看视频一区-99精品网-伊人网中文字幕-99福利网-国产精品99久久久久久武松影视-日本黄色片免费看-免费观看高清在线观看-人妻少妇被粗大爽9797pw-日韩国产在线播放-国产日产成人免费视频在线观看-一区二区人妻-午夜看毛片-国产精品s-午夜免费av-国产精品色情国产三级在-国产精品资源在线

基于大數(shù)據(jù)技術的智能文獻采訪模式探析

所屬分類:期刊常識時間:瀏覽:次

  [摘 要]大數(shù)據(jù)和大數(shù)據(jù)技術推動下,智能文獻采訪將成為圖書館文獻采訪的發(fā)展方向和趨勢。結合大數(shù)據(jù)技術和圖書館文獻采訪的業(yè)務工作,研究文獻采訪大數(shù)據(jù)的組成和相互關系,探索基于大數(shù)據(jù)技術的智能文獻采訪模式及具體方法。同時,指出實現(xiàn)文獻智能采訪需要培育的幾個方面的內容。

  [關鍵詞]大數(shù)據(jù);大數(shù)據(jù)技術;智能文獻采訪;模式

大數(shù)據(jù)論文

  基于云計算機、物聯(lián)網等基礎的大數(shù)據(jù)技術發(fā)展和應用逐漸深入到各行業(yè)。大數(shù)據(jù)所涉及的信息量規(guī)模巨大,在合理時間內達到擷取、管理、處理、整理成類并能夠解讀的數(shù)據(jù)資訊,根據(jù)應用動態(tài)分配資源。大數(shù)據(jù)及其相關技術,讓圖書館、讀者、供應商和大數(shù)據(jù)企業(yè)間的智能文獻采訪成為可能[1]。利用大數(shù)據(jù)及其技術,能方便獲取讀者閱讀需求、供應商、出版商以及網絡信息數(shù)據(jù)來智能分析、管理和預測讀者需求、文獻動態(tài)和采訪細節(jié),并以智能虛擬化的方式為圖書館采訪員、讀者用戶間構建實現(xiàn)智能文獻采訪,從而提高采訪的質量、準確性,降低采購成本、管理成本,提升文獻采訪效率。

  1 大數(shù)據(jù)、大數(shù)據(jù)技術概述

  大數(shù)據(jù)(Bib Data)是指所涉及的規(guī)模巨大的數(shù)據(jù),于2011年由麥肯錫提出。大數(shù)據(jù)是無法用現(xiàn)有軟件工具提取、存儲、搜索、共享、分析和處理的、海量的、復雜的數(shù)據(jù)集合,是需要使用新的處理模式才能具有更強的決策力、洞察力、優(yōu)化能力的海量資產。大數(shù)據(jù)基本包括大交易數(shù)據(jù)、大交互數(shù)據(jù)。大交易數(shù)據(jù)是指財務數(shù)據(jù)、用戶數(shù)據(jù)、經銷商數(shù)據(jù)、員工數(shù)據(jù)等。大交互數(shù)據(jù)是指微博、微聊天數(shù)據(jù)、移動終端數(shù)據(jù)、地理位置等數(shù)據(jù)。這兩部分數(shù)據(jù)共同融合成為全面大數(shù)據(jù)。2012年美國啟動大數(shù)據(jù)研究,隨后日本、歐盟、法國、澳大利亞陸續(xù)進行大數(shù)據(jù)研究。2013年我國啟動大數(shù)據(jù)建設,至2015年越來越多的政府和企業(yè)建立大數(shù)據(jù)產業(yè)園和創(chuàng)業(yè)平臺。如百度、淘寶、京東等企業(yè)建立了商品大數(shù)據(jù)[2]。

  大數(shù)據(jù)具有“4V”特征,即數(shù)據(jù)巨大、數(shù)據(jù)類型多樣、處理速度快、價值密度低。大數(shù)據(jù)是動態(tài)的、開放性的、多樣化的。隨著海量的大數(shù)據(jù)產生,對數(shù)據(jù)處理的實時性、有效性提出了更高要求。然而傳統(tǒng)的常規(guī)技術手段根本無法應付。在這種情況下,大數(shù)據(jù)技術應運而生。這些技術主要包括分布式緩存、基于MPP的分布式數(shù)據(jù)庫、分布式文件系統(tǒng)、各種NoSQL分布式存儲方案等。NoSQL數(shù)據(jù)庫技術主要實現(xiàn)搜索、實時統(tǒng)計分析、簡單事務等[2]。Hadoop數(shù)據(jù)分析技術主要實現(xiàn)用戶積累、數(shù)據(jù)整合和分析處理等方位的服務。隨著數(shù)據(jù)挖掘技術、聚類分析、可視分析、預測分析和數(shù)據(jù)管理等大數(shù)據(jù)技術的不斷發(fā)展和完善,逐漸實現(xiàn)數(shù)據(jù)的多維度采集、整理、分析、預測和管理信息源,挖掘出有價值的信息及隱藏在數(shù)據(jù)背后的信息,進而揭示事物的本質及其發(fā)展規(guī)律。

  2 大數(shù)據(jù)技術給文獻采訪帶來的影響

  隨著人工智能、專家系統(tǒng)技術、云計算、大數(shù)據(jù)、物聯(lián)網等的發(fā)展應用,智能采購系統(tǒng)的數(shù)據(jù)挖掘、預測、分析等技術已取得重大進展。大數(shù)據(jù)驅動采購變革已開始,不斷把數(shù)據(jù)拿出來分析和關聯(lián),進行合理的預測和數(shù)據(jù)推送。已有人嘗試將部分技術運用于圖書館文獻采訪工作的理論與實踐。隨著大數(shù)據(jù)技術進一步完善,為智能文獻采訪實現(xiàn)提供技術支持,這也是人工智能整體發(fā)展的必然趨勢。大數(shù)據(jù)技術支持下,智能文獻采訪不再高度依賴采購員的主觀經驗,而是根據(jù)大數(shù)據(jù)挖掘、個性化文獻需求,自動生成采購推薦清單,高度智能地完成文獻采訪工作。智能文獻采訪系統(tǒng)通過對讀者用戶各方面數(shù)據(jù)、館藏數(shù)據(jù)、書目數(shù)據(jù)、文獻價值、經費分配、風險等等進行全面分析、比較、判斷、評價,最后做出科學的文獻采訪。同時,通過挖掘數(shù)據(jù)價值、發(fā)現(xiàn)規(guī)律和知識為文獻采訪決策和優(yōu)化提供有利依據(jù),指導文獻采訪和管理的改進,最終改善文獻采訪的運營,實現(xiàn)便捷、高效及環(huán)保的文獻采購[3—4]。

  3 文獻采訪大數(shù)據(jù)的構成

  在大數(shù)據(jù)技術和環(huán)境下,聯(lián)系文獻采訪業(yè)務技術流程,可將文獻采訪大數(shù)據(jù)分為讀者數(shù)據(jù)、圖書館數(shù)據(jù)、供應商數(shù)據(jù)、企業(yè)大數(shù)據(jù)四個部分[1]。

  3.1 讀者數(shù)據(jù)

  讀者數(shù)據(jù)分為讀者用戶身份數(shù)據(jù)和讀者交互數(shù)據(jù)。讀者交互數(shù)據(jù)是指讀者的行為數(shù)據(jù),主要是指讀者點擊、瀏覽、停留記錄、檢索、閱讀、借閱、購買等信息數(shù)據(jù),也包含讀者與供應商和其他網絡平臺進行溝通聯(lián)系產生的一切數(shù)據(jù)。讀者身份數(shù)據(jù)是用于在大數(shù)據(jù)間進行溝通的數(shù)據(jù),如身份信息。

  3.2 圖書館數(shù)據(jù)

  圖書館數(shù)據(jù)是指館藏文獻數(shù)據(jù)、采訪員數(shù)據(jù)、讀者基本信息。該數(shù)據(jù)也存在讀者用戶訪問圖書館網站、微信、微博等信息的讀者交互數(shù)據(jù)。

  3.3 供應商數(shù)據(jù)

  供應商數(shù)據(jù)是指文獻資源數(shù)據(jù)、讀者交互數(shù)據(jù)。文獻資源數(shù)據(jù)主要是文獻出版信息、文獻采購信息、采購交易等數(shù)據(jù)。這里的讀者交互數(shù)據(jù)是指讀者參與圖書供應商瀏覽、自主采購或推薦等信息。

  3.4 企業(yè)大數(shù)據(jù)

  企業(yè)大數(shù)據(jù)是指圖書館、供應商、讀者共同依靠的互聯(lián)企業(yè)所提供的有關文獻資源、大眾讀者以及閱讀、交易等信息。如百度、騰訊、阿里開放數(shù)據(jù)庫等。企業(yè)大數(shù)據(jù)是最廣泛數(shù)據(jù),也是文獻采訪挖掘、預測、精確采購的數(shù)據(jù)集合。文獻采訪大數(shù)據(jù)相互間的結構關系如圖1所示。

  4 基于大數(shù)據(jù)庫技術的智能文獻采訪模式分析

  4.1 文獻采訪數(shù)據(jù)的收集

  在大數(shù)據(jù)環(huán)境下,通過大數(shù)據(jù)搜集讀者信息,利用大數(shù)據(jù)準確了解每位讀者的文獻需求。這些讀者數(shù)據(jù)的搜集主要通過圖書館、供應商和大數(shù)據(jù)企業(yè),還包括通過進行數(shù)據(jù)分析后獲得的決策數(shù)據(jù)。供應商開放的文獻采訪平臺擁有文獻資源數(shù)據(jù)。企業(yè)大數(shù)據(jù)依靠的是互聯(lián)網企業(yè)所提供的有關文獻資源、大眾讀者以及閱讀、交易等信息。這些數(shù)據(jù)為供應商營銷和圖書館文獻采訪提供參考、預測數(shù)據(jù)。接下來需要將這些數(shù)據(jù)進行整合。其具體辦法可找到一關鍵字段把兩個或多個數(shù)據(jù)進行連接,如讀者通過身份證號碼在圖書館網站、供應商平臺和互聯(lián)網大數(shù)據(jù)企業(yè)間進行連接。通過這種方式,可以對讀者的基本資料、行業(yè)特征和交易記錄形成全方面了解。整理完讀者數(shù)據(jù)之后按一定的邏輯給讀者打標簽。如這個讀者最近經常瀏覽孕婦服裝、奶粉,可以給讀者打上“孕婦”標簽。通過讀者數(shù)據(jù)來全方位地了解讀者,以便為下一步精準文獻采訪奠定基礎。當這些讀者數(shù)據(jù)越來越大,企業(yè)就將這些讀者數(shù)據(jù)進行存放,為文獻采訪、供應商的銷售提供科學、智能的預測。同時,圖書館館藏種類、數(shù)量和結構等通過圖書館采訪系統(tǒng)與供應商開放平臺互通連接[5]。

  推薦閱讀:大數(shù)據(jù)挖掘的論文投刊指導

如果您現(xiàn)在遇到期刊選擇、論文內容改善、論文投稿周期長、難錄用、多次退修、多次被拒等問題,可以告訴學術顧問,解答疑問同時給出解決方案 。

永兴县| 海丰县| 太仓市| 江山市| 南华县| 孙吴县| 丽江市| 镇宁| 开封市| 陇西县| 安义县| 芷江| 高淳县| 昌平区| 垦利县| 应城市| 绥江县| 库尔勒市| 乌兰察布市| 台南市| 漳平市| 清徐县| 文安县| 英德市| 仁怀市| 绵阳市| 阳东县| 邓州市| 阳谷县| 平果县| 海南省| 盈江县| 隆子县| 盐亭县| 宁津县| 来宾市| 武宁县| 同江市| 常州市| 会宁县| 义乌市|