<output id="r87xx"></output>
    1. 
      
      <mark id="r87xx"><thead id="r87xx"><input id="r87xx"></input></thead></mark>
        •   

               當(dāng)前位置:首頁(yè)>管理咨詢>淺析基于數(shù)據(jù)挖掘的數(shù)字檔案信息管理研究 查詢:
               
          淺析基于數(shù)據(jù)挖掘的數(shù)字檔案信息管理研究

            論文摘要:隨著社會(huì)主義現(xiàn)代化的發(fā)展,計(jì)算機(jī)技術(shù)的進(jìn)步,信息技術(shù)在社會(huì)發(fā)展的各個(gè)領(lǐng)域都扮演著極其重要的角色。信息化建設(shè)更是被我國(guó)列為經(jīng)濟(jì)社會(huì)發(fā)展的首要內(nèi)容。網(wǎng)頁(yè)檔案化管理包括文檔、文字翻譯轉(zhuǎn)換、圖片資料、聲像資料、多媒體遠(yuǎn)程會(huì)議等。尤其是大學(xué)檔案館更側(cè)重教學(xué)與科研,網(wǎng)頁(yè)檔案化管理是必然的趨勢(shì)。


            在信息化發(fā)展的今天,圖書館,特別是大學(xué)圖書館不僅要對(duì)信息進(jìn)行簡(jiǎn)單的數(shù)字轉(zhuǎn)換和管理,更要對(duì)新興事物網(wǎng)絡(luò)進(jìn)行檔案化管理和歸檔,包括文檔、文字翻譯轉(zhuǎn)換、圖片資料、聲像資料、多媒體遠(yuǎn)程會(huì)議等。所以網(wǎng)絡(luò)檔案化管理,成為當(dāng)今圖書管理的必然趨勢(shì),這就必須對(duì)檔案化管理的技術(shù)和法律相關(guān)問(wèn)題進(jìn)行深入闡述和探討。
            所謂數(shù)據(jù)挖掘(Data Mining),就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識(shí)的過(guò)程。這些數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本,圖形,圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識(shí)的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。發(fā)現(xiàn)了的知識(shí)可以被用于信息管理、查詢優(yōu)化、決策支持、過(guò)程控制等,還可以進(jìn)行數(shù)據(jù)自身的維護(hù)。數(shù)據(jù)挖掘借助了多年來(lái)數(shù)理統(tǒng)計(jì)技術(shù)和人工智能以及知識(shí)工程等領(lǐng)域的研究成果構(gòu)建自己的理論體系,是涉及數(shù)據(jù)庫(kù)、人工智能、數(shù)理統(tǒng)計(jì)、機(jī)械學(xué)、人工神經(jīng)網(wǎng)絡(luò)、可視化、并行計(jì)算等的交叉學(xué)科,是目前國(guó)際上數(shù)據(jù)庫(kù)和決策支持領(lǐng)域的最前沿的研究方向之一。
            一、數(shù)據(jù)挖掘的功能
            數(shù)據(jù)挖掘通過(guò)預(yù)測(cè)未來(lái)趨勢(shì)及行為,做出預(yù)測(cè)性的、基于知識(shí)的決策。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)隱含的、有意義的知識(shí),按其功能可分為以下幾類。
            1、關(guān)聯(lián)分析
            關(guān)聯(lián)分析能尋找到數(shù)據(jù)庫(kù)中大量數(shù)據(jù)的相關(guān)聯(lián)系,常用的一種技術(shù)為關(guān)聯(lián)規(guī)則和序列模式。關(guān)聯(lián)規(guī)則是發(fā)現(xiàn)一個(gè)事物與其他事物間的相互關(guān)聯(lián)性或相互依賴性。
            2、聚類
            輸入的數(shù)據(jù)并無(wú)任何類型標(biāo)記,聚類就是按一定的規(guī)則將數(shù)據(jù)劃分為合理的集合,即將對(duì)象分組為多個(gè)類或簇,使得在同一個(gè)簇中的對(duì)象之間具有較高的相似度,而在不同簇中的對(duì)象差別很大。聚類增強(qiáng)了人們對(duì)客觀現(xiàn)實(shí)的認(rèn)識(shí),是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識(shí)別方法和數(shù)學(xué)分類學(xué)。
            3、自動(dòng)預(yù)測(cè)趨勢(shì)和行為
            數(shù)據(jù)挖掘自動(dòng)在大型數(shù)據(jù)庫(kù)中進(jìn)行分類和預(yù)測(cè),尋找預(yù)測(cè)性信息,自動(dòng)地提出描述重要數(shù)據(jù)類的模型或預(yù)測(cè)未來(lái)的數(shù)據(jù)趨勢(shì),這樣以往需要進(jìn)行大量手工分析的問(wèn)題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。
            4、概念描述
            對(duì)于數(shù)據(jù)庫(kù)中龐雜的數(shù)據(jù),人們期望以簡(jiǎn)潔的描述形式來(lái)描述匯集的數(shù)據(jù)集。概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述并概括出這類對(duì)象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對(duì)象的共同特征,后者描述不同類對(duì)象之間的區(qū)別。生成一個(gè)類的特征性只涉及該類對(duì)象中所有對(duì)象的共性。生成區(qū)別性描述的方法很多,如決策樹(shù)方法、遺傳算法等。
            5、偏差檢測(cè)
            數(shù)據(jù)庫(kù)中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫(kù)中檢測(cè)這些偏差很有意義。偏差包括很多潛在的知識(shí),如分類中的反常實(shí)例、不滿足規(guī)則的特例、觀測(cè)結(jié)果與模型預(yù)測(cè)值的偏差、量值隨時(shí)間的變化等。偏差檢測(cè)的基本方法是尋找觀測(cè)結(jié)果與參照值之間有意義的差別。這常用于金融銀行業(yè)中檢測(cè)欺詐行為,或市場(chǎng)分析中分析特殊消費(fèi)者的消費(fèi)習(xí)慣。
            二、數(shù)據(jù)挖掘在建設(shè)現(xiàn)代化高校檔案館中的應(yīng)用
            1、資源類數(shù)據(jù)包括館藏檔案經(jīng)過(guò)數(shù)字化加工而產(chǎn)生的各類電子檔案、電子文件中心中存儲(chǔ)的各類電子檔案、檔案軟件收集的信息、檔案信息網(wǎng)建設(shè)和維護(hù)信息。我們從研究大學(xué)檔案用戶的信息需求出發(fā),數(shù)據(jù)挖掘?yàn)榇髮W(xué)檔案館全面掌握和準(zhǔn)確理解檔案用戶的信息需求提供了方法。
            (1) 利用Web訪問(wèn)信息挖掘技術(shù)發(fā)現(xiàn)其中的關(guān)聯(lián)模式、序列模式和Web訪問(wèn)趨勢(shì)等,構(gòu)建多維視圖的用戶興趣模型。從而可以確定檔案信息或服務(wù)受歡迎的程度,發(fā)現(xiàn)用戶訪問(wèn)模式和用戶需求的趨勢(shì),從不同側(cè)面來(lái)研究用戶的信息需求,為優(yōu)化檔案館的檔案信息資源建設(shè)提供了科學(xué)依據(jù)。
            (2) 收集大學(xué)檔案網(wǎng)web服務(wù)器保留的用戶注冊(cè)信息、訪問(wèn)記錄,以及有關(guān)用戶與系統(tǒng)交互的信息等原始數(shù)據(jù),經(jīng)過(guò)清洗、濃縮和轉(zhuǎn)換形成便于統(tǒng)計(jì)分析的用戶查閱數(shù)據(jù)庫(kù)、日志數(shù)據(jù)庫(kù)、用戶定制信息庫(kù)、用戶反饋信息等各種數(shù)據(jù)集合。


          讓小客戶做出大貢獻(xiàn)企業(yè)如何與客戶充分溝通【客戶關(guān)系管理技巧】
          客戶消費(fèi)傾向分析【客戶關(guān)系管理技巧】影響農(nóng)村公路水泥砼路面使用壽命的主要因素及對(duì)策
          客戶服務(wù)與客戶溝通的技巧【客戶關(guān)系管理技巧】淺談信息時(shí)代高校檔案信息化管理工作的探索與實(shí)踐
          提高客戶保持率的7大建議【客戶關(guān)系管理技巧】客戶創(chuàng)造了財(cái)富【客戶關(guān)系管理技巧】
          淺談新背景下的高校教學(xué)檔案管理八招教你維護(hù)好客戶關(guān)系【客戶關(guān)系管理技巧】
          淺談高等學(xué)校財(cái)務(wù)電子檔案的管理互聯(lián)網(wǎng)時(shí)代的品牌營(yíng)銷
          正確理解“客戶滿意”【客戶關(guān)系管理技巧】試論檔案信息化過(guò)程中若干問(wèn)題的理性思考
          簡(jiǎn)論學(xué)生健康體檢檔案信息化促進(jìn)健康管理關(guān)于信息公開(kāi)背景下的突發(fā)公共衛(wèi)生事件檔案管理初探
          信息發(fā)布:廣州名易軟件有限公司 http://m.jetlc.com
          • 勁爆價(jià):
            不限功能
            不限用戶
            1998元/年

          • 微信客服

            <output id="r87xx"></output>
          1. 
            
            <mark id="r87xx"><thead id="r87xx"><input id="r87xx"></input></thead></mark>
              • 亚洲成A人片777777久久 | 日本黄色小视频电影 | 大鸡巴操逼视频免费看 | 免费超碰| 大香蕉三级片 | 伊人久久久久亚洲AV无码裤子 | 日韩欧美一区二区一幕 | 逼逼逼逼五月情 | 婷婷无码成人精品俺来俺去 | 97五月婷婷 |