午夜精品视频_亚洲精品久久久久久久久久久_亚洲免费人成在线视频观看_可以免费在线观看av的网站_日韩三级电影免费观看_香蕉夜色

首頁 優秀范文 云計算技術發展現狀分析

云計算技術發展現狀分析賞析八篇

發布時間:2023-11-11 09:18:19

序言:寫作是分享個人見解和探索未知領域的橋梁,我們為您精選了8篇的云計算技術發展現狀分析樣本,期待這些樣本能夠為您提供豐富的參考和啟發,請盡情閱讀。

云計算技術發展現狀分析

第1篇

關鍵詞:云計算;云計算產業;發展研究

中圖分類號:F425 文獻標志碼:A 文章編號:1673-291X(2013)17-0066-04

引言

2008年的世界金融危機給各國經濟帶來了沉重打擊,其影響至今尚未消除。世界各發達國家為了擺脫經濟困境,積極致力于發展戰略性新興產業,以尋求新的經濟增長點,占領未來全球競爭的制高點。其中,云計算產業同智慧地球、物聯網等概念一起迅速成為全球各界的關注焦點。云計算產業的發展能夠節約用戶數據中心建設費用、計算機軟硬件購置費用,大大提高資源的利用效率,促進信息的高度共享,因而,云計算產業被視為信息產業的未來發展方向和革命性變革之一。

目前,中國的云計算產業發展正處于快速成長期,預計在2015年之后將進入成熟期,云計算模式將會被廣大用戶接受[1],未來市場非常廣闊。中國各級政府、電信基礎運營商和云計算應用開發商紛紛向云計算產業進軍,以便在新一輪技術發展浪潮中抓住戰略機遇,占據國際產業分工制高點。基于此,本文在對云計算、云計算產業相關概念界定的基礎上,進行了云計算價值鏈與服務模式介紹,歸納與總結中國云計算產業發展現狀以及主要制約因素,并為中國云計算產業的發展提出相關對策與建議。

一、云計算與云計算產業相關概念

(一)云計算的定義

盡管云計算概念進入人們的視野已經有一段時間,不少國際IT企業如IBM、Google、Amazon等也紛紛從各種角度詮釋云計算。但云計算至今尚未出現確切的定義。

維基百科(Wikipedia)認為,云計算是一種基于互聯網的計算新方式,通過互聯網上的異構、自治的服務為個人和企業用戶提供按需即取的計算。中國賽迪顧問認為,云計算是一種IT資源的交付和使用模式,通過網絡以按需、易擴展的方式獲得所需的資源(硬件、平臺、軟件及服務等),提供資源的網絡被稱為“云”。“云”中的資源在使用者眼中是隨時可以獲取、按需使用,隨時可以擴展、按使用付費的。

綜合上述觀點本文認為云計算是一種信息技術資源的交付和使用模式,計算機軟硬件與數據處理等功能可以作為一種商品在網絡上進行流通,用戶可以通過網絡獲得所需的相應資源;同時云計算也是一種新型的服務模式,云服務提供商將資源進行整合,為用戶提供按需的服務形式。

(二)云計算產業

業界專家對云計算產業的概念也沒有一個統一的認識。現有研究只是形成了對云計算產業的產生路徑、基本特征和范圍形成了一些基本看法。

關于云計算產業產生的路徑,祝小云(2011)認為,云計算產業由傳統的IT產業、通信產業、廣電傳媒和互聯網產業相互融合產生[2]。云計算產業對傳統產業技術和資源實現了整合,因而具有具有資源整合性和壟斷行的特征。

筆者認為,云計算產業是傳統的計算機產業與互聯網產業相結合的產物,以云計算技術為基礎,提供云服務,具有強大的匯集整合資源能力,為社會各個部門提供軟硬件資源與信息處理能力的知識和技術密集的產業,是信息產業的未來發展方向。

二、云計算產業價值鏈條與服務模式

(一)云計算產業的價值鏈

一般認為,云計算產業價值鏈條主要包括以下幾個基本環節:運設施提供商、云平臺提供商、云應用開發商、云服務運營商以及云系統集成商云計算產業價值鏈如圖(見圖1)。由此可以出云計算產業價值鏈涵蓋了諸多傳統IT產業,包括從芯片、服務器、PC、網絡設備、存儲等硬件設備,到平臺軟件、中間件、應用軟件、信息安全廠商,到IT服務運營和外包服務商,再到電信運營商,最后面向政府、企業、個人用戶。

(二)云計算產業服務模式

根據目前國內外云計算發展實踐,云計算產業大致可以劃分為三種服務模式,即IaaS模式、PaaS模式以及SaaS模式。其中:

1.IaaS(Infrastructure-as-a-Service:基礎設施服務模式。該模式主要為用戶提供基礎性的計算資源和存儲資源,用戶可以通過Internet獲得相對完善的計算機基礎設施服務,其典型代表產品是亞馬遜的AWS(Elastic Compute Cloud)。

2.PaaS(P1atform-as-a-Service):平臺服務模式。該模式主要是指將軟件研發的平臺作為一種服務,以SaaS的模式提交給用戶。軟件開發者可以在這個基礎架構之上建設新的應用,或者擴展已有的應用,同時卻不必購買開發、質量控制或生產服務器。其典型代表產品有的、Google的App Engine和微軟的Azure(微軟云計算平臺)。

3.SaaS(Software-as-a-Service):軟件服務模式。該模式面向用戶提供簡單的軟件應用服務以及用戶交互接口等,如同一種軟件分布模式,是最成熟的云計算模式。其典型產品有、NetSuite、Google的Gmail和等。

三種云計算產業服務模式由低到高構成了一個完整體系,從不同層次上為用戶提供資源服務(見圖2)。

盡管PaaS、IaaS和SaaS模式提供的服務內容不盡相同,但是其核心經濟目的是一致的:都是采用外包的方式,減輕企業負擔,降低管理、維護服務器硬件、網絡硬件、基礎架構軟件和/或應用軟件的人力成本。從更高的層次上看,它們都試圖去解決同一個商業問題——用盡可能少甚至是零的資本支出,獲得功能、擴展能力、服務和商業價值。當某種云計算的模式獲得了成功,這三者之間的界限就會進一步模糊,成功的SaaS或IaaS服務可以很容易地延伸到平臺領域[3]。

三、中國云計算產業發展現狀

(一)云計算產業市場規模增長迅速

中國云計算產業市場規模呈現快速增長態勢。計世資訊提供了一種包含搜索引擎與網絡游戲的口徑較寬的統計數據,認為2009 年云計算應用的市場規模已達403.5 億元,比2008 年的315.2 億元增長了28%。另外,根據賽迪顧問的統計結果,2009 年中國云計算市場規模為92.23 億元,比2008 年增長26.85%。根據賽迪顧問2012年的《中國云計算產業發展白皮書》,初步估計2012年中國云計算產業市場規模為606.78億元,相對于2009 年中國云計算市場規模92.23 億元,年復合增長率為87.4%。由此可可見,中國云計算產業正處于市場起飛期,未來發展前景廣闊。

(二)云計算服務模式相對單一

云計算服務分為硬件層的基礎架構云(IaaS)、平臺云(PasS)和軟件應用云(SaaS)三個層次,從長期來看,在云計算的產值中應該呈現均衡發展的格局。但是,中國目前云計算產業服務模式比較單一,大多數的云計算服務主要以PasS和SaaS的形式提供給用戶,在IaaS層則主要依賴于技術實力強勁的IBM、谷歌等國際公司。計世資訊的研究提供了云計算應用的細分市場結構,其中,以軟件即服務(SaaS)為代表的云應用服務所占市場比例最大,是目前云計算服務的主要方式。2009 年,SaaS 在云計算服務中所占比例為87.8%,平臺即服務(PaaS)所占比例為11.8%,基礎設施即服務(IaaS)所占比例為0.4% [4]。這表明,中國云計算基礎設施與基礎服務領域非常薄弱,對國外企業的過度依賴很有可能在未來的國際競爭中受制于人。

(三)云計算產業布局缺乏統一考慮

盡管云計算服務在中國尚未真正全面普及,但是國內地方政府對云計算產業表現出了高度的熱情。各地紛紛建立云計算中心,投入相當高,動輒是幾千萬或者是上億元;初步統計,中國正有超過20個城市將云計算作為重點發展產業,例如北京、上海、江蘇、廣東等很多省市都結合自身特色,推出了各自的云計算發展戰略。這種一哄而上的云計算產業發展局面已經嚴重偏離了云計算的本質。我們真的需要這么多云計算中心嗎?這些云計算中心真的能夠高效地為我們提供服務嗎?大多數的云計算中心建設項目不但未能對已經過剩的計算資源進行整合和高效利用,反而演化成為重復建設、重復投資,從而造成更大規模的IT資源浪費。

因此,必須堅持“以市場需求為導向”的原則來發展云計算產業,需要從國家層面上統籌協調、統一考慮,參考各地實際需求來布局,避免重復建設,造成資源浪費。

(四)公有云難以“落地”

公有云是云計算服務的一種形式,在美國和世界很多地區已經大范圍普及,對政府、企業和個人用戶提供了極大的幫助。然而公有云在中國一直難以“落地”,究其原因:一方面是客戶接受程度。根據埃森哲公司對100 多位IT 高級管理人員所做的問卷調查結果顯示,中國企業已開始探索使用云計算,但在態度方面依然謹慎,目前更傾向于創建私有云,而不是使用公有云服務,只有不到20%的受訪企業在使用公有云服務,構建和運行私有云平臺的比例要更高,愿意把核心應用委托給云服務商的用戶極少[4]。另一方面,則是發展環境不成熟。機房基礎設施、網絡環境以及政策管制等都是公有云發展的絆腳石,國際上成熟的云服務比如亞馬遜AWS,微軟Azure和Rackspace等移植到中國困難重重;國內土生土長的阿里云和盛大云等,不僅面臨政策上的限制,也面臨很多基礎設施方面的問題。

四、制約中國云計算產業發展的關鍵問題

(一)安全問題

安全問題是影響云計算產業能否發展壯大的關鍵問題,也是云計算服務用戶所關注的首要問題。云計算安全問題包括兩個方面:一方面是客戶層面的數據安全問題。這些問題表現為計算系統問題造成的數據丟失、黑客攻擊隱私泄密,以及競爭對手通過非法手段竊取商業秘密等。另一方面是國家方面的數據安全問題。公有云計算環境下可能導致有關國家經濟、軍事、政府部門的敏感數據以及科研成果失竊,從而威脅到國家的經濟和社會安全。云計算中的數據對于數據所有者以外的其他云計算用戶是保密的,但是對于提供云計算的商業機構而言確實毫無秘密可言。面對這些潛在危險,商業機構和政府機構選擇云計算服務、特別是國外機構提供的云計算服務時,考慮到安全問題不得不放棄云計算服務。

(二)標準問題

標準問題是云計算產業發展中的又一個關鍵問題。這個問題首先表現在國際統一標準的缺位。雖然目前云計算在國際上已成為標準化工作熱點之一,但多個標準化組織互有交叉和重復,云計算標準還處于草案規劃階段,國際上還沒有形成統一的云計算標準體系。另一方面表現為在國內云計算的標準工作剛剛啟動,還處于起步階段,與國際相比較嚴重滯后,在標準競爭中處于不利地位。總體來說,云計算服務標準的缺失在很大程度上制約著產業的健康發展,只有通過一致的標準才能使得云計算的應用更加廣泛。

(三)人才問題

中國云計算產業的發展中的人才問題突出表現為:一是軟硬件人才在數量上供不應求;二是質量結構不合理,缺乏多層次、復合型、交叉型、國際化的綜合人才。 其主要原因在于:首先是人才培養模式問題。目前中國的應試教育體制使得大學生們缺乏創新的基本思維方式,創新型人才極度匱乏。其次是人才競爭問題。對于關鍵核心技術人才,國際大公司有較大的競爭優勢和吸引力,優秀的畢業生首選外企工作,進一步加劇了中國云計算企業人才短缺困境。

(四)網絡帶寬問題

云計算是基于互聯網絡的應用,網絡的是否流暢直接決定了云計算服務的質量。足夠高的、可靠的、低成本的、容易獲取的帶寬資源,是云計算產業發展的前提和基礎。和國際上美國、日本、韓國等發達國家水平相比較中國互聯網帶寬差距較大,根據DCCI互聯網數據中心《中國寬帶用戶調查》報告,“網民使用的實際寬帶下載速率,低于運營商提供的名義寬帶速率,超半數用戶上網平均速度達不到標定速度”,“使用4M寬帶的用戶中,平均速度在400KB/s以下的占91.2%;使用2M寬帶平均速度在200KB/s以下的占83.5%;使用1M寬帶在100KB/s以下的則占67.6%”。云計算環境下,數據交互大幅度增多,互聯網流量呈幾何式增長,會給本來就發展滯后的互聯網進一步增加服務中斷、網絡延遲等問題,從而嚴重制約云計算產業的發展。

(五)資金問題

云計算產業屬于高風險、高收益的高技術產業,傳統的融資渠道難以滿足云計算企業的資金需求,必須依靠風險資本的運作來推動云計算產業的發展。可事實上,中國目前扶持高技術企業技術轉化的環境還不成熟。在美國,一項創新技術很容易獲得風險投資順利地實現商業化;但是在中國,同樣的技術卻難以獲得風險投資。資金問題也將會嚴重制約中國云計算產業的發展。

五、結論與建議

(一)研究結論

本文在對云計算產業相關概念界定以及云計算產業價值鏈和服務模式分析的基礎上,歸納總結了中國云計算產業的發展現狀,認為中國云計算產業市場規模發展迅速,但是存在服務模式單一、布局相對缺乏統籌考慮、公有云客戶發展滯后等問題,而安全問題、標準問題、人才問題、網絡帶寬問題以及資金問題是制約中國云計算產業的關鍵因素。

(二)對策建議

1.關于政府層面的對策建議。首先,政府要積極制定云計算產業發展政策,構建寬松的發展環境。例如制定相對寬松的政策和標準,細化云安全、云可靠性和市場準入機制。 其次,提高中國網絡基礎設施的質量,尤其要提高中國寬帶網絡的速度和可用性,做好最基本的云計算產業發展保障工作。再次,政策引導與市場化運作相結合,推動中國云計算產業發展。例如重點扶持一批具有國際競爭力的企業以及云計算產業的相關項目;政府率先應用云服務,支持諸如“政務云”、“公共服務云”的建設,起到行業表率和帶動作用。 最后,做好國際對接工作,構建寬松的云計算產業發展國際環境。例如,政府積極參與國際上云計算相關產業政策和標準的起草,確保中國具有與國際接軌的相關政策與標準;鼓勵中國企業和國際領先企業交流、合作,吸取國際云計算應用和服務的成功經驗,避免中國企業在發展道路上走彎路。

2.關于企業層面的對策建議。首先,云計算企業要致力于云計算理念普及,提高用戶云計算接受程度。云計算企業可以借助于各種技術論壇、產業峰會、高峰對話等活動,向潛在客戶展示先進技術理念,可靠、安全、高效的解決方案,不斷擴大企業在中國云計算應用領域的影響力,培育潛在市場。其次,中國云計算產業要形成云計算產業戰略聯盟,壯大中國云計算產業實力。云計算產業企業可通過行業協會、產業聯盟等形式,解決行業發展的共性問題,例如,為云計算產業發展提供策略、規劃及政策建議,積極維護聯盟的合法權益,引領行業自律發展等。最后,積極開展云計算國際合作與交流,吸收借鑒國外的優秀經驗。中國云計算產業還在發展初期,成功的云計算應用案例還不多,經驗與技術的等方面都不成熟。可以借鑒國外政府、交通、教育、物流、制造、流通等各個行業的云計算成功應用案例,為中國云計算產業的發展提供指導。

參考文獻:

[1] 房秉毅,張云勇,程瑩,等.云計算國內外發展現狀分析[J].電信科學,2010,(8A):1-5.

[2] 祝小云.從云計算產業鏈探討中國云計算商業模式[J].經濟視角,2011,(9):61-64.

第2篇

關鍵詞:云平臺;數據挖掘;數字圖書館

中圖分類號:G250.72 文獻標識碼:A 文章編號:1008-0821(2012)07-0046-04

信息技術的快速發展和圖書館服務模式的轉變為以云計算為主的前沿技術在圖書館中的廣泛應用拓展了空間。以云計算為平臺的數據挖掘技術適應了用戶多樣化、迅捷化的需求,有利于用戶在圖書館的海量數據信息中更快、更準確地發現所需信息。近年來,國內外諸多學者對數據挖掘技術及其發展趨勢進行了研究,普遍認為在圖書館中采用數據挖掘技術,有助于數字圖書館的自動化建設,提升服務質量。數字圖書館要適應用戶特定需求,向用戶及時、準確地提供所需信息,必須動態地組織和呈現與用戶當前信息需求相關的信息內容,而數據挖掘可以實現這一功能。基于云平臺的數據挖掘技術是數字圖書館信息資源整合的最佳方法,也是目前世界各國圖書館潛在數據技術挖掘的技術發展趨勢。

1、相關理論綜述

1.1 云計算概述

云計算是指基于互聯網的一種新型的計算模式,即把存儲于個人電腦、移動電話和其它設備上的大量信息和處理器資源集中在一起,把信息資源、數據作為服務通過互聯網提供給用戶。云計算是一種新興的共享基礎架構管理方法,能夠把大量的、高度虛擬化的資源管理起來,形成巨大的系統池,統一提供各種IT服務。云計算依靠B/S架構,把計算壓力從客戶端轉移到服務器端,由技術提供商進行遠程服務支持,是分布式處理、并行處理和網格計算的新發展。其資源和計算都在異地的設備中完成,而自己的終端設備只需要一個顯示設備和操作設備。云計算主要運用虛擬機(虛擬服務器)聚合形成同質服務,強調在某個機構內部的分布式計算資源的共享。

圖書館云計算服務是以虛擬化技術為基礎的,為用戶提供最大限度的信息數據資源。云計算技術能實現海量數據的存儲、分析、處理、挖掘,提供高可靠性、高性能的數據挖掘分析,主要是基于數據挖掘平臺PDMiner(ParallelDistributed Miner),實現了對大數據集的處理、分析,向用戶提供高效的服務。云計算在對海量的數據存儲、讀取基礎上進行大量的分析,數據的讀操作頻率遠大于數據的更新頻率。

1.2 國內云計算市場發展現狀分析

目前,我國已經掀起了發展云計算的熱潮。從政府層面看,政府向來是IT服務方面最穩定的市場,面對社會經濟發展的形勢,政府部門已將云計算與政府的工作緊密結’合,從而成為經濟社會發展的重要支撐;從企業層面看,國內很多企業已利用云平臺對技術、產品、服務等進行了大膽創新,取得了良好的應用實踐效果;從圖書館內部業務層面看,在云計算時代來臨之際,考慮到服務方式的轉變、信息數據的挖掘及未來數據庫的采購等問題,也已經將云計算視為發展的重要保障。有學者認為,當前幾乎所有的云服務都可以在圖書館領域得到應用,包括大量的軟件服務、云存儲服務、平臺服務和互聯網整合服務等。圖書館充分利用云計算技術,推進現代化建設和信息服務進程,進一步提升自身的信息資源建設與信息服務提供能力,顯然是一種不可回避的選擇。目前,圖書館界正在積極探討如何將云計算和云服務應用到圖書館的資源建設與服務提供中。中國高等教育文獻保障系統正在完成CALIS數字圖書館云服務平臺,構建大型的分布式公共數字圖書館服務網絡,力圖將分布在互聯網中各個圖書館的資源和服務整合成為一個整體,形成一個可控的自適應的新型服務體系。這一系統架構是以SOA規范為基礎。以OSGi標準對各個服務進行統一封裝,為服務提供者提供統一的服務功能,為消費者和提供者之間提供統一的通信方式。為實現來自不同服務平臺、系統的服務整合,CALIS整個云服務平臺提供了統一開放API,統一的API托管以及統一的認證服務。CALIS及其成員館提供了靈活的部署和應用方式,既能滿足CALJS構建公有云服務中心的需要,也能滿足圖書館構建私有服務云的需要,還能實現對這兩類服務云的整合。到目前為止,CALIS云服務平臺的基本框架已經完成。國外較有代表性的云服務應用先例主要有美國國會圖書館與DuraSpace公司共同啟動的Dur-aCloud項目。可以說,云計算對圖書館而言并不顯得虛無縹緲,只有抓住這一大好機遇,明確自己在云計算環境中的發展定位,完善網絡服務設施,提高公共服務的水平,才能進一步提升自身的社會價值與地位。

1.3 數據挖掘技術相關理論

數據挖掘(Dam Mhhg)技術是一種新興的信息處理技術,源于20世紀90年代中期,作為知識發現的關鍵步驟,數據挖掘對于用戶從海量數據中提取有用知識具有重要作用,這一新興技術涉及到多個學科領域,如模糊數學、人工智能、機器學習等。數據挖掘方法也在近年來不斷發展,從仿生算法、數據庫法(多維數據分析、OLAP等)到目前盛行的領域驅動數據挖掘(DDDM)方法,可以說日新月異。

數據挖掘也稱數據庫中的知識發現,就是有效地從大量的、不完全的、模糊的、圖書館數據倉庫中,提取在隱含在其中的、人們感興趣的且事先不知道的、潛在的有用信息和知識的過程,并利用各種分析工具在這些海量數據中發現模型和數據間關系,從數據庫中的大量業務數據進行抽取、轉換、分析,從中提取有用的知識、高層信息或輔助決策的關鍵性數據。隨著圖書館信息化程度的提高,數據量不斷積累膨脹,為進一步的數據挖掘提供了豐富的數據信息資源。可以最大限度地滿足各類用戶的知識信息需求。用戶從數據庫中提取所需數據,對其進行進一步的集成和合并,利用合適的數據挖掘技術,對相應信息資源進行整合,從而為決策提供更為有效的幫助。

2、數據挖掘技術及在圖書館中的應用

隨著圖書館數字化程度的推進,如何運用新技術挖掘潛在的信息資源,為服務讀者和科學管理提供可靠的依據,成為圖書館界關注的問題。主動發掘讀者需求,提供讀者所需信息,是現代圖書館的重要工作任務之一。由于每一種數據挖掘技術方法都有其自身的特點和實現步驟,因此,成功應用數據挖掘技術達到最終目標的過程相當復雜。這一過程是基于約束的、人機結合、往復循環、不斷逼近目標、深層次的知識發現過程。其基本處理流程包括:數據收集、數據整理、數據挖掘、知識的獲取等,數據挖掘的每個過程不是一次就能完成的,而是一個循環迭代的過程,只有這樣才有可能達到預期的效果。

2.1 建立數據倉庫

數據挖掘的技術基礎之一是數據倉庫,而數據倉庫技術是源于數據庫的技術,它主要的設計思想是將分析決策所需的大量數據從傳統的操作環境中分離出來,把分散的,難以訪問的操作數據轉換成集中的、統一的、隨時可用的信息而建立的一種數據庫存儲環境。人們對數據倉庫的定義是面向主題的,集成的,具有時間特征的,穩定的數據集合,用以支持經營管理中的決策制定過程。為什么要建設數據倉庫的主要原因在于:數據倉庫可以說是決策支持系統,它是在管理信息系統的基礎上發展起來的,數據倉庫提供的經過整理統計歸納的數據可以給決策者很多信息,并通過數據幫助決策者做出決策。所以建立數據倉庫是很重要的事情。

建立圖書館的數據倉庫,用以收集信息。在學校圖書館管理系統中,全面實行校園一卡通,這樣為直接收集讀者的借閱數據提供了便利。下面本人簡單說明針對圖書館數據倉庫事實表和維表的設計。

在借閱過程中,以學生、書籍、借閱時間三方面定義3個維度來建立維表,然后建立事實表,來收集信息。維表包含的是相應維度的描述信息,這些信息用作查詢的約束條件,一般是離散的,描述性的,不具有可加性的。如圖1-3所示:根據圖書館數據倉庫建立的3個維表:學生維表、圖書維表、借閱時間維表。

數據倉庫多,一般多采用多維數據模型,這樣能更好的完成多維數據分析的需要。多維數據模型普遍采用的一種非常重要的模式就是星形模式,星形模式是由事實表和維表通過星形方式來連接而成,事實表包含的是借閱數據信息,這些信息用于分析型查詢。數據取值通常是可度量的。連續型的,且具有可加性,數據量可以達到幾百萬甚至上億條記錄。事實表中的借閱數據信息可以從多個維度查看,每一個維度對應一張維表。如圖4所示:

在數據倉庫星形建模的基本工作完成之后,就應該開始進行數據聚集的設計。數據聚集是數據倉庫系統的必備內容,它與分析型應用的需求密切相關,且與事實表和維表的設計緊密聯系。就工作的時間和內容而言,它是數據倉庫多維數據建模的后期工作,是事實表和維表設計工作的延續。

創建數據聚集首先確定數據聚集的內容,步驟如下:

(1)確定在各個維的哪些屬性上需要進行數據的聚集,這里以時間維的月份和年份,圖書維的圖書種類,學生維的專業建立數據聚集。

(2)確定不同維的屬性如何進行組合。

數據聚集建立后,由于分析型查詢一般都比較復雜,數據倉庫的數據量一般有比較大,因此建立索引提高數據倉庫中數據的訪問速度具有重要意義。所以這里還要建立索引。

明確了數據倉庫體系結構的基本方案,完成了數據模型的設計后下面考慮數據預處理問題。對事實表和維表進行一些數據凈化等工作。

數據倉庫經過以上經過建設后。我們還要對數據倉庫進行運行和維護。

2.2 在數據倉庫中進行數據挖掘

數據挖掘建立在數據倉庫的基礎上,前面已經介紹了一些數據倉庫的相關知識,它們二者之間有著緊密的聯系。數據倉庫為數據挖掘提供了數據基礎,數據倉庫完成了數據的收集、集成、存儲、管理等工作,數據挖掘面對的是經過初步加工的數據,使得數據挖掘能更專注于知識的發現;而且由于數據倉庫所具有的新的特點,又對數據挖掘技術提出了更高的要求。可以說,數據挖掘技術和數據倉庫技術結合起來,能夠更充分的發揮數據的威力。

通過利用圖書館的數據倉庫,采用數據挖掘中的聚類分析技術為解決圖書更新周期問題和合理購買新書的問題提供了技術支持。本文主要應用基于密度聚類的分析方法。

基于密度的聚類方法是以局部數據特征作為聚類的判斷標準,類被看做是一個數據區域,在該區域內對象是密集的,對象稀疏的區域將各個類分隔開來。多數基于密度的聚類算法形成的聚類形狀也可以是任意的,并且一個類中對象的分布也是可以是任意的。這里主要介紹DBSCAN算法。

DBSCAN算法的主要思想是可以通過其要求的兩個輸入參數:半徑r和對象最小數目MinPt來進行描述,即一個對象在其半徑為r的鄰域內包含至少NinPts個對象,那么在該區域內的對象是密集的。DKSCAN算法中的類被看做是一個個按一定的規則確定的最大密集區域,被稀疏區域分離開來。沒有被包含在任何類中,即存在于稀疏區域中的對象被認為是噪聲。

采用DBSCAN算法的聚類過程通過收集直接密度可達的對象來完成。針對聚類對象集中的每一個對象p檢查其r鄰域內是否至少包含MinPt個對象,也就是確定對象p是否為核心對象。如果p是核心對象,那么就創建一個初始類C,C中包含對象p及從p直接密度可達的所有對象,也就是包含p及其鄰域r內所有的對象。然后在確定該鄰域中的每一個對象q是否為核心對象。如果是核心對象,那么就將其r鄰域內尚未包含在類C中的所有對象追加到C中。并繼續確定這些新追加到c中的對象是否為核心對象,如果是,則繼續進行上述對象追加過程。這一過程一直持續到沒有新的對象可以追加到C中為止。類C也就完全確定下來了。DBSCAN算法的優點是形成的聚類形狀可以是任意的。并且不受異常值的影響。

通過數據挖掘技術,我們可以分析出哪些圖書已經利用價值不高;估算出每一種圖書大概的利用周期等。定期的對圖書館的圖書進行更新,舊書入庫,新書上架,使得圖書資源永遠保持最高的利用率。在新書購買問題上,我們通過數據挖掘技術分析內部的歷史采購數據,讀者數據,數據流通,反饋信息等得出的信息,提煉出哪些書讀者最感興趣;哪些書是圖書館的主流;人們在不同時間都使用哪些書等,我們可以根據這些數據做出相應決策。

3、基于云計算的圖書館數據挖掘平臺架構

基于云計算的圖書館數據挖掘平臺架構設計如圖5所示。自下往上每層都為上層提供服務,模型數據層為云平臺提供相應的應用接口,應用表現層提供用戶訪問界面和開放的應用接口,可以向用戶提供共享平臺的數據集及相關算法,從而體現出圖書館云平臺的數據信息共享性和開放性。

模型數據層是實現基于云圖書館數據挖掘平臺中的基本數據結構,把底層異構數據庫中的異構數據映射到圖書館平臺應用表現層,調動圖書館內存儲的各種資源對象,包括資源文件、元信息數據、元數據目錄等等。應用數據挖掘技術對采集的評價數據進行挖掘分析,發現隱藏在數據中有用的知識,并將其提取出來供用戶借鑒。用戶可以根據系統挖掘出的規則,作出相應的決策。根據系統已經采集到的評價數據,可以挖掘出自己需要的信息。

控制算法層是實現基于云圖書館數據挖掘平臺中的內部數據處理,在模型數據層的對象層上建立圖書館平臺的內部算法集,可分為多個模塊實現,每個模塊完成一種功能。圖書館云服務平臺通過對數據庫的管理和部署,提供大規模原始數據、半結構化數據和經過處理的結構化數據,采取一定的挖掘規則(如關聯規則、聯機分析處理等),利用數據挖掘技術對這些經過處理的數據進行融合分析,有針對性地為用戶提供個性化服務,這是數字圖書館的核心部分。個性化服務主要包括:發現新的相關信息或書目數據時,及時告知用戶;用戶訪問時,發現用戶的最新需要,提供相應的預測報告、動態分析等。圖書館控制算法層可判斷并爭取潛在用戶,并將其轉化為當前用戶等等。

應用表現層是實現基于云圖書館數據挖掘平臺服務的方法,應用表現層是對模型數據層和控制算法層的操作進行抽象,利用“云圖書館”不同模塊的功能,對分布在不同地點的服務器聯接起來,進行統一調度管理,虛擬出一個統一的服務器系統,同時可以不斷增加新的服務器和節點,或刪除不必要的服務器和節點,以實現較高的計算性能,滿足和保證不斷增長的計算需要。

基于云計算的圖書館數據挖掘平臺將會為用戶帶來如下好處:

(1)用戶無需安裝任何軟、硬件,只需通過網絡配置接人系統網址,即可享受新技術帶來的便利。

(2)基于云計算體系,服務器集群可提供高可靠性,為用戶提供持續服務。

(3)可以有效地對服務器上的服務進行有效監控,第一時間發現問題。通過挖掘異常數據,進行有效報警。

(4)云圖書館能將不同地域的數據、信息資源集成在一起,避免了資源重復,同時形成資源互補,有利于實現數字圖書館的數據信息資源共享。

4、數據挖掘技術應用于“云”圖書館的未來展望

根據以上分析,我們可以發現,應用數據挖掘技術為圖書館的數字資源組織和管理、服務質量提升和方式拓展等方面提供了技術支持。現在,圖書館還處于云計算應用的初級階段,云計算作為一種新的能體現互聯網精神的計算模式,未來必將會產生強大的生命力,最大限度地發揮圖書館的作用。

主站蜘蛛池模板: 国产美女高潮 | 国产免费一区二区三区最新不卡 | 国产在线国偷精品产拍 | 91精品久久久久 | 国产精品美乳一区二区免费 | 久久av免费观看 | 四虎国产精品成人免费影视 | 视频一区欧美 | 91麻豆产精品久久久久久 | 日韩精品免费在线 | 免费观看www免费观看 | 黄色在线免费观看 | 欧美一区不卡 | 欧洲在线一区 | 操到爽| 欧美精品在线看 | 久久中文字幕一区 | 免费国产视频 | 日本在线三级 | 日韩草比 | 国产一二在线 | 99久久精品无免国产免费 | 国产一区在线播放 | 亚洲欧美日韩国产 | 天天色影院 | 最近日韩中文字幕 | 日韩久久网站 | 中文字幕一区二区三区四区五区 | 成人欧美一区二区三区在线播放 | 成人国产精品 | 日韩av在线中文字幕 | 亚洲一区二区三区四区的 | 一区二区三区在线免费看 | 日韩有码电影 | 久久九九免费 | 久久99国产精品久久99大师 | 国产日韩在线视频 | 国产1页| 日本一区二区在线视频 | 欧美在线网站 | 欧美精品亚洲 |