發(fā)布時間:2022-05-05 14:41:45
序言:寫作是分享個人見解和探索未知領域的橋梁,我們?yōu)槟x了8篇的大數據技術論文樣本,期待這些樣本能夠為您提供豐富的參考和啟發(fā),請盡情閱讀。
PDA也可以稱為個人數字化助理,簡稱為掌上行機,它的優(yōu)點是形狀很小,攜帶很方便,可以把它放在手上或者口袋。很便于輸入數據,操作結構很簡單,使用起來很方便,可使用手接觸或者筆輸入信息,耗費功能很低,電池能使用的時間很長,通信里很強,可以使用藍牙、紅外接受發(fā)送信息,價格實惠。現在很多PDA使用windowsCE來進行操作,用來開發(fā)windowsCE系統(tǒng)功能,就像是在計算機的桌面進行開發(fā)軟件程序一樣,構建一個比較有相對性的移動設備。
2分析PDA和全站儀中的數據
2.1串口技術
使用Wicrosoftwindows開發(fā)串口系統(tǒng),進行有以下方式:a.使用windows來進行通信函數.b.windowsAPI對端口進行讀寫或者開發(fā)其它程序,對串口實行操作步驟。C.串口中的組件通信,比如Activek控制MSCcomm。根據以上介紹的幾種方法,比如b需要熟悉電路結構,驅動層次比較深,需要有比較強的專業(yè)技能,如C方式簡便,不能使EmbeddedVisualC++所接受,該程序就是應用windowsAP來進行通信函數。
2.2串口施行步驟
windows的讀寫文件方式不一樣,它主要使用windows結構中的多線程,然后再后臺進行串口讀寫,正常使用程序就要在前臺進行。進行改善1/0的速度,使用windows結構中的多線程,可以使用它來進行開發(fā)非單一系統(tǒng),windows不能操作1/0的異常操作,可以使用它來進行操作串口,使用異步的方法,可以提高系統(tǒng)的操作能力。工作效能比較高的串口是事件驅動。應用這種方法有比較高的時實性,主要是針對一些比較廣泛的串口,跟查詢的方式不一樣,不是只對那個串口進行查詢。是以中斷的形式來進行,一般運行中斷時,確定的事件發(fā)生變化時,windows系統(tǒng)就會發(fā)出信息,才能有針對性的進行處理,確保數據存在。
3開發(fā)通信程序
3.1串口通信應用API函數
⑴串口進行打開關閉。在應用程序中用Create-File函數把串口打開,注意事項主要有:A.串口名后面需要加個冒號(:)。B.PDA的串口就是全部已經打開的串口,只含COM1。C.應用的參數定為零,安全沒有危險性的參數定為NULL。應用Close-Handle可以把串口關閉。⑵對串口進行配置。串口配置與PDA通信中的參數進行配置一起,這樣才能達到通信的效能,因此配置也是比較重要的一個步驟。LPDCB主要是針對DCB結構,DCB結構是對串口的進一步描述,串口的波特率主要是由DCB中的BaudRate來確定,原因是CE對非二進制不能進行輸送,所以fBinary要設定為TRUE,ByteSize是指字節(jié)在進行發(fā)送時接受到的數據。Parity是奇偶校驗,StopBits是停止位數,⑶對串口進行讀寫。串口進行讀寫時可以使用ReadFile和WriteFile函數實現,主要是串口進行讀寫時速度不是很快,⑷對串口進行異步讀寫,CE不能進行操作輸入輸出的功能,因此只能應用讀寫進行重復操作。第一,設定串口EV_RXCHAR要用SetCommMask函數來實現,應用WaitCom-mEvent阻攔線程,指直到把事件EV_RX-CHAR設定好,字符要應用回調函數來進行處理,續(xù)等發(fā)生事件。
3.2隔開水平角、豎直角、距離及進行組合測量
在測量過后,需要測出水平角,偏心的水平角與距離不能合在一起測量,測量時要分開進行,因此應用程序能進行水平角和豎直角及距離分開測量以及組合測量,進行測角時不能僅僅依靠棱鏡。所以,可以應用水平角和、豎直角、距離重復選框來進行模擬。針對不一樣規(guī)模的全站儀,使用的方式也不一樣,索佳操作的模式只含有一種規(guī)模的全站儀,只需要點擊按鈕即可,假如選擇斜距就進行輸送測角距,沒有選中斜距進行輸送測角距,收到的數據后。在根據模塊來分析與選取有針對性的數據,拓撲康是第二種模式,在選中斜距時,還要在斜距中的復選框中進行點擊,在進行輸送時改變測量距離的模式,進行發(fā)送時。進行驅動測量,跟讀取指令是一樣的。
3.3處理已經接收到的字符串
⑴ASCII編碼是已經收到的字符串,可以使用MultiByteToWideChar函數轉變成Unicode編碼然,在進行處理。⑵測量指令在進行發(fā)送出去后,全站儀中的數據不是一次性發(fā)完,應該是分層次來進行發(fā)送,因此,字符串要直接連接到字符串,才能完成接受任務。⑶字符串的主要任務就是接收完后,要依據復合框進行有效的選擇,分析全站儀的字符串,也會顯示的很清楚。⑷拓撲康是第二種模式,符串后的任務就是接受,在輸送時顯示清楚。相反,就會把全站儀輸送數據全部給PDA,造成不良后果。
4應用在實際生活中
VC++2005smartdevice的MFCsmartdeviceApplication,PDA與全站儀中的通信主要依靠多線程來完成,使他們能夠穩(wěn)定運行。根據太原市在進行測繪進行探索指出,外業(yè)進行采集時,效果是良好的。全站儀中的數據直接讀取,防止在讀、記方面存在有誤差。不過,對存在有誤差的數據要自動檢查,防止2C差、差互差、2C互差的影響產生誤差,而不能及時的進行檢查,而導致返工現象的發(fā)生,工作效率的提高,PDA儲存的文件就是測量的結果,外業(yè)任務完成之后把所得出的結果直接輸入到PC,經過對程序的進一步分析,能直接評估精準度及計算坐標,不使用人工來進行操作,從一定程度上減少了工作人員的工作量,也能減少造成不要的麻煩,有效的提高工作效率。
5結束語
(一)大數據增值價值巨大,商業(yè)價值、經濟價值和社會價值不可估量,終極價值在于助力社會進步與升級。美國奧巴馬政府將數據定義為“未來的新石油”,是對其價值最生動的再現。大數據雖然價值密度低,但通過對數據的處理、整合和分析并使用,可創(chuàng)造出巨大的商業(yè)價值、經濟價值和社會價值。面向大數據市場的新技術、新產品、新服務、新業(yè)態(tài)已不斷涌現,大數據成為經濟高速增長的新引擎,正在“吞噬”和重構傳統(tǒng)組織架構,必將引發(fā)政府、公共事業(yè)、制造業(yè)、流通等領域全方位變革。特別是人機“生命共同體”快速進化,大數據將為人類的生活創(chuàng)造前所未有的可量化的維度,成為當代文明建設的助力器,讓社會得以革新與升級,最終改變未來。
(二)大數據橫空出世,源于個人全球化、記憶數字化、社會網絡資本化的全力驅動,是IT業(yè)發(fā)展演進的歷史使然。大數據不是突然產生的,是IT技術發(fā)展的必然產物。大數據浪潮主要源于三大驅動力推動。一是互聯(lián)網、移動互聯(lián)網及物聯(lián)網等新一代信息技術,實現了信息、知識和社會關系網絡乃至“個人”全球化,為大數據提供了廣泛的數據來源。二是數據開放運動和數據民主化,實現了數據的分布式共享和全球性覆蓋,云計算等廉價、高效的存儲提取方式,讓數據成為“共享的社會記憶”,客觀上開啟了大數據時代大門。三是挖掘復雜社會網絡資本價值,加速了大數據技術的深度應用,構成了大數據的經濟驅動力。全球化、數字化和社會網絡資本化齊力推動了大數據大發(fā)展。
二、大數據:國家審計改革發(fā)展新動力
正在發(fā)生和演變的趨勢表明,大數據時代無論對于社會、組織還是個人,都是一次革命,一個巨大的挑戰(zhàn),一個重大的轉型機遇和飛躍的契機。國家審計無疑也是如此。1.飛速發(fā)展的經濟社會新實踐,必將推進國家審計理論與時創(chuàng)新。當前,人工智能、社交網站、RFID、語義網、云計算等技術或理念風馳電掣一般闖入我們的工作生活,數據開放、軟件開源、普適計算、智慧地球等新思想令人眼花繚亂,新的技術和觀念層出不窮。在信息技術環(huán)境下,豐富多彩的經濟社會實踐,通過信息交換、權能傳遞和功效聯(lián)動等方式,將先進的信息技術、網絡技術、網絡時空觀、數據挖掘、系統(tǒng)集成以及多媒體等多種學科理論和技術思想深層次地植根于審計理論,刺激審計理論的變革和創(chuàng)新。同時,國外一些先進管理理念,如企業(yè)再造工程、虛擬組織、穆爾法則(Mooreslaw)、基爾德法則(Gilderslaw)和麥特卡夫法則(Metcalfeslaw)等,與傳統(tǒng)審計理論進行分化、碰撞、對接與融合,必將從廣度和深度上推進審計理論不斷繁衍與創(chuàng)新,審計理論將呈現多樣性、交融性和虛擬性。2.審計客體內涵和外延的擴張,必將呼喚國家審計權力邊界順勢突圍。近年來,經濟社會實踐活動中,計算機、數據庫、網絡等現代信息技術得到了廣泛運用,實物流、資金流表現向無紙化、數字化和信息流的轉變,業(yè)務處理和財務管理逐步實現自動化和網絡化,國家審計的審計內容、審計對象、審計資料、審計證據線索等都呈現出普遍電子化、數字化的特點。從而擺脫了傳統(tǒng)帳套、傳統(tǒng)財務信息、紙質的業(yè)務軌跡,從被審計單位的財務收支及有關的經營管理活動,會計資料和其他相關資料,擴展到電子數據、系統(tǒng)內部控制和信息系統(tǒng)自身;從財務數據延伸到業(yè)務數據;從內部數據關聯(lián)到外部數據,審計客體外延和內涵的擴張,突破了以財政財務收支、紙質載體為主的審計權限范圍。必然要求法律賦予審計部門數據采集、技術偵查、行政強制、訴訟等更多權力,以應對大數據時代的高科技舞弊,確保審計職能的充分發(fā)揮。3.新型大數據技術的廣泛應用,必將推動國家審計作業(yè)流程優(yōu)化再造。聯(lián)機分析、數據挖掘、WEB2.0互聯(lián)網審計、云技術等大數據技術普遍運用,將所有的審計內容、審計技術、審計方法納入大數據審計之中。傳統(tǒng)的現場審計作業(yè)流程必將改造優(yōu)化為:了解調查,獲取信息;采集數據,整理數據;進行數據轉換、清理和驗證;創(chuàng)建審計中間表;進行數據分析,找出審計重點;構建審計分析模型,分析數據;延伸落實,審計取證。數據分析成為審計作業(yè)的核心。信息技術還可以優(yōu)化審計項目管理,如利用信息技術為審計項目管理內置一個標準的、符合質量要求的審計作業(yè)流程,用以規(guī)范審計人員的審計作業(yè)行為,使不同背景、不同水平的審計人員能夠執(zhí)行相同的審計動作。通過虛擬組織形態(tài)和數據集成智能化管理,實行遠程控制審計項目,包括審計方案的控制、分工控制和授權控制,為質量控制和風險預防搭建一個良好的、高效的管控平臺。4.國家審計供需矛盾更為激烈,必將要求國家審計主體能力自我革命。審計作為綜合性經濟監(jiān)督部門,覆蓋領域之廣,涉及的經濟社會活動之多,所產生和集聚的數據規(guī)模不可謂不大。大數據價值的發(fā)現和挖掘,必定給審計創(chuàng)造了更多需求,打開了更廣闊的市場,對審計供給能力提出了新挑戰(zhàn)。而決定審計供給能力的關隘就是國家審計主體能力。大數據時代,IT審計師將主導國家審計舞臺。而目前,大部分審計人員主要精通財會知識,計算機知識和技能比較欠缺,知識結構還不能滿足大數據技術的要求,數據分析與管理高端人才緊缺。審計人員除了要有專業(yè)的審計、會計知識外,必須精通信息技術,掌握網絡、數據庫、電子商務、信息系統(tǒng)的開發(fā)與管理和計算機輔助審計技術。優(yōu)化審計人員能力結構,增強審計干部信息化審計基礎能力、數據采集處理和分析能力、監(jiān)測指標和模型的構建和分析能力、信息系統(tǒng)內部控制測評能力,尤為緊迫。
三、大數據背景下國家審計發(fā)展路徑
無論是組織結構,還是國家文明,只有充分發(fā)揮大數據時代的價值、迎接好大數據面臨的挑戰(zhàn)并積極應對,才會處于不敗之地。因此,國家審計應放眼未來,以大數據審計為目標,加快改革創(chuàng)新步伐,搶占審計發(fā)展的突破點和制高點,迎接新時代挑戰(zhàn)。
(一)加快理論創(chuàng)新,為大數據審計落地提供實踐指南。要堅持實踐上的“摸著石頭過河”與理論上的“頂層設計”相結合,加強審計理論和實務的研究,在理論上對大數據審計的性質以及由此決定的審計職能與任務等基本問題進行深入研究,構筑起適應大數據時展的、可用于解釋和預測多種審計現象的審計理論。加強與國家信息化咨詢委員會、公安部、發(fā)改委、工信部、財政部和國家信息中心等相關部門的合作研討,多角度、更準確地把握客觀現實及政策約束;組建由學術界專家、審計研究人員和實務骨干組成的團隊,承擔把握前沿熱點、規(guī)劃審計思路等工作,為加快大數據審計實踐提供操作指南。要制定大數據審計發(fā)展的長遠規(guī)劃,堅持把大數據審計作為國家審計發(fā)展的核心戰(zhàn)略,從數據、制度、人才和技術等方面逐步積累基礎資源,有計劃、有步驟、長期不懈地堅持推進。要加大宣傳,營造數據審計文化氛圍,革新思想觀念,樹立正確數據觀,建立基于全數據模式、從整體到局部的審計思維模式,用大數據時代精神武裝頭腦。
(二)加快制度創(chuàng)新,健全完善大數據審計相關法規(guī)建設。目前,我國電子商務、網絡經濟和計算機應用相關法律法規(guī)制定相對滯后于經濟社會實踐活動,有些甚至還是盲區(qū),導致大數據審計的法律地位和權限虛置。要加強電子商務、網絡經濟等相關立法,把電子合同、電子憑證、電子證據、電子簽名的法律效力和保管要求,數據認證機構的管理,電子信息與網絡安全等相關問題,以法律法規(guī)的形式明確固化下來,為大數據審計提供法律依據。要強化審計權威,擴大審計權限,賦予審計審查審計對象計算機信息系統(tǒng)的功能與安全措施,利用網絡和審計軟件進行審計,接入、采集、存儲、提煉審計對象所有數據等的權力。要堅持本土自創(chuàng)與模仿移植相結合,建立健全與大數據時代相適應的審計標準和準則,如制定大數據審計評價準則、技術標準,數據挖掘分析指南,信息系統(tǒng)輸入—處理—輸出的符合性和實質性測試的準則,云計算以及網絡審計準則等,確保大數據審計有法可依、有章可循。
(三)加快機制創(chuàng)新,積極構造政府主導、審計主推、IT企業(yè)參與的大數據審計聯(lián)動機制。大數據技術在國家審計領域中的推廣應用是技術進步的必然要求,但根據國家審計行業(yè)自身的特點,其無法自發(fā)地獨自實現,必須積極構造政府主導、審計主推、IT企業(yè)參與的多點支撐聯(lián)動機制,形成聚合效應。對政府而言,要積極把握大數據戰(zhàn)略機遇,制定積極的政策法規(guī),提供高質量的網絡基礎設施,營造適度寬松的大數據發(fā)展環(huán)境,鼓勵企業(yè)、審計部門進行大數據相關的技術研發(fā)與應用創(chuàng)新,從標準、法律和意識形態(tài)層面大力引導大數據審計發(fā)展。對審計部門而言,要制定戰(zhàn)略數據儲備計劃,加快與被審計單位數據實時互聯(lián)互通,消除“信息孤島”,為大數據審計提供數據載體;要逐步建立完善中央和地方的審計數據中心,構建審計管理、審計業(yè)務、審計方法和評價信息資源庫,加快推進國家電子審計信息資源目錄體系和交換體系建設,實現數據大集中。對IT企業(yè)而言,要深刻洞察大數據審計的需求,提供從硬件到軟件、從產品到服務的一體化解決方案;要專注細分領域創(chuàng)新,提供具有審計行業(yè)特色的大數據審計專家級方案。
(四)加快應用創(chuàng)新,不斷研究、探索、實踐大數據審計技術方法。可以預見,大數據時代,審計人員時時刻刻都需要利用信息技術手段處理各種審計業(yè)務和工作。要結合審計工作實際,認真研究并積極實踐A/B測試、關聯(lián)規(guī)則挖掘、分類、數據聚類、眾包、數據融合和集成、數據挖掘、集成學習等大數據分析技術,BigTable、商業(yè)智能、云計算、Cassandra、數據倉庫、數據集市、分布式系統(tǒng)等大數據處理技術,以及標簽云、Clustergram、歷史流、空間信息流等可視化技術。要深度分析挖掘審計部門的大數據價值,從“業(yè)務驅動”轉向“數據驅動”,實現審計決策和管理智能化。通過云計算的IaaS、PaaS和SaaS三大服務模式,建立國家層面的跨行業(yè)、跨領域的審計私有云和審計大數據分析平臺。要建立審計專家和信息技術專家合作的審計信息技術研發(fā)模式,加強審計大數據分析模型和軟件的研究開發(fā)。建立審計信息技術評選機制,對優(yōu)秀的審計技術創(chuàng)新進行表彰獎勵。建立審計信息技術庫,把現有審計信息技術分類整理錄入,實現網上查詢、培訓和新技術添加功能,加快大數據審計技術的推廣和應用。
一.大數據風控發(fā)展迅速,但有效性不佳
在應用層面,金融行業(yè)利用大數據進行風控已經取得了一定的成效。使用大數據進行風控已成為美國等發(fā)達國家互聯(lián)網金融企業(yè)的標準配置。
美國Zest Finance公司開發(fā)的10個基于學習機器的分析模型,對每位信貸申請人的超過1萬條原始信息數據進行分析,并得出超過7萬個可對其行為做出測量的指標,而這一過程在5秒鐘內就能全部完成。
為網上商家提供金融信貸服務的公司Kabbage主要目標客戶是ebay、Amazon、PayPal等電商,其通過獲取這些企業(yè)網店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等信息,以及他們在Facebook和Twitter上與客戶的互動信息,借助數據挖掘技術,把這些店主分成不同的風險等級,以此來確定提供貸款金額數量與貸款利率水平。
中國互聯(lián)網金融企業(yè)對于大數據風控的運用也如火如荼。
阿里推出了面向社會的信用服務體系芝麻信用,芝麻信用通過分析大量的網絡交易及行為數據,對用戶進行信用評估,這些信用評估可以幫助互聯(lián)網金融企業(yè)對用戶的還款意愿及還款能力做出結論,繼而為用戶提供相關的金融和經濟服務。
騰訊的微眾銀行推出的“微粒貸”產品,其風控核心就是,通過社交大數據與央行征信等傳統(tǒng)銀行信用數據結合,運用社交圈、行為特征、交易、基本社會特征、人行征信5個維度對客戶綜合評級,運用大量的指標構建多重模型,以快速識別客戶的信用風險。
對于大數據風控的理論研究尚處于萌芽階段,本文以“大數據風控”為主題在CNKI數據庫進行搜索,與此相關的文獻數量可以從側面反映大數據風控的理論研究現狀。
CNKI數據庫中以“大數據風控”為主題的文獻共46篇。在這些文獻中,以報道性的文章較多,重要報紙全文庫和特色期刊總共為33篇,占比72%;而理論研究的文章較少,中國學術期刊總庫為12篇,占比26%;尚沒有CSSCI2014—2015年的來源期刊(如圖1)。
圖1 CNKI數據庫與大數據相關的文獻數量和分類
雖然大數據風控在實踐上已經有所進展,但是其有效性也受到一些挑戰(zhàn)。
例如,以大數據風控為基石的P2P平臺就頻頻暴露出各種各樣的問題來。對于P2P平臺來說,由于其純線上操作的特點,大數據風控的有效性是決定其經營狀況的重要因素,如果大數據風控有效性較差,則面臨的壞賬壓力較大,容易出現提現困難甚至跑路的問題。
網貸之家的數據顯示,2015年上半年新增問題平臺419家,是2014年同期的7.5倍,已超過2014年全年問題平臺數量。截至2015年10月底,全國問題平臺數累積已達1115家。
二.當前大數據風控有效性不足的原因分析
一些學者對于大數據風控的有效性問題進行了研究。
王強(2015)指出當前個人大數據征信的問題,一是數據的真實性,二是數據收集的法律障礙,三是壞賬的不可預測性問題。
甚至有作者認為大數據風控是無效的,陳宇(2015)援引各種證據認為大數據風控是無效的。
總體而言,當前大數據風控有效性欠佳的原因主要有以下幾個方面:
(一)數據的質量問題
當前大數據風控的有效性欠佳,其首要原因就是數據的真實性不高,包括社交數據和交易數據兩個方面。
1.社交數據的真實性問題
美國lending club和facebook合作獲取社交數據,在中國宜信也曾大費周折的收集借款人的社交數據,最后兩者得出的結論都是社交數據根本就不能用。美國很多大數據征信公司的信息錯誤率高達50%,垃圾進、垃圾出。
2.交易數據的真實性問題。
當前許多電商平臺的刷單現象非常嚴重,這將導致交易數據的嚴重失真。隨著網購的火爆,有關電商平臺“刷單”的報道屢見報端。
電商“刷單”有兩種方式,一種是商家找所謂的消費者進行“刷單”。賣家買快遞單號,其收件人和寄件人與實際的買家、賣家不一致。
另一種是快遞公司發(fā)空包,但快遞公司并未完成配送,而幫助商家完成平臺上的物流信息。
(二)大數據風控的理論有效性問題
從IT技術層面論證大數據風控的實踐性案例已經很多,但是在經濟金融的理論層面,大數據風控還面臨一些問題需要解決。
1.金融信用與社會信用的相關性不確定
目前大數據主要來源于互聯(lián)網,而人們在網絡中的表現并不能完全反映其真實的一面。相同的人群在不同場合呈現的特征是不一樣的,尤其是目前人們在線上、線下割裂的狀態(tài),其行為方式往往會出現強烈的反差。
例如有些人不善交際,卻將自己做的美食展示在微博上,吸引大量關注,粉絲暴增。因此網絡并不能確切地證明某人的社交圈子,也就是說互聯(lián)網的數據很難還原用戶現實中的信息。
2.大數據對于“黑天鵝”事件的滯后性
在現實世界,總會出現不可預測的“黑天鵝”事件,一旦出現則有可能沖擊大數據風控模型的基本假設,進而影響大數據風控的有效性。大到美國的次貸危機,小到個人意外事件的發(fā)生,在某種程度上大數據風控是無法預測的,但這些事件的發(fā)生,對宏觀經濟和微觀主體都會產生重大的影響。
例如,2008年美國次貸危機后產生了一種“策略性違約”行為——貸款主體本身有能力還款,但是其在房價遠低于貸款總額的時候,重新購買一套房子,并對之前的房貸斷供,貸款者可以此方法進行“套利”。
雖然此類違約者會因此有不良信用記錄,但是這對信用報告的影響有限,因為其他的債務按期償還。而大數據對這種突變事件的預測能力則非常有限。
(三)大數據收集和使用的制度問題
在數據收集和使用的過程中也面臨著合法使用的問題。如何高效、適度地開發(fā)和使用大數據,不僅僅是一個技術問題,也是一個社會問題,這些泄露的數據大量流入數據黑市,造成了用戶安全、企業(yè)安全甚至國家安全方面的連鎖反應。數據的收集和使用在很多時候都沒有征得數據生產主體的同意,這導致了數據的濫用和隱私的泄露。
近年來,個人數據泄露事件頻頻發(fā)生,因個人數據泄露而造成損失的新聞屢見報端。獵豹移動安全實驗室的《2015年上半年移動安全報告》顯示,截至2015年上半年,獵豹共監(jiān)測到496起數據泄露事件,影響超過544萬人。2015年10月19日,烏云網消息稱,網易的用戶數據庫疑似泄露。
圖2 2005-2014年國內外數據泄密情況
資料來源:上海漢均信息技術有限公司《2005—2014年全球泄密事件分析報告》
數據安全問題也將越來越多的企業(yè)推向風口浪尖。
上海漢均信息技術有限公司的《2005—2014年全球泄密事件分析報告》顯示,10年間,全球泄密事件中,我國泄密事件數量占比為58.5%,其中高頻發(fā)地域主要是東部沿海經濟較發(fā)達、產業(yè)格局以高技術含量為主的一二線城市(如圖2)。
Verizon《2015年數據泄露調查報告》,報告覆蓋95個國家,其中有61個報告了問題,涉及79790個安全事件(Security Incident),超過2000個(2122個)確認數據泄露(Data Breach)。
三.提高大數據風控有效性的路徑
盡管大數據風控的有效運用尚處在諸多障礙,但這并不能成為大數據風控無效的理由。因為對于數據這個資源的挖掘尚處于初級階段,在消除障礙、解決問題中前行,是大數據風控發(fā)展的必然趨勢。有效掃除當前大數據風控的障礙需要各方面的共同努力,其中金融企業(yè)、金融研究部門和政府監(jiān)管部門的角色尤為重要。
對于金融企業(yè)而言,要從基礎數據上保證客戶數據的多樣化、連續(xù)性和實時性,確保數據真實可靠。
對于金融研究者而言,可從經濟學、數學等多個角度綜合論證大數據風控的有效性,為大數據風控提供理論支持。
對于政府監(jiān)管部門而言,需要從法律制度、會計制度等方面進行建設,構建數據合理運用的良好環(huán)境體系。
(一)對于金融企業(yè)而言,要構建多樣化、連續(xù)性和實時性的基礎數據
1.多維度的收集數據,互聯(lián)互通,打破數據的孤島
美國征信系統(tǒng)的完善是因為美國政府對其擁有的大數據資源的開放程度日益透明化。
目前我國的大數據風控系統(tǒng)還沒有實現互通互聯(lián),阿里、銀聯(lián)、平安、騰訊以及眾多的P2P公司,都是各自為政,P2P公司拿不到央行的數據,幾家大的互聯(lián)網平臺在相關大數據的分享上彼此也未互通有無。
因而,各金融企業(yè)要建立互聯(lián)互通機制,打破數據孤島,從而能多維度地收集數據,確保數據之間能夠相互驗證。
2.從供應鏈交易環(huán)節(jié)獲取數據
獲取真實數據最好的途徑就是要切入客戶的交易環(huán)節(jié),尤其是穩(wěn)定可持續(xù)的交易環(huán)節(jié),即供應鏈。
一方面,經過了幾十年的發(fā)展,當前的供應鏈都有一套完整上下游進入和退出機制,數據的真實性對于核心企業(yè)而言至關重要,因而這些數據的質量非常優(yōu)異。
另一方面,這些數據和數據維度對于供應鏈中的企業(yè)評價是可靠的,金融企業(yè)可以此為基礎,加上自身的風險控制經驗,構建一套全新的基于數據的信用評價機制。
3.積極布局“物聯(lián)網+”
物聯(lián)網覆蓋了產品生產、交易和使用的環(huán)節(jié),因而互聯(lián)網只是物聯(lián)網的一部分。在物聯(lián)網下,不僅要獲取交易環(huán)節(jié)的數據,更重要的是獲取生產環(huán)節(jié)和使用環(huán)節(jié)的數據。
因而,金融企業(yè)要積極布局“物聯(lián)網+”,為獲取更為全面的數據打下基礎。例如,企業(yè)機器運行數據,可以收集客戶汽車駕駛數據,可穿戴設備的身體狀況數據,等等。這些數據都是大數據風控不可或缺的部分。
(二)對于金融研究部門而言,可從經濟、金融等多個角度綜合論證大數據風控的有效性,為大數據風控提供理論支持
當前對于大數據風控模型的構建大多是從技術的角度探討的。但是,從經濟、金融角度進行的探討亟待加強,不同的經濟假設會使模型推導的結果產生截然不同的變化。因而,從經濟、金融等角度對大數據風控有效性的研究就顯得很有必要了。比如大數據風控如何順應經濟周期的變化,如何從統(tǒng)計上論證過去的數據對于未來行為判斷的準確性,如何解決道德風險所帶來的不確定性。例如,唐時達(2015)提出要把數據提升至與傳統(tǒng)抵質押品同等重要的高度,建立“數據質押”風控體系。
(三)對于政府監(jiān)管部門而言,要推動和完善與數據相關的制度建
1.法律制度的建設,對數據的收集和使用予以法律上的保護
我國對于數據保護的制度性舉措散見于多部法律中,如憲法、刑法、侵權責任法等,多是以保護個人隱私、通信秘密等形式出現,尚缺乏一部數據保護的專門性法律。這導致了數據的法律邊界不明,數據保護法律的操作性不強、數據保護執(zhí)法機制滯后等問題,制約了數據收集和運用的發(fā)展。
對此,最理想的狀況是出臺一部《信息保護法》。在完善個人信息保護法律制度的道路上,應出臺《個人信息保護法》,明確國家機關、商家和其他法人、自然人掌握個人信息的邊界和使用的范圍[6-7]。齊愛民、盤佳(2015)認為要構建數據主權和數據權法律制度[8]。2014年最高人民法院頒布的《關于審理侵害信息網絡傳播權民事糾紛案適用法律若干問題的規(guī)定》(以下簡稱《規(guī)定》)就是此領域的進展之一,《規(guī)定》首次明確了個人信息保護的范圍。
2.會計制度建設,對數據資產予以明確的計量
隨著數據重要性的提升,數據列入企業(yè)資產負債表只是時間問題,數據將和土地、勞動力和資本一樣,成為一種生產要素(Viktor Mayer-Sch?nberger,2013)。越來越多的理論界和實務界的研究者都傾向于認為數據將成為個體的財產和資產。
2012年達沃斯世界經濟論壇的《大數據,大影響》報告認為,數據已經成為一種新的經濟資產類別。
關鍵詞:大數據時代;科技期刊;出版;編輯
中圖分類號:G232 文獻標識碼:A 文章編號:1672-8122(2016)03-0105-02
20世紀80年代初,著名未來學大師及社會思想家阿爾文?托夫勒(Alvin Toffler)便預言大數據(big data)將成為“第三次浪潮的華彩樂章”。20世紀90年代以來,隨著計算機技術的迅猛發(fā)展,上至國家的重大決策,下至人民生活的衣食住行,方方面面的信息均被數字化,并得到有效的儲存。邁入21世紀,人類社會進入了一個大規(guī)模生產、分享和應用數據的時代――大數據時代,它強調信息技術的重點由“技術”轉變?yōu)椤靶畔ⅰ?。因此,在以信息為基礎的人文社會科學研究領域,大數據勢必引發(fā)其組織決策和業(yè)務流程等方面的根本性變革。而為學術研究服務的科技期刊在大數據時代浪潮中,又將面對怎樣的機遇和挑戰(zhàn)呢?
一、大數據的概念與特征
大數據,又稱為巨量資料或海量資料;其是由數量巨大、結構復雜、類型繁多的數據資料構成的數據集合,是以“云計算”為基礎技術支持的數據處理和應用模式。大數據技術是通過集成共享數據,將分散的數據資源轉變?yōu)榧械闹橇Y源和知識服務能力。研究機構Garter定義“大數據”為需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資源。簡而言之,從各種類型數據中,快速獲得有價值信息的能力,就是大數據技術。
大數據的特征通常表現為以下四個方面:數據體量巨大(Volume)、數據類型繁多(Variety)、價值密度低(Value)、處理速度快(Velocity)。這就是人們通常所說的大數據的4V特征,也是大數據區(qū)別于傳統(tǒng)數據的顯著特征。
二、大數據時代下科技期刊面臨的機遇
1.出版形態(tài)的多樣化。大數據時代,在計算機、互聯(lián)網等技術的不斷發(fā)展和創(chuàng)新環(huán)境下,傳統(tǒng)科技期刊的出版模式已悄然向大數據平臺、多媒介及全媒體模式轉型。科技期刊數據化集群建設得以實現的一個重要條件就是大數據技術的成熟與推廣,隨著大數據平臺技術的建立,科技期刊實現了內容的自主優(yōu)化、信息服務的個性化,以及出版發(fā)行模式的多元化,科技期刊將向著在線投稿及評議系統(tǒng)、編輯管理系統(tǒng)和增值服務系統(tǒng)一體化的方向發(fā)展。大數據期刊平臺的構建將通過期刊內容推薦系統(tǒng)、流計算、期刊數據庫和期刊信息整合與治理四大功能板塊完成[1]。大多數科技期刊所采用的紙質媒介,在大數據時代背景下已不能滿足讀者的閱讀體驗,網絡、無線、手持閱讀器的全媒體出版要求凸顯。傳統(tǒng)紙質科技期刊傳播媒介將呈多樣化、全媒體的發(fā)展態(tài)勢,物聯(lián)網、互聯(lián)網、移動智能終端等技術平臺,都已成為科技期刊傳播的重要媒介??萍计诳脭底只?、多媒介、全媒體的出版模式,在為讀者提供平面媒體與數字媒體相結合的全新視聽閱讀感受的同時,也獲得了更多途徑和更深層次的推廣效果。
2.業(yè)務流程的智能化。隨著計算機技術的迅猛發(fā)展,以及云計算技術的成熟,使得任何復雜的數據都可以實現定量化分析[2]。因此,導致編輯工作流程中的信息收集、加工、傳遞等過程的智能化成為可能??萍计诳庉嫷哪繕耸菍⒅R差大,且讀者或該領域從業(yè)人員感興趣的論文從眾多稿件中挑選出來,體現在編輯出版過程中就是組稿策劃和審稿過程[3]。而過去這一編輯流程基本依靠編輯人員的經驗、價值觀或學術專家提出的建議完成。而現在大數據技術將科技期刊歷史出版物數據化,將全社會、全行業(yè)的科技成果數據化,并將這些數據進行整合、分析,從中獲得真實、客觀、準確、全面的學術信息,從而為科技期刊的選題策劃、組稿及審稿提供依據??梢韵胂笤诖髷祿夹g提供的真實、客觀、準確、全面的學術信息下,那些“一稿多投”或學術不端、學術腐敗的問題稿件,將無處遁形。在信息的加工過程中,大數據及云計算技術將過去編輯流程中,因編輯習慣不同或各期刊要求各異,而無統(tǒng)一標準的編輯規(guī)則模式轉化為統(tǒng)一、有序的編輯規(guī)則模式。在這種編輯規(guī)則模式下,利用人工智能工具或軟件,有可能實現稿件的計算機“預編輯”。從而減少編輯的重復勞動和簡單勞動,提升編輯質量和編輯效率。
3.評價規(guī)則的多元化。目前,對科技期刊及論文的質量和影響力的評估,普遍采用基于文獻計量學的評價體系,如影響因子和被引頻次。然而,由于模擬數據時代采集的數據樣本量小、種類少,導致科技期刊界對定性或定量評價的優(yōu)劣爭議不斷[4]。大數據時代的到來解決了這一問題。通過文本分析、語義分析、專家印象評估及同行評估等方法,可以實現對科技期刊的定性評價。通過期刊影響因子動態(tài)跟蹤、論文被引動態(tài)跟蹤、論文瀏覽及下載量動態(tài)跟蹤等方法,可以實現對科技期刊的動態(tài)評價。通過專家反饋信息采集、同行引用反饋信息采集、讀者反饋與推薦信息采集、廠商應用效果市場反饋信息采集等方法,可以實現對科技期刊客觀評價。因此,基于大數據平臺的科技期刊及論文評估是定性與定量、歷史與現代、靜態(tài)與動態(tài)、學術價值和經濟效益、主觀與客觀相結合的多元化、綜合性科學評價機制[5]。
4.營銷模式以品牌營銷為主。大數據時代科技期刊的營銷模式是將文化價值、創(chuàng)新價值、版權價值和廣告價值融為一體的新型商業(yè)模式。文化價值即科技期刊的學術品牌,是科技期刊建設的最主要目標,有文化內涵、科技含量及藝術價值的品牌形象,不僅保證了科技的發(fā)展和文化的繁榮,更是吸引讀者的關鍵,從而獲得更好的經濟效益和社會影響力,實現科技期刊的良性發(fā)展。創(chuàng)新價值即是以創(chuàng)新為突破口的跨媒介融合出版,利用大數據技術獲取受眾群體的核心信息,通過大數據分析掌握市場動向,并及時提出有創(chuàng)新性的營銷策略,是科技期刊出版單位需要具備的專業(yè)能力。印刷時代建立的傳統(tǒng)版權原則和制度,在大數據時代受到了根本性動搖,傳統(tǒng)版權規(guī)則所確立的利益觀、價值觀,以及商業(yè)模式也被逐漸解構,特別是隨著數字出版的蓬勃發(fā)展,版權資源潛在的巨大市場和價值被重新挖掘和開發(fā)。版權產業(yè)迎來了前所未有的發(fā)展機遇,版權資源成為爭奪主戰(zhàn)場,版權資源的價值亟須重塑[6]。大數據時代,出版載體已向跨行業(yè)全媒體模式轉變,出版形態(tài)也更加豐富,廣告形式不僅僅局限在傳統(tǒng)期刊投放的平面廣告,聲音、動畫、影像等多媒體形式的廣告將有效地與科技期刊的主題報道內容相結合,讀者在閱讀雜志內容的同時,也反復接受了產品的展示與推廣,加強了品牌宣傳效果,真正達到廣而告知的目的。
5.出版編輯理念面臨的機遇。在大數據時代背景下,要求科技期刊的編輯工作從傳統(tǒng)的文字編輯加工,轉變?yōu)槿襟w新出版語境下的數字編輯。數字編輯的定義是:在數字圖書、數字報紙、數字期刊、網絡原創(chuàng)文學、網絡教育出版物、網絡地圖、數字音樂、數字視頻、網絡動漫、網絡游戲、數字音像制品、手機出版等出版過程中,從事選題策劃、組織稿件、審核把關和加工整理的專業(yè)技術人員[7]。這就要求科技期刊編輯首先從思想上樹立數字編輯理念,深刻理解大數據時代,數字出版背景下編輯工作不斷追求創(chuàng)新和數字技術應用的要求??萍计诳瘮底殖霭婢庉嬙谕茝V重要學術成果、傳播科技文化知識、促進科技期刊發(fā)展進程中,不僅是實現期刊全媒體化的先行軍,更是數字出版技術創(chuàng)新的開拓者。數字出版編輯應順應數字出版的潮流,更新數字化出版的編輯理念,主動參與文化、科技成果的數據化,并積極實現數字信息的加工與傳播。在讀者服務方面,編輯也利用大數據技術提供的精準信息,實現對目標消費群體的個體化信息推送,提供更為精準服務。數字出版編輯要不斷適應數字理念的創(chuàng)新,以適應大數據時代不斷深化的移動互聯(lián)網終端輸入內容智能化的趨勢[8]。
三、大數據時代下科技期刊面臨的挑戰(zhàn)
1.信息透明化導致期刊生存環(huán)境競爭激烈。通過大數據技術,所有科技期刊都將在一個更為透明的環(huán)境中生存。所有科技期刊的評價指標,都將作為公共信息,而被公之于眾。例如,中國科學技術信息研究所每年都會將中國科技論文統(tǒng)計源收錄期刊的主要計量指標,如核心總被引頻次、核心影響因子、核心即年指標等,以引證報告的形式,提供給大眾。在這些細化和量化的數據信息面前,科技期刊的優(yōu)劣勢一目了然。這必將造成優(yōu)秀期刊的良性發(fā)展和劣質期刊的自我淘汰。這種數據公開機制,有可能導致某些優(yōu)質期刊或優(yōu)勢學科領域的期刊獲得更多的讀者和作者資源,而對于新創(chuàng)辦的期刊和某些弱勢學科領域的期刊將進入一個更為不利的生存態(tài)勢之中。
2.對科技期刊編輯人才隊伍提出了新的要求。隨著大數據理念深入人心,大數據技術的日臻成熟,數字化出版必將成為科技期刊的主要出版形式[9]。因此,數字化編輯也將成為科技期刊編輯工作者的新要求。編輯工作者不僅應具備組稿策劃、文字編輯加工能力外,還應具備內容擴展、內容研究、內容創(chuàng)作等能力,以適應科技期刊在大數據時代下的數字化發(fā)展。
3.傳統(tǒng)的盈利模式不再滿足期刊的發(fā)展需求。在科技期刊數字化進程中,科技期刊文章無償向全社會提供閱讀已成為必然趨勢。因此,依靠紙質發(fā)行、有償下載閱讀的傳統(tǒng)盈利模式,已不能滿足期刊的發(fā)展要求。然而,在將來期刊出版社或編輯部是否能成為數據運營的主體,也是一個懸而未決的問題。數據庫運營商有可能通過與科技期刊共同建立和運行數字化出版平臺,或開發(fā)數字化產品,來分享雜志的發(fā)行和廣告收入。
由此可見,在大數據時代背景下,科技期刊將面臨前所未有的機遇和挑戰(zhàn)。作為科技期刊的從業(yè)者,我們要抓住這些機遇,迎接挑戰(zhàn),完成科技期刊的完美轉型,盡早實現真正意義上的數字化期刊集群化。
參考文獻:
[1] 丁田.大數據時代科技期刊的未來形態(tài)[J].中國科技期刊研究,2014(2).
[2] 賈曉青,王萍,陳清蓮.大數據時代科技期刊編輯思維拓展[J].出版科學,2014(6).
[3] 張小強,張?zhí)O,呂賽英.從信息傳播角度看科技期刊編輯出版過程及其優(yōu)化[J].編輯學報,2007(3).
[4] 朱劍.量化指標:學術期刊不能承受之輕――評《全國報紙期刊出版質量綜合評估指標體系(試行)》[J].清華大學學報(哲學社會科學版),2013(1).
[5] 柴英,馬婧.大數據時代學術期刊功能的變革[J].編輯之友,2014(6).
[6] 張勤.試論大數據時代版權資源的價值重塑[J].中國出版, 2015(11).
[7] 李超.數字出版人才培養(yǎng):職稱評定的作用[EB/OL].中國數字出版信息網,2013-05-23.
關鍵詞:大數據 環(huán)境 數字圖書館 安全威脅 對策 分析
中圖分類號:G250 文獻標識碼:A 文章編號:1672-3791(2017)02(c)-0219-02
大數據是當前社會發(fā)展中非常重要的組成部分,在大數據時代下,我國的圖書館管理也實現了高新技術的層面,圖書館數據流量也呈現出了級數非線性增長,大數據環(huán)境的主要特點是數據量大,高速且高價值。這也使得圖書館數據系統(tǒng)的復雜程度以及數據的管理難度有了極大的增加,大數據平臺也逐漸成為廣大黑客攻擊的主要目標,基于此,如何保證在大數據時代下,圖書館數據平臺的安全問題也就成為了當前主要的研究課題,怎樣有效利用大數據技術來構建智能圖書館,這對于提升圖書館的市場競爭能力都是非常有幫助的。
1 大數據時代下數字圖書館說面臨的安全威脅
1.1 數據中心IT系統(tǒng)安全需求
隨著我國圖書館現代化的不斷深入,圖書館系統(tǒng)也在不斷的更新?lián)Q代當中,在圖書館體系的運用上,系統(tǒng)要求安全檢測具備更加廣泛的深度和需求,這樣一來就會導致圖書館數據中心系統(tǒng)的能耗急劇增加,檔子運行的整體速度大幅度的下降,所以,我們在研究大數據的時候,一定要保證圖書館數據中心系統(tǒng)部署可以真正的滿足用戶服務的需求,進而創(chuàng)建一個科學高效的圖書館系統(tǒng)架構,這也是當前圖書館系統(tǒng)深入部署的有效前提,一般來說,傳統(tǒng)的圖書館系統(tǒng)環(huán)境下,數據中心會設置相關的防范產品來控制數據流量的安全檢測,而由于這些傳統(tǒng)的安全策略對圖書館系統(tǒng)資源的耗能是非常大的,在加上圖書館數據流量總是出現延遲和數據丟失等問題也是非常的明顯,很明顯現在已經不能適應大數據時代下圖書館高校、快速的服務需求,在大數據環(huán)境下,圖書館在用戶服務的時候還有可能會面臨著木馬、病毒等安全方面的威脅,除此之外,黑客還可以利用云計算以及大數據等技術手段對新模式進行攻擊,所以,圖書館在復雜的大數據安全環(huán)境中,著呢用用加速、負載為單一的操作,對數據流在應用過程中只是做單一的處理,這也是為了能夠進一步消除數據流在安全檢測中出現延遲故障。
1.2 大數據給圖書館帶來了新安全問題
隨著大數據技術在圖書館應用的不斷加深,圖書館數據環(huán)境具有海量存儲、計數遞增等特點,與此同時,數據結構模式以及數據類型的多樣性特點也是非常明顯的,這也導致數據處理的格式其可變性和處理速率也更加的不確定。
在大數據時代,圖書館對云計算計數的依賴性也在不斷的增強,因此要求圖書館與云服務商要簽署符合大數據環(huán)境的云服務租賃協(xié)議。明確雙方的權利和義務。除此之外,云服務的安全保障有效性和安全管理效率也要有本質上的提升。這也與圖書館大數據應用安全息息相關。
除此之外,虛擬化技術也是當前我國圖書館大數據應用中非常重要的技術手段之一,數據虛擬化技術是一種允許用戶訪問和管理的方法,圖書館在利用虛擬化技術來改善圖書館系統(tǒng)的同時,也極大的降低了運營的實際成本,面臨著數據中心系統(tǒng)設備異構化等安全問題。
1.3 黑客會利用大數據技術對圖書館發(fā)起攻擊
在圖書館利用大數據技術提高服務質量以及獲取讀者需求的時候,黑客會運用大數據技術向圖書館發(fā)起攻擊,首先,圖書館大數據平臺存儲著大量的系統(tǒng)管理以及用戶服務等數據信息,這些信息大部分都是客戶的私密信息,而黑客通過對獲取的大數據資源進行分析,能夠明確圖書館的系統(tǒng)運營特點以及安全防范的相關措施,能夠運用大數據決策對圖書館發(fā)起非常精準的攻擊。
其次,由于大數據時代下的圖書館網絡具備非常強的社會化屬性,網絡數據還附帶復雜、敏感等特點,因此網絡數據平臺已經完成了不同圖書館大數據平臺的數據整合與資源共享。
1.4 讀者自身面臨的威脅
在大數據時代下,圖書館主要是通過對用戶行為數據的健康和采集來獲取讀者的個體特征,這些數據在確保圖書館用戶服務質量的同時,也面臨著泄露用戶信息的威脅,而為了進一步的提高系統(tǒng)管理與用戶服務決策的有效性,圖書館會通過擴展用戶數據采集的對象來不斷提升大數據幾何的數據價值。
首先,數據擁有者能夠通過對大部分無關的數據分析來獲取用戶的隱私信息,由于體術管對一些相對比較敏感的數據沒有一個明確的界定,這一狀況也使得很多機遇大數據的圖書館所有權和使用權也沒有明確的界定。
其次,隨著讀者個性化閱讀的不斷提升,讀者運用移動閱讀的頻率越來越高,現如今已經成為大數據時代下消除時間、地域、閱讀環(huán)境以及閱讀能力的主要模式。但是由于移動月底在帶給讀者閱讀便利性的同時也間接的泄露了用戶的個人信息。
2 基于大數據的數字圖書館安全防范策略
2.1 增強安全防御能力
2.1.1 現安全威脅
首先,我們的圖書館在利用大數據技術保護系統(tǒng)與服務安全的時候,我們的研究人員要對提供監(jiān)控設備采集的大數據安全資源進行綜合的分析,明確惡意攻擊的來源,與此同時,還要通過對相關的安全指標數據關系來挖掘數據信息的價值,進而實現對非法攻擊者的精準預測。
其次,在構建安全管理大數據平臺的時候,要盡量使用一些技術相對成熟且兼容性強的數據來分析圖書館數據流,針對圖書館大數據服務于安全管理的相關需求來制定專業(yè)的大數據資源,增強圖書館基于大數據安全威脅發(fā)現的主動性。
2.1.2 構建基于大數據安全威脅與防御能力的評估評價體系
大數據安全威脅與預防能力的評價主要是針對當前我國圖書館精準評估安全威脅等級和安全防范能力的關鍵體系,圖書館基于大數據的安全威脅評估評價體系是圖書館服務信息與系統(tǒng)管理數據傳輸的重要載體,由于網絡安全關系著圖書館管理與服務安全的可靠性,所以,圖書館在數據中心的網絡傳統(tǒng)評估中,要平均的在網絡上部署大量的安全檢測數據采集設備,進一步保證安全評估平臺的全面性和準確性。
2.2 保證云計算計數和虛擬化數據的安全
在當前的大數據環(huán)境下,圖書館一般都會采用租賃等方式來采集圖書信息,除此之外,我們的研究人員在對云服務平臺的數據進行管理的傳輸的時候,圖書館最好是根據高校的計算機管理系統(tǒng)來實現對數據的自動化管理,不斷加強對讀者閱讀行為的安全管理,通過建立全面、高校的監(jiān)控網絡來進一步實現對數據流的全程較差監(jiān)管,這樣也能夠有效的避免數據出現非法監(jiān)聽和竊取。
2.3 制定實施科學的大數據安全管理策略
首先,大數據安全管理平臺想要真正的實現安全管理和相關流程的整合,讓我們的圖書館能夠根據大數據安全信息來完成相關安全事件的管理和分析工作,因此需要我們的研究人員在對圖書館監(jiān)控設備采集數據信息的時候,要對數據進行預先的處理,只有保證了數據格式的標準化之后,才能夠真正的用于圖書館管理和運用。
其次,圖書館安全管理平臺還要通過實時的監(jiān)督管理系統(tǒng)來對圖書館安全威脅問題進行檢測和評估,并根據安全管理平臺數據反饋來實現對圖書館大數據運用平臺的參數設置,提升圖書館安全管理的強度。增強圖書館管理系統(tǒng)的整體效率。
3 結語
大數據自身的復雜性和多樣性特點使得在大數據環(huán)境下的圖書館出現了很多的不可預測攻擊行為,導致圖書館大數據資源在采集的過程中經常會出現很多的問題,我們此次主要針Φ鼻拔夜大數據時代下現代化圖書館的安全威脅問題進行了詳細的分析和研究,并針對出現的問題提出了幾點可行性的解決建議,希望可以為我國的圖書館安全問題提供有效的幫助。
參考文獻
[1] 蔡津津,郜新鑫,付建俐.基于業(yè)務元數據標準化的金融財經數據倉庫及服務系統(tǒng)架構探討[C]//中國新聞技術工作者聯(lián)合會2012年學術年會、五屆四次理事會暨第六屆“王選新聞科學技術獎”的“人才獎”和“優(yōu)秀論文獎”頒獎大會論文集.2012.
[2] 周為鋼,楊良懷,潘建,等.論智能交通大數據處理平臺之構建[C]//第八屆中國智能交通年會論文集.2013.
[3] 喬向杰.基于大數據的旅游公共管理與服務創(chuàng)新模式研究[C]//北京兩界聯(lián)席會議高峰論壇文集.2013.
[4] 譚勝淋,陳曦.大數據的標準化研究[C]//市場踐行標準化――第十一屆中國標準化論壇論文集.2014.
[5] 包磊,羅兵,孫越林.大數據時代的態(tài)勢評估技術思考[C]//2014第二屆中國指揮控制大會論文集(下).2014.
[6] 尹素格,王健,張桂剛,等.大數據技術在精確空投系統(tǒng)中的應用[C]//2014第二屆中國指揮控制大會論文集(下).2014.
[7] 劉春琳,冷紅.基于大數據挖掘的城市關注平臺的構建與應用[C]//城鄉(xiāng)治理與規(guī)劃改革――2014中國城市規(guī)劃年會論文集(04城市規(guī)劃新技術應用).2014.
[8] 飛.大數據時代中國期刊的發(fā)展機遇與探索創(chuàng)新[C]//第十二屆2014全國核心期刊與期刊國際化、網絡化研討會論文集.2014.
[9] 朱力緯,劉麗勤,王健.高?;诖髷祿r代的數字化校園建設研究[C]//中國高等教育學會教育信息化分會第十二次學術年會論文集.2014.
[10] 孫圣力,鄭志高,王平,等.RTDP系統(tǒng)網絡體系結構及其關鍵技術[C]//.2013年全國通信軟件學術會議論文集.2013.
[11] 張嵐,郭俊杰.信息安全風險評估的安全措施探討[C]//2011年通信與信息技術新進展――第八屆中國通信學會學術年會論文集.2011.
[12] 韓俊,劉曉婷.科技期刊在“云時代”所面臨的機遇和挑戰(zhàn)[C]//科學評價促發(fā)展,品質服務謀共贏――第九屆(2011)全國核心期刊與期刊國際化、網絡化研討會論文集.2011.
(湖北省科技信息研究院 湖北 武漢 430071)
摘 要:大數據背景下信息服務工作發(fā)生較大變化。湖北省科技信息共享服務平臺順應大數據挑戰(zhàn),利用云平臺和元數據倉儲技術,從硬件、軟件層次上解決了大數據條件下的數據存儲與檢索問題。以湖北省科技信息共享服務平臺的功能特色為角度,研究了以信息平臺為基礎進行的信息服務內容與模式創(chuàng)新,最后對信息平臺今后的服務方向進行了探討。
關鍵詞 :大數據;信息服務;信息共享平臺;元數據倉儲;云平臺
中圖分類號:G203 文獻標識碼:A doi:10.3969/j.issn.1665-2272.2015.01.008
在大數據時代,信息服務工作的信息獲取、存儲、組織、分析等技術,用戶獲取和利用信息的方式方法都發(fā)生了較大變化,如何進行大數據處理,為用戶提供更加專業(yè)的信息服務將成為挑戰(zhàn)。
湖北省科技信息共享服務平臺(以下簡稱信息平臺)是支撐湖北省內科研機構和科技型中小企業(yè)創(chuàng)新創(chuàng)業(yè)的綜合信息服務平臺,是全省科技進步和科技創(chuàng)新必不可少的支撐條件。信息共享服務平臺順應大數據時代的挑戰(zhàn),利用元數據倉儲技術,真正實現統(tǒng)一跨庫檢索,集產業(yè)追蹤、區(qū)域聚焦、個性定制、代查代借、特色服務等多功能為一體,能夠實現多層次、全方位地為用戶提供信息服務。對促進全省科技創(chuàng)新體系建設,推動科技創(chuàng)新驅動戰(zhàn)略實施具有十分重要的意義。
1 大數據環(huán)境下信息服務面臨的問題
1.1 大數據存儲管理問題
首先,隨著網絡環(huán)境下數據爆增,巨大存儲空間需求給硬件存儲帶來壓力。大數據時代信息資源的建設已經不止是簡單的網頁文本、照片或音頻、視頻文件。這就需要購置大量的存儲設備去滿足不斷增長的需求,而傳統(tǒng)模式的數據存儲方式不僅擴展能力有限,而且擴展方法很麻煩。
其次,對非結構化數據存儲管理效率低。例如各種類型的數據如辦公文檔、圖像、音頻、視頻、電子郵件、超媒體等,數據處理操作不僅需要使用不同的文件處理軟件,而且要在人工參與下才能完成。過多的人工操作會大大增加數據處理的時間,致使信息管理中心無法快速獲得重要的信息,工作效率降低。
1.2 技術問題
面對指數級增長的數據目前PB級的存儲系統(tǒng)中,檢索數據無異于大海撈針。傳統(tǒng)的數據檢索是靠數據庫文件系統(tǒng)命名的。這種檢索方式在檢索和查詢影像文件時可能會遇到障礙,當影像文件超過了文件系統(tǒng)的厚度時就會出現問題。此外,各種非結構化的數據又增加了大數據的復雜性,即關于數據庫表結構定義的不一致性和標準缺失也是數據庫檢索的另一大問題。
1.3 傳統(tǒng)服務模式出現的問題
傳統(tǒng)信息服務方式在大數據時代已經不能滿足信息化發(fā)展的要求,信息管理中心不僅需要收集、存儲大量的數據信息,還要在這些原始數據的基礎上通過專業(yè)技術手段分析、挖掘數據,得到更為有效的信息資源,為信息資源用戶的決策管理提供數據參考。而傳統(tǒng)的數據管理方式適用于存量不大并且實時性要求不高的結構化數據,面對大容量的非結構化數據顯得力不從心。
2 信息平臺的功能特色
2.1 云平臺布署解決大數據存儲問題
信息平臺為解決大數據帶來的檢索和存儲問題,引入了云平臺技術。從硬件方面來說,云平臺采用了6臺高性能服務器作為6個底層節(jié)點,一臺普通服務器作為管理機,節(jié)點與節(jié)點之間部署了心中檢測線,而節(jié)點與管理機之前則用千兆交換機連接。從軟件方面來說,信息平臺部署了一個云平臺操作系統(tǒng),包括管理系統(tǒng)、門戶網站、運營系統(tǒng)各一套,3套存儲管理平臺。信息平臺從硬件和軟件功能上進行升級,保證了平臺虛擬機的穩(wěn)定運行,為信息平臺元數據倉儲提供了強有力的支持,促進信息平臺檢索、下載功能高效率進行。
2.2 實現統(tǒng)一跨庫檢索
信息平臺集成當前國內最大的幾家數據庫廠商資源,包括萬方數據、維普資訊、中國知網、國研網、NSTL、國家知識產權局等,同時還集成了湖北省科技信息研究院自建的特色數據庫,文獻類型包括科技期刊、學位論文、會議論文、專利、標準、國研報告、研究報告、法律法規(guī)、科技成果、年鑒、報紙、圖書等,用戶只需一次檢索便可得到所有數據庫的不同類型資源,而且具有去重功能,改變以往多個庫檢索、重復瀏覽的模式,節(jié)省大量寶貴時間與精力。
2.3 元數據倉儲技術保證查全率
元數據在眾多領域都有其具體的定義和應用,其中得到最廣泛認可的概述是:關于數據的數據,即描述任意資源結構化的數據。信息平臺利用元數據倉儲技術,采用數據收割、數據整理、數據更新這一流程,利用先進的資源調度規(guī)則和資源調度配置,將最底層的元數據預先建立索引,進而將不同的異構數據庫導入一個全新的數據庫,實現各類資源的快速檢索,大大提高檢索速度與檢索效率。信息平臺利用元數據倉儲技術,整合4.7億條不重復的元數據,并且每年保持大規(guī)模增長,數據量超過任何一個單一的數據庫廠商,大大保證了查全率,方便用戶快速找到文獻資源線索。
2.4 多渠道保證原文無障礙獲取
信息平臺獲取原文的方法多樣,包括直接下載、共建單位原文傳遞、云傳遞及代查代借。信息平臺整合了國內幾大主流數據庫廠商的各類資源,基本保證了各類中文數據的原文下載,本著資源共建共享的原則,信息平合全省各大高校及科研單位參與共建共享,目前已有武漢大學圖書館、華中科技大學圖書館、中科院國家科學圖書館武漢分館等19家單位參與,開通共建單位原文傳遞窗口,方便用戶獲取本館沒有的文獻。同時,信息平臺還有云傳遞功能,此為全國范圍內的參與單位實現,從而更大幅度地保證原文獲取效率。
在以上三種方式都無法獲取原文時,系統(tǒng)也會引導用戶采用代查代借功能獲取,代查代借是信息平臺的輔助功能,主要解決以下兩類問題:一是在信息平臺檢索到文獻題錄,但是無法獲取全文,二是知道文獻相關信息,在信息平臺中未檢索到。用戶只需在代查代借頁面提交文獻題名、作者、來源等信息即可,所提交的信息越詳細,獲取原文的機率就越大。提交請求后信息平臺共建單位服務人員會在五個工作日以內將查詢結果反饋到用戶郵箱。
2.5 特色功能滿足用戶個性化需求
2.5.1 檢索功能操作方便快捷
信息平臺實現文獻類型和檢索字段同時可選的功能,而且文獻類型可多選。其實這一功能在單一的數據庫中實現并不難,然而在統(tǒng)一資源檢索平臺要實現此功能需要解決一些技術難題。筆者也比較其他省級科技信息平臺,如廣東、廣西、四川、上海等省的科技文獻共享服務平臺均只實現文獻類型單選。湖北省信息平臺可以在多選文獻類型的情況下選擇所需字段,這樣處理方便用戶進行簡單的計量分析,例如可以通過一鍵式檢索分析某一機構或作者的文獻產出情況,通過
關鍵詞 檢索分析各種文獻類型的主題分布情況等,大大方便用戶進行科研研究。
2.5.2 多維度服務導航功能
多維度服務導航為用戶提供了強大的資源揭示功能,用戶可借此功能進行簡單的情報分析,如果沒有此功能,用戶檢索到數據后需耗費大量的時間與精力下載、加工、整理數據,然后利用相關的數據分析工具來得到分析結果。同時,此功能又方便用戶進行二次選擇,快速找到有用的資源,例如可根據期刊刊種判斷論文質量,對自己的研究會起到更大的作用。而其他類型資源檢索結果展示可方便用戶在不同的文獻類型之間進行切換,無需回到首頁重新檢索。
2.5.3 檢索結果排列方式多樣
傳統(tǒng)的檢索結果排列方式為表格排列,這樣方便用戶需要閱讀大量的文獻題名、作者、機構、來源等信息時使用,通過對用戶閱讀習慣的研究發(fā)現許多用戶比較喜歡如百度式的自然排列方式,因而目前一些專業(yè)數據庫也改變以往的數據排列方式,選擇自然排列方式。調查發(fā)現,不同類型的用戶習慣的排列方式不一樣,兩類排列各自都有用戶選擇,甚至同一類用戶在不同的檢索目的下也會采用不同的排列方式進行閱讀。信息平臺為用戶提供了較大的選擇空間,檢索結果可按列表和自然排列兩種方式,用戶可根據習慣或需要自行選擇。列表方式方便用戶閱讀大量文獻時使用,自然排列方式符合用戶自然的閱讀習慣。
2.5.4 本館館藏滿足快速獲取原文
信息平臺采用元數據倉儲技術,大大保證的平臺的查全率,因而用戶檢索到的文獻會存大許多不能直接下載的情況,此時可以通過共建單位傳遞、云傳遞或代查代借三種方式獲取原文。然而通過用戶調研發(fā)現,許多用戶檢索到文獻時希望立刻能夠獲取原文。信息平臺提供本館館藏功能,此功能將用戶檢索結果中可以直接下載的文獻聚類,此聚類中所有文獻均可直接下載,無需通過原文延遲獲取,滿足對獲取原文具有較高時效性要求的用戶的需求。
3 信息平臺服務模式研究
信息平臺保留了傳統(tǒng)的信息服務內容,包括期刊論文、學位論文、會議論文、標準、專利等文獻的原文下載、原文傳遞、代查代檢服務,這是科技信息共享服務平臺的基礎支撐,必須要充分保證。在此基礎上,信息平臺也探索了新的信息服務內容,包括產業(yè)專題服務、區(qū)域特色服務、專業(yè)化服務。
3.1 產業(yè)專題服務
信息平臺根據地方重點產業(yè),追蹤產業(yè)的最新研究熱點,并分類整理入庫,方便用戶直觀了解產業(yè)最新研究熱點。通過對信息平臺各類用戶調查發(fā)現,越來越多的用戶不僅僅滿足于信息平臺提供的簡單檢索、下載原文功能,為其提供專題服務是信息服務機構要努力的方向。目前信息平臺已建立的產業(yè)專題是湖北省千億產業(yè),包括汽車、食品、機械、電子信息、鋼鐵、石化、紡織、建材。主要對各個產業(yè)的最新研究文獻進行了收錄,方便用戶跟蹤產業(yè)的研究方向。
3.2 區(qū)域協(xié)調化服務
為促進全省科技信息全面發(fā)展,省信息平臺采用二級服務站模式進行推廣服務,即提供全省17個地市州的二級服務站窗口,聚焦各地市州的區(qū)域動態(tài),這樣為全省科技信息共享打下良好基礎。采用二級服務站模式進行服務是符合湖北省省情的,目前以武漢市為首,以宜昌、恩施、荊州為代表的地市州服務推廣效果都比較顯著,信息服務是一個循序漸進的過程,今后在服務推廣上應該探討更加合理、更加專業(yè)的服務推廣模式,例如在二級服務站模式的基礎之上,以高企、孵化器、大型企業(yè)、中小企業(yè)、科研機構、政府機關等多個角度,各有側重地推廣,使信息平臺能夠真正深入到省內各個企業(yè)的各個科研人員中去。
3.3 專業(yè)化服務
作為省級專業(yè)的信息服務平臺,湖北省科技信息共享服務平臺不僅提供基礎性的科技文獻信息,同時還提供專業(yè)化的定制服務。包括行業(yè)研究報告、定制報告、委托檢索、科技查新及知識產權服務、科技決策咨詢、科技評估等深度服務內容。如行業(yè)研究報告包括市場分析報告、技術研究報告、政策環(huán)境報告、綜合分析報告等內容,滿足企業(yè)、科研機構、政府部門的管理決策者、技術人員等各類情報需求。定制報告則根據企業(yè)用戶提出的具體定制需求,利用專門工具,可為企業(yè)定制關于行業(yè)競爭對手、企業(yè)自身狀況、特定技術領域、單項技術等的專題分析報告,專題推送。
3.4 個性化推薦服務
信息平臺具有合理的后臺管理系統(tǒng),將用戶分類明確,包括大型企業(yè)、中小企業(yè)、科研機構、政府部門等不同類用戶。大型企業(yè)一般都具備自己的情報部門,因而信息平臺可為大型企業(yè)提供戰(zhàn)略研究、競爭情報、科技查新、科技評估與咨詢、知識產權等方面的服務,從而為企業(yè)發(fā)展提供戰(zhàn)略性決策指導。針對中小企業(yè),信息平臺不僅為其提供期刊、學位論文、會議論文、專利、標準、政策法規(guī)等傳統(tǒng)類文獻,而且為其提供行業(yè)信息,并為其量身打造了行業(yè)研究報告數據庫,解決了中小企業(yè)因資金、人才、資源等所限而無法自己獲取情報信息的困境。面向科研院所,信息平臺可為其提供知識產權相關的信息服務、培訓、咨詢等內容。針對政府機關,信息平臺可為其提供全局性、深層次、科學化,比較宏觀的統(tǒng)計數據與研究報告,方便用戶宏觀把握其所關注的內容。
總之,針對不同用戶提供個性化的服務,要基于用戶分類、用戶行為研究的基礎之上,根據用戶的行為軌跡分析其所關注的內容,定期為其推送信息服務內容。
4 信息平臺服務發(fā)展方向
信息平臺采用元數據倉儲技術,實現統(tǒng)一跨庫檢索,具有多種個性化的功能,然而要適應新的服務模式還需要進一步完善。首先是個性化推薦實現智能化,目前的個性化推薦還基于人工分析用戶行為軌跡,今后應該建立一種高級智能平臺,基于少量數據挖掘技術,由系統(tǒng)智能完成對用戶的個性化決策支持和信息服務。其次是實現移動終端隨時隨地獲取文獻,如今用戶更傾向于使用移動終端學習與工作,開發(fā)信息平臺移動終端是迫在眉睫的,然而如何開發(fā)簡單適用、符合用戶習慣、滿足個性化推送、方便進行用戶管理等也是下一步必須探討的。第三,實現更加專業(yè)化的產業(yè)追蹤功能,建立產業(yè)專題是一項任務艱巨的課題,目前信息平臺已進行了初步的探索,今后還應深入完善產業(yè)專題內容,例如建立更多的產業(yè)專題庫,根據地方特色打造不同區(qū)域的行業(yè)專題,為各個專題建立更加科學合理的子類目等。
參考文獻
1 陳甜遠.大數據時代的高校信息管理中心對策[J].網絡地帶,2013(8)
2 陳豫等.大數據影響科技信息工作未來的大背景[N].中國航空報,2012 -12-18
3 覃鳳蘭.個性化服務高校圖書館服務的新舉措[J].情報雜志,2005(7)
4 丁梅.大數據時代云平臺與大容量存儲——以湖北省科技信息共享服務平臺部署為例[J].軟件導刊,2014(5)
5 夏浩,李瑞雪.如何基于無數據倉儲技術構建數字圖書館統(tǒng)一檢索平臺[J].科技創(chuàng)新導報,2014(14)
關鍵詞:大數據;科研管理;數據處理
一、大數據技術引入高??蒲泄芾碇械膬?yōu)勢
大數據技術是現代多種信息技術的有效結合,具有相當的優(yōu)越性。從科研管理的角度來看,大數據技術通過針對科研管理系統(tǒng)、財務系統(tǒng)、人事系統(tǒng)以及基于互聯(lián)網的大型科技文獻數據庫、專利庫等數據資源的關聯(lián)分析,找出數據的相關性,提取有價值的信息,可以為傳統(tǒng)專家定性決策管理提供廣泛、科學的理論依據。由于這些知識大 多直接來源于數據庫內部,因此它較少受外部資源的限制和影響,具有相對的獨立性,對于科研決策的指導意義也較為重大。
二、大數據環(huán)境下的高校科研管理信息化的應用探索
(一) 為高??蒲性u估提供數據支持
隨著高校信息化的推進以及大型科技文獻、專利、論文數據庫系統(tǒng)等在科學研究領域的普及,全球范圍內的科技數據信息量急劇增加。面對這些龐大、繁雜的原始數據,需要快捷、有效的技術手段進行篩選,并從中獲得有價值的知識。
傳統(tǒng)的數據分析和統(tǒng)計方法,由于受到人力,物力及財力的限制,原始數據背后隱藏的深層次知識無法得以有效采集、分析和使用。
而大數據技術可以綜合內部、外部以及網絡數據資料:從學校科研管理部門獲得研究項目的類別和數量;從內部數據庫得到人員、經費、設備等信息;從網絡數據庫中獲得論文、專利的數量和質量信息;結合往年項目成果報表中獲獎、專利成果轉讓情況,最終綜合集成各類數據。通過建立綜合數據評估模型將各類指標進行整合,為科研評估的專家提供數據支持,最終得出科學、合理的評估結果。
(二)提升項目立項決策的科學性
從篩選項目角度看,可以利用大數據技術,對項目的研究領域、預期成果,通過與外部文獻庫進行結合分析的方法檢驗課題的科學性、創(chuàng)新性,判斷得出該項目立項的必要性;從篩選申請者角度看,可以將申請者所涉及的各項因素進行多數據的聯(lián)合查詢和分析,發(fā)現并建立科學的指標體系和篩選方法,最終得到候選人名單,從而達到提升項目立項決策的科學性的目的。
( 三) 為教師科研活動提供深層次服務
以科研人員欲向某單位進行項目申請為例。以往,科研人員只能夠通過自身了解或者往年申報情況對對方單位的需求進行分析,由于個人收集的信息不夠全面、不夠準確以及信息傳遞的滯后性等問題,容易出現研究目標偏離實際需求的問題,申報結果往往不夠理想。而隨著大數據技術的普及,通過對大型數據倉庫進行有效的挖掘,可以對相關單位所關注的關鍵技術、重點領域和發(fā)展方向進行分析和預測。通過建立模型、 數據可視化和生成文本報告等形式向科研人員提供可參考信息,了解各種影響之間的內在聯(lián)系,指導科研人員開展研究工作, 達到為科研人員提供深層次服務的目的。
(四)優(yōu)化科研資源配置
第一,對數據進行采集和篩選,建立不同種類的數據庫,例如人員庫、 成果庫等;第二,建立適合本校的科學發(fā)展的評判模型,包括各類科研資源、科研成果的計算參數和規(guī)則庫;第三,以定量化績效考核作為基礎的資源配置工具和決策支持管理工具,以此通過大數據技術完成對學??蒲匈Y源的優(yōu)化配置。
三、大數據環(huán)境下提升高??蒲泄芾硇畔⒒降姆椒?/p>
(一) 加強數據采集基礎建設
高校應當采用先進、穩(wěn)定的技術確保數據的快速傳輸與儲存,選擇合適的綜合布線技術和設備,為數據儲存提供良好的基礎設施。面向未來數據爆炸式的增長,可以考慮采用FTYO模式,該模式的特點是帶寬大、速度快、節(jié)省成本和能源、減少電磁干擾。數據存儲中心的建設應考慮虛擬化和云平臺,保證數據傳遞的速度與準確度。
(二) 加強科研管理團隊建設
由于高??蒲泄芾矸矫娴南嚓P數據種類多樣且體量龐大,管理人員在平時就應當注意對這些數據的收集、整理工作。收集的數據可以方便管理人員及科研人員進行查詢,但是廣泛的原始數據往往來源多樣、良莠不齊。科研管理人員應當對所獲得數據的質量進行評價,評估數據來源是否可靠、數據的收集方法是否科學、數據是否具有時效性等等,然后對數據進行校核,除去冗雜的干擾性的數據,要注意清理或改正誤差數據,最后將數據轉化為可共享的標準化信息??蒲泄芾砣藛T應當利用大數據技術深度挖掘原始數據背后具有啟示意義的信息,為管理層今后做出科學合理的決策提供依據。
(三) 改變科研管理理念
在大數據環(huán)境下,傳統(tǒng)的科研管理理念無法保證高??蒲惺聵I(yè)的健康發(fā)展, 因此需要我們有所改變。 首先, 在大數據趨勢下,信息挖掘要前傾,要從數據中來分析社會、國家的需求,使得科研目標更有價值、更有針對性。其次,在大數據趨勢下,服務要前移,不能像過去那樣等著科研人員來要數據、 要結果。 而是應該充分利用數據并且對數據進行分析、挖掘,掌握科研人員可能需要哪些數據或者結論,把服務工作前移。
(四) 推進數據的共享及利用
在大數據環(huán)境下,科研數據量激增,科學研究越來越依賴于系統(tǒng)的、高可信度的基礎科學數據分析。當前全球科技活動不斷增強,一系列重大科學工程的興起、復雜科學問題的提出、大型科學研究計劃的產生,導致前所未有的國際合作局面的產生,也導致了全球范圍內對科技資源交流、互通的客觀需求。因此,科研管理人員應針對大數據技術體量大、數據來源豐富、數據更新速度快等特點,積極推進科研數據的共享、利用工作,以達到提升科研管理的水平。
結束語
高校科研管理工作的質量水平決定著高校科研工作是否能夠有效、順利地開展。隨著信息化技術的飛速發(fā)展,相應地推動了大數據技術的拓展。人類通過使用大數據的交換、整合和分析這一過程,從而發(fā)現新的知識,實現新的管理、創(chuàng)造出新的價值。高??蒲泄芾硎切畔⒒瘧玫那把仡I域,應當具有可能依托大數據技術提升管理與決策的水平。
參考文獻:
關鍵詞:大數據時代 數字圖書館 機遇與挑戰(zhàn)
中圖分類號:G25 文獻標識碼:A 文章編號:1672-3791(2016)10(b)-0150-02
在科學技術的影響下,學術資源建設速度越來越快。例如:中國最大的學術資源建設商――中國知網,已經從期刊論文向國內外期刊論文發(fā)展,在圖書資源收藏方面收集了大量資源,可以給行業(yè)機構、學術等提供大量文獻。在此種發(fā)展形式下,數字圖書館承受了較大壓力,如何在未來發(fā)展中更好生存,已經成為人員研究的主要問題,必須及時對其進行分析。
1 國內外研究與啟示
1.1 國內外相關論述對我國的影響
隨著大數據時代的到來,人們對數據的需求量不斷增大。目前國外相關研究已經從理念、技術和數據等方面進行了很多研究。美國加州大學伯克利分校圖書館的Huwe在《構建數字D書館》一書中明確指出,大數據與數字化圖書館的發(fā)展方向吻合,可以借助數字圖書館進行信息采集和收集,進而挖掘用戶行為,幫助人們了解閱讀行為與信息的聯(lián)系。Borgman等人將嵌入式技術成功安裝于數字圖書館系統(tǒng)中,增加了數字圖書館功能,可以實現圖書分類、收集處理和關聯(lián)等各項操作,促進了數字圖書館與網絡技術的融合,發(fā)揮了大數據的作用。
國內研究人員曾建勛曾在《數字圖書館論壇》中明確指出,大數據時代將數據數字圖書館數據管理、收集等服務的深層次發(fā)展,對數字圖書館人員提出了較高要求。另外武漢大學生陳傳夫等也從理念、發(fā)展知識和財政投入機制等,分析了圖書館素質等問題,并提出了相關應對措施。
從上述研究均可看出大數據對數字圖書館帶來的發(fā)展機遇和挑戰(zhàn),促進了數字圖書館和大數據的融合。為了促進高校圖書館和我國公共圖書館在大數據時代的發(fā)展,發(fā)揮數字圖書館在人們的生活或科學研究中的作用,必須深入思考,及時轉變觀念,提高數字圖書館的競爭力。
1.2 啟示與思考
從當前的發(fā)展狀況來看,學術資源建設商已經在大數據時代取得了很大進展,不僅包含網絡資源與期刊,還涉及各種文獻資源,可以查找作者、文獻關系與學者等關系,給數字圖書館的發(fā)展帶來了很大壓力。所以圖書館相關人員必須提高思想認識,將資源建設商帶來的威脅作為新的機遇。在實際工作中,必須積極吸取圖書館建設資源,擴展圖書館資源范疇,進行各種資源的有機結合,同時還要充分發(fā)揮資源價值,促使各種資源的整合,深入挖掘數據規(guī)律,認真分析數據規(guī)律,發(fā)現數據潛在價值。從服務角度上分析,圖書館還要向眾多資源建設商學習,從用戶角度探索問題,給用戶提供人性化服務,滿足用戶對資源的需求。
經過分析發(fā)現,大數據時代,必須要改變傳統(tǒng)的思維模式,形成適合數字圖書館發(fā)展的模式,適應大數據時代的發(fā)展,充分利用大數據促進數字圖書館的發(fā)展,讓數字圖書館在人們的生活、學習和工作中發(fā)揮更大作用。
2 淺析數字圖書館的大數據思維
數字圖書館的大數據思維主要表示從大數據角度思考并分析數字圖書館發(fā)展中存在的問題,實現數字圖書館和大數據時代的有機融合,增加數字圖書館產品種類,提高數字圖書館服務水平。
2.1 建設數字圖書館資源
第一,擴大數字圖書館資源范圍。資源是數字圖書館發(fā)展的基礎,也是提高數字圖書館服務質量的主要方法。在長期發(fā)展中,圖書館非常重視資源建設,主要是圖書、期刊及學位論文等資源。為了在大數據時代下發(fā)展,必須創(chuàng)新思維,引入一些數據庫資源或一些社會熱點信息等內容,以用戶的搜索習慣作為數字圖書采集參考,深入挖掘各種數據之間的聯(lián)系,實現可再生資源的生產、收集和儲存,擴大數字圖書資源范圍。第二,提高數字圖書館資源整合度。大數據時代的主要特點是數據類型較復雜,單純的文本信息已經不能被大數據時展用戶吸取,可以實現資源整合向綜合信息服務轉變。為了滿足不同用戶的需求,還可以實現文獻和政府等信息的整合,擴大社會資源和數字圖書館的聯(lián)系,將公眾最關注的問題引入到社會資源整合中。第三,加強數字圖書館資源加工深度。在大數據時代,雖然數字圖書館結構信息具有較強的表現形式,但主要體現在資源庫內部。在大數據時代下,必須及時擴展數字資源和外界的聯(lián)系,構建全社會數字圖書館資源架構。同時進行圖書館資源深度加工時,必須從知識結構向知識建構加工方向發(fā)展。例如:從圖書館文獻資源中分析知識結構,利用知識單位和文獻建立知識建構,形成新知識。
2.2 靈活應用數字圖書館技術
大數據時代,數字圖書館技術已經開始從處理局部數據向更廣的區(qū)域發(fā)展。從圖書館技術體系分析主要進行信息處理、組織架構、分析預測、服務技術等操作。
第一,應用語義技術。大數據環(huán)境中可以采用語義實現復雜數據的聯(lián)系。當前數字圖書面臨的主要問題是將語義加入數字文獻信息中。所以必須將本體技術、人工智能等先進技術應用到實際工作中,讓數據間形成語義關系,促進收錄資源和知識挖掘等各項操作。目前語義技術已經廣泛應用到圖書領域中,如:漢語主題詞表、圖書分類法等均是依靠語義發(fā)展起來的。知識相互間的語義關系,不僅可以幫助用戶及時獲取知識,還可以獲得有用知識途徑。第二, 數據聚類技術。數據聚類是實現信息相互聚集的過程。在繁雜的數據中,只有靈活應用聚類技術,才能發(fā)揮信息服務、處理等各種功能。在大數據背景下,利用數據聚類可將不同數據劃分成相互聯(lián)系、主體相近的小數據,給用戶信息檢索、選擇和分析提供很大方便,給用戶個性化服務提供了數據支持。第三,信息分析技術。大數據時代可以充分利用信息分析技術??梢詫⒋髷祿夹g融入到書籍圖書館中,拓展了數據分析工作,給用戶提供了高端服務。例如:聯(lián)機分析技術可給在線用戶提供數據支持;定量定性分析技術可以在數字圖書館中得到充分應用。
2.3 數字圖書館的定位
第一,打破傳統(tǒng)資源框架束縛。大數據給圖書館提供了較廣闊的發(fā)展空間,滿足了用戶對不同信息的需求,在信息采集、收集和服務等方面均發(fā)生了變化。數字圖書館進行定位時,必須打破傳統(tǒng)資源框架,將數據理念融于到數字圖書館建設中,所以不僅要采用傳統(tǒng)的方法進行信息采集,還要進行網絡信息自動獲取,構建語義關系、數據聯(lián)系等信息組織框架。
第二,建立全方位服務信息。傳統(tǒng)圖書館主要進行文獻服務。數字化圖書館服務資源發(fā)生了變化,服務形式開始從被動化向主動化發(fā)展。一方面向全社會提供服務;另一方面,提供全新資源服務;最后不斷擴展服務與傳播方式,全面擴展數字圖書館服務。
第三,定位數字圖書館員。大數據時代對圖書館員提出了更高要求,每館員都要有敏銳的數據分析能力;及時了解學術變化;掌握大數據分析技術;熟練使用各種數據分析工具和軟件,準確定位網絡資源,促進數字圖書館的發(fā)展。
3 結語
大數據時代給數字圖書館帶來了挑戰(zhàn),是數字圖書館的一種巨大轉型,可以擴展數字圖書館數據資源,提高數字圖書館服務功能;同時,還要不斷思考資源框架、技術應用模式和服務功能,與廣大學術資源建設商共同發(fā)展。
參考文獻