本文摘要:摘 要:近年來,隨著網絡的發展和新興技術的出現,尤其是物聯網技術的推廣,大數據成為眼下最流行的技術,這必然會給目前的數據庫和信息處理技術帶來新的挑戰,舊的數據處理、數據挖掘技術已經很難滿足要求,必然要求數據處理技術進行新的革命性的變革。近年
摘 要:近年來,隨著網絡的發展和新興技術的出現,尤其是物聯網技術的推廣,大數據成為眼下最流行的技術,這必然會給目前的數據庫和信息處理技術帶來新的挑戰,舊的數據處理、數據挖掘技術已經很難滿足要求,必然要求數據處理技術進行新的革命性的變革。近年來,云計算技術也在不斷的發展,二者的結合會給信息處理帶來很多新的挑戰和機遇。
關鍵詞:云計算;大數據;數據挖掘;數據處理;存儲 電子核心期刊
1 大數據概述
什么是大數據?“大數據”是一個數據量特別大、類別特別多的數據集,并且這樣的數據集無法用傳統數據庫工具對其內容進行加工處理。“大數據”首先是指數據量非常龐大,指代大型數據集,一般在10TB規模左右,在日常的應用中,多數的單位都是把多個來源于不同系統的數據集統一的放在一起,形成了更為龐大的數據量;其次是指數據類型特別多,現在興起的云計算技術,使得現在創造數據的主體由企業逐步的轉向個體,而我們個體創造的數據大多是文檔、圖片、音頻、視頻等,這些數據都是非結構化的,還有大多數的企業的辦公自動化通過網絡得以實現,由此產生的數據也大多是非結構化的。也就是說我們要處理的數據來源于不同的系統和數據源,數據類型和數據格式更為復雜,已不在局限于結構化的數據結構,而是半結構化和非結構化數據的一個混合體。第三是要求要有非常高的相應處理速度,盡管要處理的數據量異常龐大,也必須對如此龐大的數據量做到實時處理。最后一個特點是指數據真實性高,隨著社交數據、企業交易和應用數據等新數據源的崛起,傳統數據源的局限被打破,企業越來越需要高效的信息處理,以確保數據的真實性、準確性及安全性。
另外,結構組成更為復雜的新數據開始出現,而且生成的速度提高到了一個前所未有的程度。例如:社交網絡數據、備份數據和物聯網應用下的傳感器數據都屬于人們在分析中關注的新數據源,企業需要對這些數據類型進行快速、準確、可靠的分析,以便充實其已知的信息數據量。
在企業內部,隨著客戶以在線渠道作為開展商業交易及與企業互動的主要手段和網絡日志的不斷增加,為監測和優化業務運營而部署的傳感器網絡和機器數量也越來越多。結果就生成了大量新數據源、快速增加的數據量和迅速增加的新數據流,需要分析所有這些新數據。“大數據”在互聯網與傳統企業之間建立了緊密的聯系,推動了互聯網企業與傳統的企業的融合,逐步掀起了一場消費模式、生產模式、管理模式的革命。
2 云計算概述
2.1 云計算的概念
“云計算”將計算機從客戶端集中到“云端”,作為功能應用通過互聯網絡提供給客戶端,它將用戶提交的各種需求動態、合理的分配給分布在各處的計算機系統,從而提出需求的各種應用系統能夠獲取相應的計算服務、存儲空間。用戶關心的是需求提出的功能,而不需要去關心應用功能是怎么實現的,所有的應用功能都是由服務提供商來完成的。它是一種商業計算模型,而不是一種平臺或者架構。
實現云計算所需要的基礎設施有多種技術結合來完成。尤其是需要一套系統的軟件對分布在各處的硬件進行虛擬化調度和管理,即把分布于各處的計算機軟、硬件資源集中起來進行綜合處理。
轉載請注明來自發表學術論文網:http://www.zpfmc.com/dzlw/2928.html