本文摘要:摘要:在信息時代背景下大數據技術得到快速發展,在諸多領域發揮出越來越重要的作用。大數據時代的到來對科技情報研究提供了更多新思路與新方向。為此,就大數據的概念以及在科技情報研究領域的應用技術進行論述,并探討了大數據時代背景下科技情報研究工作的
摘要:在信息時代背景下大數據技術得到快速發展,在諸多領域發揮出越來越重要的作用。大數據時代的到來對科技情報研究提供了更多新思路與新方向。為此,就大數據的概念以及在科技情報研究領域的應用技術進行論述,并探討了大數據時代背景下科技情報研究工作的對策。
關鍵詞:大數據;科技情報研究;對策
0引言
隨著網絡信息技術的快速發展以及海量數據處理能力的增強,進入了大數據時代。在大數據時代促使產業提升、科技發展的一個有效手段就是探索基于大數據處理技術的動態情報解決策略。伴隨移動終端與智能手機的大范圍普及,公眾自身的信息數據都可能成為被記錄與分析的數據。這給科技情報研究工作帶來了新機遇與新挑戰。
1大數據的定義與特點
關于大數據的定義尚未形成統一的標準,主流觀點認為這是一種數據量非常大、數據形式多元化的非結構化數據。維基百科中將大數據定義為所包含的數據量規模龐大到難以通過當前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策目的的資訊[1]。
情報論文投稿刊物:《廣東科技》(半月刊)創于1992年,是由廣東省科技廳主管、廣東省科技情報研究所主辦的綜合性科技刊物,國內外公開發行的廣東省唯一綜合性省級科技刊物,是反映廣東省科技與經濟發展的窗口。本刊堅持以促進科技成果轉化、科技創新為目標,融新聞、科技、經濟、信息、產業、市場、服務為一體,內容豐富、時代感強,是推動科技進步、加強技術創新、發展高科技、實現產業化的重要宣傳陣地。
它的特征可歸納為“4V”:①Volume。數據容量巨大,搜集與分析的數據量巨大,一般數據量規模可超過10TB。②Variety。數據種類多,來源廣,格式多元化。③Velocity。數據流動速度快,大數據通常是以數據流的形式出現,數據流動速度極快,傳統系統難以處理。④Value。價值密度低,盡管數據量呈指數級增長,但隱藏在其中的有用信息并未實現對應比例增長,反而增加了獲取有用信息的難度[2]?梢,盡管大數據擁有很好的潛在價值,但若受限于傳統思維與技術,則容易被淹沒在數據海洋中,難以獲取有用信息。
2科技情報研究工作中應用的大數據技術
2.1數據挖掘研究技術
從廣義上來講,數據挖掘是指知識的發現過程是從大量的、有噪聲的、不完全的、模糊的、隨機的實際應用數據中提取出人們事先不知、隱含在其中但有用的信息與知識的過程。該技術涉及到的學科領域很多,除了統計學、算法外,還包括數據庫、機器學習、模式識別、高性能計算等技術[3]。
根據數據挖掘的定義可以發現它與情報研究有著密切的關聯。利用數據挖掘技術能夠有效解決情報研究問題。運用該技術對目標關聯規劃進行研究,進而發現科技情報中存在的轉換關系。根據科技情報研究工作的需要,運用大數據技術開發相關數據挖掘工具,借助智能化輔助分析功能,提高科技研究人員的工作效率,縮短研究時間。將數據挖掘技術應用于科技情報研究工作中,首先對研究任務做好種類劃分,運用數據挖掘技術的類別功能,歸納整理這些研究任務的共同點與差異性,構建數據挖掘技術適用于科技情報研究工作的適用標準。然后,數據挖掘技術的組合形式及相關算法應圍繞研究任務的實際情況作出恰當的修正,對挖掘數據進行合理評價等等,這些都是科技情報研究工作對數據挖掘技術提出的要求。
2.2智能化研究技術
智能化技術涉及領域廣泛,涵蓋了神經網絡、網絡分析、機器學習、模式識別、遺傳算法、預測建模等諸多學科知識。運用智能化技術開展科技情報研究工作,可實現對高級、復雜信息的智能化分析處理[4]。這能夠減輕工作人員的工作強度,使其有更多精力去研究方法的優化以及研究結果的應用。在信息技術高速發展的背景下,科技情報研究對象不再局限于傳統的報刊雜志書籍,還應注重網絡信息,比如網絡上的圖片、音頻、視頻等信息。運用相關技術手段對上述網絡信息數據進行結構化處理,為智能化技術的應用做好準備。面對多元化的數據時,智能化技術應根據對象來分析,從語義層面上給予技術支持。
此外,傳統的統計分析難以適應信息海量增長的時代需要,而應借助機器學習、模式識別等技術來開展科技情報研究工作。運用智能化技術能夠避免很多人為因素的干擾,提高研究結果的準確性與真實性。
2.3可視化技術
科技情報研究對象具有信息分散、數據結構多樣的特點,過去主要以人工分析為主,容易受到各種非結構性與不確定性因素的干擾,因此,很難形成規則的分析模式與分析流程,從而增大了數據挖掘規則的難度。基于此,可通過可視化數據分析技術來解決,構建完整的可視化圖表進行分析。通過圖表可以了解全部數據信息,而且也能看到數據分析的過程以及數據鏈的走向,便于研究人員對數據進行關聯性分析,再輔以人工操作。可視化平臺具有多種視圖,用于顯示數據信息,利用網絡分析、空間分析、信息分析等研究手段來協調人機間的交互溝通,便于工作人員對分析結果的理解與運用。
3大數據時代做好科技情報研究工作的對策
3.1強化大數據觀念科技情報研究人員首先要樹立起大數據意識,充分認識到大數據對科技情報研究工作帶來的機遇與挑戰,掌握大數據技術,善于運用這些技術來挖掘分析科技情報信息。為此,科技情報研究所應加強對工作人員的教育培訓,組織他們學習大數據技術,了解各種大數據分析技術方法,提高大數據應用水平,更好地推動科技情報研究工作的開展。
3.2科學利用各種數據源
情報研究的結果會對社會產生深遠的影響,因此,必須確保情報分析結果準確可靠。這需要從源頭抓起,在分析數據的過程中加以完善與豐富。情報研究工作比較復雜,各種信息源的特性也明顯不同,因此,綜合運用多種信息源已成為科技情報研究的重要趨勢[5]。
研究人員需從問題出發,將全部信息資源進行系統化整合,用于情報研究。其中,信息源不僅包括學術論文、專利等文獻資源,也包括文本、數據、各種正式或非正式出版物。研究人員應先熟悉各種信息資源的特性,清楚相似信息在不同資源類型中的具體表現及不同信息源之間存在的聯系。然后,根據待分析問題選取恰當的信息。此外,研究人員要將不同信息源分析出的結果進行有效的組織、綜合、解釋,尤其是結論發生矛盾時,能夠識別不當結果,確保分析結果的準確性是非常關鍵的。
3.3加強對數據的清洗與過濾處理
科技情報研究人員在大數據時代面臨著海量的處理數據,這些數據通常良莠不齊,可能造成分析結果錯誤,降低決策的正確性。大多數數據庫具有動態特征,很多數據是冗余的、不完整的,甚至是不正確的,從而給數據的識別發現造成困難。為此,在進行數據挖掘處理時可先對數據作預處理,即數據凈化與過濾,將部分無關數據刪除。加強對數據質量的管控,從而增強數據分析的準確性,提升情報工作效率。這是由于數據的體量僅僅屬于大數據的一個特征,大數據的核心價值在于數據的價值、傳遞速度以及持續性。
4結語
大數據時代促使宏觀經濟環境發生了顯著的變化,為科技情報研究工作帶來了新機遇與新挑戰。為此,科技情報研究人員應具備大數據意識,合理運用大數據技術開展科技情報研究工作,不斷提高科技情報研究結果的準確性、科學性與合理性,最大限度挖掘出科技情報研究的內在價值,促進社會生產力的轉型升級。
參考文獻:
[1]彭家義.淺析大數據時代科技情報工作面臨的機遇與挑戰[J].低碳世界,2017,35(28):289-290.
[2]夏雪.基于大數據的科技情報研究芻議[J].江蘇航空,2014,16(2):21-23.
[3]原毅玲.大數據時代科技情報研究工作探索[J].信息技術與標準化,2015,22(7):46-48.
[4]蔣卓然.“大數據”時代情報工作面臨的機遇與挑戰[J].吉林廣播電視大學學報,2016,11(4):73-75.
[5]姚旭.基于大數據環境下的科技信息方法研究[J].決策與信息,2015,21(3):152-153.
作者:王榮花
轉載請注明來自發表學術論文網:http://www.zpfmc.com/jjlw/25819.html