時間:2023-04-08 11:48:16
導言:作為寫作愛好者,不可錯過為您精心挑選的10篇大數據金融論文,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內容能為您提供靈感和參考。
>> 大數據時代的供應鏈物流服務 雙渠道供應鏈中的價格決策與服務決策研究 從績效驅動因素看大數據時代的供應鏈變革 非對稱信息下雙渠道供應鏈的定價決策分析 大數據環境下供應鏈金融模式研究 大數據視角下電子商務平臺供應鏈金融的研究 大數據時代下的我國供應鏈金融發展形態研究 供應鏈管理中的大數據運用 大數據驅動下的圖書館服務創新 隨機需求下產能充足雙渠道供應鏈決策問題探討 需求不確定環境下閉環供應鏈回收渠道決策研究 電子商務環境下“雙渠道供應鏈”決策問題研究 全供應鏈下的庫存管控 碳交易風險下供應鏈企業低碳技術采納決策框架研究 供應鏈管理框架下的零售渠道合作 基于研發投入的雙渠道供應鏈決策優化研究 網上代銷雙渠道閉環供應鏈的定價與協調決策 淺析在大數據時代背景下如何提升物流供應鏈價值 SaaS服務供應鏈的創新結構研究 試論供應鏈金融服務創新 常見問題解答 當前所在位置:l.
[48]武漢市五交家電商業協會.關于2013年全市家電行業發展情況和2014年行業發展建議[R/OL].[2014-04-15]..
[49]馮芷艷,郭迅華,曾大軍,陳煜波,陳國青.大數據背景下商務管理研究若干前沿課題[J].管理科學學報,2013(1):1-9.
[50]Ernst & Young.Globalonlineretailing[EB/OL]..
近日,專業第三方電子商務、互聯網金融研究機構與國內最大媒體服務平臺——中國電子商務研究中心正式推出“中國電商大數據網”(100ec.cn/zt/bd/ ),國內覆蓋最全的電商領域大數據應用一科技平臺。
據(100EC.CN)監測數據顯示,美國已有20%、30%的網絡展示是通過大數據來售賣的,而目前中國還比較少,只有3%到4%,從這個角度來說大數據營銷市場是大力可為的,有著廣泛的發展空間。
[ 3 ] 王喜文.日本強化ICT領域國際競爭力[N].中國電子報,2012-06-15(003).
[ 4 ] The White House. Big Data Across the Federal Government[EB/OL].[2014-08-08].http://whitehouse.gov/sites/default/files/microsites/ostp/big_data_fact_sh-eet.pdf.
[ 5 ] The Wall Street Journal. Big-Data Success Stories: Splunk[EB/OL].[2014-08-08].http:///ve-nturecapital/2011/10/21/big-data-success-stories-s-plunk/.
[ 6 ] The New York Times. Harvard Releases Big Data for Books[EB/OL].[2014-08-08].http:///2012/04/24/Harvard-releases-big-data-for-books/
[ 7 ] Spolanka. OverDrive announces a series of “Big Data”reports[EB/OL].[2014-08-08].http://libraries.wr-ight.edu/noshelfrequired/2012/04/11/overdrive-an-no-unces-a-series-of-big-data-reports/.
[ 8 ] Xavier Amatrain,Justin flix公布個性化和推薦系統架構[EB/OL].[2014-08-08].http:///article/2013-04-04/2814767-netflix-ml-architecture.
[ 9 ] 云推薦[EB/OL].[2014-08-08].http:///.
[10] 中國科學院.李國杰院士:大數據成為信息科技新關注點[EB/OL].[2014-08-08].http:///xw/zjsd/201206/t20120627_3605350.shtml.
[11] 李奕.大數據應用方式:從數據服務、信息服務到知識服務[N].中國計算機報,2012-07-09(024).
[12] Big data:The next frontier for innovation,competition and productivity[EB/OL].[2014-08-08].http:///Features/Big Data.
[13] 李晨暉,崔建明,陳超泉.大數據知識服務平臺構建關鍵技術研究[J].情報資料工作,2013(2):29-34.
[14] 秦曉珠,李晨暉,麥范金.大數據知識服務的內涵、典型特征及概念模型[J].情報資料工作,2013(2):18-22.
中圖分類號:G250 文獻標識碼:A 文章編號:1672-3791(2017)02(c)-0219-02
大數據是當前社會發展中非常重要的組成部分,在大數據時代下,我國的圖書館管理也實現了高新技術的層面,圖書館數據流量也呈現出了級數非線性增長,大數據環境的主要特點是數據量大,高速且高價值。這也使得圖書館數據系統的復雜程度以及數據的管理難度有了極大的增加,大數據平臺也逐漸成為廣大黑客攻擊的主要目標,基于此,如何保證在大數據時代下,圖書館數據平臺的安全問題也就成為了當前主要的研究課題,怎樣有效利用大數據技術來構建智能圖書館,這對于提升圖書館的市場競爭能力都是非常有幫助的。
1 大數據時代下數字圖書館說面臨的安全威脅
1.1 數據中心IT系統安全需求
隨著我國圖書館現代化的不斷深入,圖書館系統也在不斷的更新換代當中,在圖書館體系的運用上,系統要求安全檢測具備更加廣泛的深度和需求,這樣一來就會導致圖書館數據中心系統的能耗急劇增加,檔子運行的整體速度大幅度的下降,所以,我們在研究大數據的時候,一定要保證圖書館數據中心系統部署可以真正的滿足用戶服務的需求,進而創建一個科學高效的圖書館系統架構,這也是當前圖書館系統深入部署的有效前提,一般來說,傳統的圖書館系統環境下,數據中心會設置相關的防范產品來控制數據流量的安全檢測,而由于這些傳統的安全策略對圖書館系統資源的耗能是非常大的,在加上圖書館數據流量總是出現延遲和數據丟失等問題也是非常的明顯,很明顯現在已經不能適應大數據時代下圖書館高校、快速的服務需求,在大數據環境下,圖書館在用戶服務的時候還有可能會面臨著木馬、病毒等安全方面的威脅,除此之外,黑客還可以利用云計算以及大數據等技術手段對新模式進行攻擊,所以,圖書館在復雜的大數據安全環境中,著呢用用加速、負載為單一的操作,對數據流在應用過程中只是做單一的處理,這也是為了能夠進一步消除數據流在安全檢測中出現延遲故障。
1.2 大數據給圖書館帶來了新安全問題
隨著大數據技術在圖書館應用的不斷加深,圖書館數據環境具有海量存儲、計數遞增等特點,與此同時,數據結構模式以及數據類型的多樣性特點也是非常明顯的,這也導致數據處理的格式其可變性和處理速率也更加的不確定。
在大數據時代,圖書館對云計算計數的依賴性也在不斷的增強,因此要求圖書館與云服務商要簽署符合大數據環境的云服務租賃協議。明確雙方的權利和義務。除此之外,云服務的安全保障有效性和安全管理效率也要有本質上的提升。這也與圖書館大數據應用安全息息相關。
除此之外,虛擬化技術也是當前我國圖書館大數據應用中非常重要的技術手段之一,數據虛擬化技術是一種允許用戶訪問和管理的方法,圖書館在利用虛擬化技術來改善圖書館系統的同時,也極大的降低了運營的實際成本,面臨著數據中心系統設備異構化等安全問題。
1.3 黑客會利用大數據技術對圖書館發起攻擊
在圖書館利用大數據技術提高服務質量以及獲取讀者需求的時候,黑客會運用大數據技術向圖書館發起攻擊,首先,圖書館大數據平臺存儲著大量的系統管理以及用戶服務等數據信息,這些信息大部分都是客戶的私密信息,而黑客通過對獲取的大數據資源進行分析,能夠明確圖書館的系統運營特點以及安全防范的相關措施,能夠運用大數據決策對圖書館發起非常精準的攻擊。
其次,由于大數據時代下的圖書館網絡具備非常強的社會化屬性,網絡數據還附帶復雜、敏感等特點,因此網絡數據平臺已經完成了不同圖書館大數據平臺的數據整合與資源共享。
1.4 讀者自身面臨的威脅
在大數據時代下,圖書館主要是通過對用戶行為數據的健康和采集來獲取讀者的個體特征,這些數據在確保圖書館用戶服務質量的同時,也面臨著泄露用戶信息的威脅,而為了進一步的提高系統管理與用戶服務決策的有效性,圖書館會通過擴展用戶數據采集的對象來不斷提升大數據幾何的數據價值。
首先,數據擁有者能夠通過對大部分無關的數據分析來獲取用戶的隱私信息,由于體術管對一些相對比較敏感的數據沒有一個明確的界定,這一狀況也使得很多機遇大數據的圖書館所有權和使用權也沒有明確的界定。
其次,隨著讀者個性化閱讀的不斷提升,讀者運用移動閱讀的頻率越來越高,現如今已經成為大數據時代下消除時間、地域、閱讀環境以及閱讀能力的主要模式。但是由于移動月底在帶給讀者閱讀便利性的同時也間接的泄露了用戶的個人信息。
2 基于大數據的數字圖書館安全防范策略
2.1 增強安全防御能力
2.1.1 現安全威脅
首先,我們的圖書館在利用大數據技術保護系統與服務安全的時候,我們的研究人員要對提供監控設備采集的大數據安全資源進行綜合的分析,明確惡意攻擊的來源,與此同時,還要通過對相關的安全指標數據關系來挖掘數據信息的價值,進而實現對非法攻擊者的精準預測。
其次,在構建安全管理大數據平臺的時候,要盡量使用一些技術相對成熟且兼容性強的數據來分析圖書館數據流,針對圖書館大數據服務于安全管理的相關需求來制定專業的大數據資源,增強圖書館基于大數據安全威脅發現的主動性。
2.1.2 構建基于大數據安全威脅與防御能力的評估評價體系
大數據安全威脅與預防能力的評價主要是針對當前我國圖書館精準評估安全威脅等級和安全防范能力的關鍵體系,圖書館基于大數據的安全威脅評估評價體系是圖書館服務信息與系統管理數據傳輸的重要載體,由于網絡安全關系著圖書館管理與服務安全的可靠性,所以,圖書館在數據中心的網絡傳統評估中,要平均的在網絡上部署大量的安全檢測數據采集設備,進一步保證安全評估平臺的全面性和準確性。
2.2 保證云計算計數和虛擬化數據的安全
在當前的大數據環境下,圖書館一般都會采用租賃等方式來采集圖書信息,除此之外,我們的研究人員在對云服務平臺的數據進行管理的傳輸的時候,圖書館最好是根據高校的計算機管理系統來實現對數據的自動化管理,不斷加強對讀者閱讀行為的安全管理,通過建立全面、高校的監控網絡來進一步實現對數據流的全程較差監管,這樣也能夠有效的避免數據出現非法監聽和竊取。
2.3 制定實施科學的大數據安全管理策略
首先,大數據安全管理平臺想要真正的實現安全管理和相關流程的整合,讓我們的圖書館能夠根據大數據安全信息來完成相關安全事件的管理和分析工作,因此需要我們的研究人員在對圖書館監控設備采集數據信息的時候,要對數據進行預先的處理,只有保證了數據格式的標準化之后,才能夠真正的用于圖書館管理和運用。
其次,圖書館安全管理平臺還要通過實時的監督管理系統來對圖書館安全威脅問題進行檢測和評估,并根據安全管理平臺數據反饋來實現對圖書館大數據運用平臺的參數設置,提升圖書館安全管理的強度。增強圖書館管理系統的整體效率。
3 結語
大數據自身的復雜性和多樣性特點使得在大數據環境下的圖書館出現了很多的不可預測攻擊行為,導致圖書館大數據資源在采集的過程中經常會出現很多的問題,我們此次主要針Φ鼻拔夜大數據時代下現代化圖書館的安全威脅問題進行了詳細的分析和研究,并針對出現的問題提出了幾點可行性的解決建議,希望可以為我國的圖書館安全問題提供有效的幫助。
參考文獻
[1] 蔡津津,郜新鑫,付建俐.基于業務元數據標準化的金融財經數據倉庫及服務系統架構探討[C]//中國新聞技術工作者聯合會2012年學術年會、五屆四次理事會暨第六屆“王選新聞科學技術獎”的“人才獎”和“優秀論文獎”頒獎大會論文集.2012.
[2] 周為鋼,楊良懷,潘建,等.論智能交通大數據處理平臺之構建[C]//第八屆中國智能交通年會論文集.2013.
[3] 喬向杰.基于大數據的旅游公共管理與服務創新模式研究[C]//北京兩界聯席會議高峰論壇文集.2013.
[4] 譚勝淋,陳曦.大數據的標準化研究[C]//市場踐行標準化――第十一屆中國標準化論壇論文集.2014.
[5] 包磊,羅兵,孫越林.大數據時代的態勢評估技術思考[C]//2014第二屆中國指揮控制大會論文集(下).2014.
[6] 尹素格,王健,張桂剛,等.大數據技術在精確空投系統中的應用[C]//2014第二屆中國指揮控制大會論文集(下).2014.
[7] 劉春琳,冷紅.基于大數據挖掘的城市關注平臺的構建與應用[C]//城鄉治理與規劃改革――2014中國城市規劃年會論文集(04城市規劃新技術應用).2014.
[8] 飛.大數據時代中國期刊的發展機遇與探索創新[C]//第十二屆2014全國核心期刊與期刊國際化、網絡化研討會論文集.2014.
[9] 朱力緯,劉麗勤,王健.高校基于大數據時代的數字化校園建設研究[C]//中國高等教育學會教育信息化分會第十二次學術年會論文集.2014.
[10] 孫圣力,鄭志高,王平,等.RTDP系統網絡體系結構及其關鍵技術[C]//.2013年全國通信軟件學術會議論文集.2013.
[11] 張嵐,郭俊杰.信息安全風險評估的安全措施探討[C]//2011年通信與信息技術新進展――第八屆中國通信學會學術年會論文集.2011.
中圖分類號:TU984文獻標識碼: A
1引言
隨著云計算、物聯網等的發展,新興信息技術與應用模式的涌現,使得全球數據量呈現出爆發式增長態勢,市場調研機構IDC的研究顯示,到2020年,全球以電子形式存儲的數據量將達到35ZB,大數據的時代已經到來[1]。最早提出“大數據時代已經到來”的機構是全球知名咨詢公司麥肯錫,其在報告中指出,“數據已經滲透到每一個行業和業務職能領域,逐漸成為重要的生產因素;而人們對于海量數據的運用將預示著新一波生產率增長和消費者盈余浪潮的到來。”
1.1大數據概念
大數據的概念,尚未形成公認的準確定義。根據維基百科的定義,它是指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理、處理的數據集合。從產業角度,常常把這些數據與采集它們的工具、平臺、分析系統一起被稱為“大數據”。在數據特性方面,大數據主要為非結構化信息,如文本、圖形、遙感遙測信息,大多是實時信息;在信息來源上,大數據主要是互聯網、醫療設備、視頻監控、非傳統IT 設備等社會日常運作和各種服務中實時產生的數字數據,數據容量巨大,從 TB 級別躍升到 PB 乃至 EB 級別,大數據具有4V特征Volume(數據體量大)、Variety(類型多)、Value(價值稀疏)以及Velocity(速度快)的特征[2]。大數據時代帶來思維變革:更多不是隨機樣本而是全體數據,更雜不是精確性而是混雜性,更好不是因果關系,而是相關關系[3]。
1.2大數據發展歷程
大數據并非新近出現,早在1980年,著名未來學家阿爾文•托夫勒便在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。2009年開始,“大數據”成為互聯網信息技術行業的流行詞匯,2011年持續熱門,在2012 年更達到一個高峰,2013年大數據概念逐為大眾熟知。
2 大數據研究應用評述
2.1國外大數據研究應用
大數據的開發與利用已經在IT,媒體、醫療服務、金融業、零售業、制造業、物流、電信等行業廣泛展開,并產生了巨大的社會價值和產業空間,但仍處于初級階段[3]。2012年4月,美國政府啟動“大數據研究和發展計劃”,致力于提高從大數據中提取知識和觀點的能力,并服務能源、健康、金融和信息技術等領域。在數據共享、突發事件處理、疫情觀察方面已有較成功應用。2012年4月,英國、美國、德國、芬蘭和澳大利亞等國家聯合推出“世界大數據周”活動,旨在制定戰略性的大數據措施;2012年5月,聯合國發表了大數據發展白皮書;2012年7月,日本推出“ICT”戰略研究計劃,重點關注“大數據應用”。全球性IT巨頭都開始關注大數據的機遇,微軟、英特爾、甲骨文(微博)等都在開發基于大數據的IT架構。
2.2國內大數據研究應用
中國大數據的應用處于起步階段,淘寶、騰訊、百度等互聯網巨頭是率先使用大數據技術的用戶,主要是基于開源軟件自主開發大數據應用,推出相應的大數據產品和平臺,開展了多種深度商務分析,電信和銀行領域也開始對大數據技術和服務產生濃厚的興趣。此外,IT業、傳媒界和學界舉行了多次以大數據為核心的主題討論會,共同探索大數據的發展與創新。
綜觀國內外大數據研究和應用現狀可見:(1) 大數據相關的研究與應用目前仍然處于起步階段,學術研究大多局限于概念、技術、發展預測等宏觀探討層面;(2) 基于大數據應用所需要的軟件、硬件等技術支撐亟需進一步的深入開展;(3)現有的大數據研究大多立足于信息科學,側重于大數據的獲取、存儲、處理、挖掘和信息安全等方面,鮮有從城市規劃學科發展的角度探討大數據對于城鄉規劃管理技術的變革與沖擊的研究。
3 大數據時代城鄉規劃管理技術創新探討
3.1現有城鄉規劃管理技術局限性
80年代末開始,我國城市規劃管理領域開始引進新技術,網絡技術、虛擬現實技術、數據庫技術、地理信息系統、日照分析技術、電子報批審查技術等已初步得到運用,建立了基于GIS的城市規劃管理系統,但仍存在一定局限性:(1)現有管理信息系統存儲能力有限,仍無法建立實時、全面的資料檔案庫,同時也是內部條塊分割,查詢、檢索困難,給城市規劃管理工作帶來了一定的障礙。(2)由于規劃管理工作量大,規劃管理人員雖然借助規劃管理信息系統,提升了處理速度,但是仍不能滿足快速城市化背景下快速準確地處理各類城市規劃案件,對規劃管理實施效果進行快速反饋。(3)公眾參與與市民監督平臺建設不足,城鄉規劃管理透明度有待進一步提高。
3.2大數據時代城鄉規劃管理技術變革方向探討
3.2.1建立城鄉規劃管理大數據集系統,提高城鄉規劃管理效率
在大數據時代數據來源更廣泛且分布更集中,以前散落各處的數據越來越集中,以前不可獲取的信息現在可獲取。通過互聯網、醫療設備、視頻監控、移動設備、智能設備、非傳統IT 設備獲得的文本、圖形、音頻、視頻、遙感遙測等建立與城鄉規劃管理直接相關或者關聯的實時數據集,處理空間信息與與之相關的屬性信息,迅速及時地更新數據集,大規模綜合性地管理城市空間分布信息。在城鄉規劃管理編制階段,可以提高現狀調研的效率和規劃編制基礎數據的準確全面,建立相應問題表象對于城市規劃的決策系統、執行系統和反饋系統,改變規劃的滯后性和低效率,提高規劃的時效性。
3.2.2 建立城鄉規劃管理大數據分析系統,提高城鄉規劃管理科學性
基于城鄉規劃管理大數據,可將分散收集到的各種空間、屬性信息實時更新,利用大數據技術中相關分析技術,同時結合GIS的空間分析技術,運用到規劃管理的各個流程中,可進行人口、經濟、交通流等與用地功能、空間等進行相關分析,對于城鄉空間利用進行深入全面的解析,進一步提高城鄉規劃管理的科學性。
3.3城鄉規劃管理技術創新挑戰
目前城鄉規劃管理技術創新所面臨的挑戰也是大數據發展應用中需要解決的問題:(1)從城鄉規劃管理大數據中精準定位并采集所需信息、管理海量復雜結構、實時增長的數據、保護和控制數據,數據管理挑戰。(2)基于城鄉規劃大數據的實體識別與行為建模,挖掘大數據中蘊含的群體及其網絡結構,分析社會群體的行為演化規律,數據分析挑戰。(3)數據隱私性問題。
3.4城鄉規劃管理技術創新對策
大數據技術市場將會是一個混合多種技術的世界,應關注大數據技術的發展和應用,開發適合城鄉規劃管理不同層次的產品組合,包括服務器、存儲、網絡、軟件和服務等,以獲得更好的應用效果;加強城鄉規劃管理基礎大數據集建設;提高城鄉規劃管理角度數據分析和提取技術能力;加快大數據處理相關技術人員培養;同時通過技術截堵,應用立法保護城鄉規劃管理大數據應用中個人隱私。
4 結論
大數據時代已經到來,大數據的應用仍處于一個快速發展的起步階段,基于大數據和復雜系統管理理念的分析與決策是新形勢下城鄉規劃管理發展的必由之路,大數據是城鄉規劃管理信息化建設的戰略性資源和非物質性財富,是不可或缺的城鄉規劃管理和決策依據。將改變基于簡單數據統計、經驗分析甚至直覺判斷的城鄉規劃管理模式,提高城鄉規劃管理的有效性,加快城鄉規劃管理大數據庫建設和空間分析、相關分析能力,建立更加開放透明的公共參與平臺和市民監督系統,隨著大數據技術的發展改變大數據管理、分析、共享、決策、人才培養、隱私保護等問題,將會進一步提高城鄉規劃管理方面的信息化、智能化技術支撐能力,推動城鄉規劃管理由信息化向智能化發展。
參考文獻
[1] Big data in 2020[EB/OL].[2012-12-24]/leadership/digital-universe/iview/big-data-2020.htm
[2] IDC,中國大數據技術與服務市場 2012-2016 年預測與分析
[3]維克托•邁爾-舍恩伯格,肯尼思-庫克耶著,盛楊燕,周濤譯.杭州:浙江人民出版社,2013
作者簡介:黃 贊,男,國家注冊城市規劃師,現就職于中社科城市與環境規劃設計研究院,城鄉規劃所所長
大數據作為一種有用的信息資源,在商業、金融等領域發揮著越來越重要作用,也逐漸成為社會科學的國際前沿應用研究內容之一。然而,在經濟學領域,大數據還鮮少被用到(據統計,截至2014年12月,google中學術搜索到的與“大數據”有關的研究論文共3026篇,其中僅有29篇是和經濟學相關)。但因海量經濟數據資源的快速增長,計算技術和能力的不斷提高,以及方法論的不斷發展,將大數據分析技術運用于經濟學已成為一個值得探討的新課題。展望未來,由于經濟學是一門理論與實踐相結合的學科,將大數據應用于經濟學,有可能會開辟一個全新的經濟學發展領域。
一、大數據在經濟學領域應用的基本原理
大數據在經濟學中應用的基本思路以大樣本數據統計與機器學習技術為基礎。其中大樣本統計的過程概括如下:用N個代入變量得出對應的N個測量結果與K個潛在的預測因子,比如:以居民消費價格CPI指數預測為例,首先通過GOOGLE數據搜索或其他軟件,篩選出同CPI有關的一系列關鍵詞(比如糧食產量、原油期貨價格、氣候溫度、價格改革政策等),然后通過這些關鍵詞在文本數據(新聞、微博、評論、研究報告、學術論文等)出現的時間頻次,計算它們之間的相關關系和邏輯路徑關系,從而得到測量結果N和預測因子K。在許多情形下,每一個代入變量的信息是足夠豐富的,但不具有結構性,故可能會產生很多潛在預測因子,因此,需要注意的是:若是過度擬合,即預測因子K的個數可能會遠遠大于觀測變量N的個數時,雖然模型可完美解釋觀測到的結果,但樣本外數據的解釋力卻很差。在這種狀況下,構造一個最大化樣本解釋力的模型便成為首要目標,同時構建的模型還不能出現因過度擬合所導致的樣本外無力解釋的情形。因模型構建不同,使用方法也隨之改變,懲罰預測因子的過度使用方式也不同。如Lasso回歸模型,在滿足一系列約束條件下,依據最小化離差平方和來選擇模型系數。通過將樣本分為“訓練樣本”和“測試樣本”(“訓練樣本”用來估計模型參數,“測試樣本”用來評估模型)進行過度擬合。而在評估預測效果時,一般交叉使用樣本內預測與過度擬合,但目前這種交叉驗證的方法在當前的實證微觀經濟學中也鮮少用到。
機器學習的一個非常重要假設就是機器學習的環境是相對穩定的,也就是樣本數據(訓練樣本與測試樣本情形相同)獨立產生于同一過程。但由于現實環境會隨著時間發生改變,故這一假設并不合理,因此,在高頻使用新數據的應用中,往往通過對自身持續“再訓練”,從而使得模型可以隨著時間與環境的變化對預測結果進行調整。當然,對于機器學習,有些經濟學家提出了盧卡斯批判的疑問,即若根據模型的預測結果進行政策調整,則政策調整后的現實結果可能與初始模型的預測結果有差異,因為政策的改變會影響數據間的潛在行為關系,但這一疑問在其他預測模型,比如計量經濟模型、結構方程模型和聯立系統模型中也都存在。
二、大數據對經濟學的影響及前景
如今,隨著數據樣本容量的急劇增加,使得大數據的使用方式不盡相同。作為一個規律性科學,經濟學需要廣泛、詳細的數據,并運用統計技術來處理新型數據,大數據的出現可能會在社會學與計算機科學間構建一架橋梁,其學科價值可能在于創造新的思維方式,這將會導致對經濟學的新思考和研究方法創新,甚至會帶來分析經濟學方法的質變。
一方面,由于多維度的精細間隔,大數據可以為經濟學研究人員提供更多研究變量和視角,可以研究以前難以測度的行為理論,這為經濟理論研究提供了一種全新的測量方法。例如:麻省理工大學助理教授Alberto Cavallo設計的“百萬價格”項目,該項目旨在通過一個網絡程序,獲取網上物品價格,繼而運用這些數據計算得出通脹指數,該通貨膨脹指數就是阿根廷的精確透明通貨膨脹指標,其實時價格數據的捕捉能力和準確度,使得該指標作為政府測量通脹的替代選擇。又如,谷歌提供的請求式數據選擇也提供了一個探索新機會的理由,目前一個備受矚目的例子就是“及時預報”,在某些方面它可以通過龐大經濟社會數據集進行短期精確預測。
段云峰
承擔了國內最大電信運營商的數據倉庫和大數據中心的設計和建設、運營工作(截止到2015年該系統達到18000TB存儲容量,累計投資120億元),積累了15年的大數據領域的實際工作經驗。帶領相關的團隊,從系統創建到系統運營,開發了很多大數據領域的各種應用。積累了國內唯一的大數據在大企業建設、運營方面的經驗。其前后主持設計的文檔,有150余冊、1200多萬字,涉及大數據系統的數據模型、數據接口、系統架構、質量管控、業務應用、系統安全等各個領域。
秦曉飛
具有理學學士、工學學士和管理學碩士學位。最近十幾年先后從事BI系統的運維、開發、項目管理以及應用推廣等工作,參與并見證了中國移動BI系統從TB級別數據倉庫向PB級別大數據平臺跨越的整個過程。先后獲得高級工程師、信息系統項目管理師、高級電信業務師、國際信息系統審計師等專業資格認證,并且被評為2012年山西省青年崗位能手。在《移動通信》《中國新通信》《電子世界》《信息與電腦》等雜志發表多篇專業論文,并且申報了多項國家發明專利。
目錄
01大數據現狀/1
1.1大數據的概念和特點/2
1.2互聯網思維的故事/4
羊毛出在豬身上/4
圈客戶/圈眼球/4
1.3“天變了”/5
用戶變了/6
平臺變了/8
金融變了/9
營銷變了/9
思維變了/10
1.4大數據為什么需要互聯網思維/12
大數據項目不同于傳統IT項目/12
大數據產業是咨詢服務產業/13
互聯網思維是咨詢服務產業的法寶/14
大數據“變現”需要互聯網思維/15
大數據中“群眾的智慧是無窮的”/15
1.5小結/16
02堪比“文藝復興”的互聯網思維/17
2.1文藝復興的意義類比/18
藝術解放思想,思想解放生產力/19
引導了第一次工業革命/19
互聯網引導新的工業4.0/20
改寫金融業,改寫社會/21
2.2互聯網企業的發展/21
BAT的造夢/22
IT技術成為企業的核心競爭力/22
2.3互聯網思維的概念/24
2.4互聯網思維的特點/24
2.5互聯網思維改寫了手機產業/26
2.6互聯網思維改變大數據/29
大數據的客戶體驗/29
大數據的產品化思維/30
大數據的平臺思維/37
大數據的迭代思維/42
2.7大數據的新生/44
從配角到主角/44
產業化成為可能/45
大數據的春天/45
2.8小結/46
03大數據的發展/47
3.1大數據產業的發展/48
互聯網改寫了歷史,大數據改寫了互聯網/48
第三次浪潮中的新興產業/49
數據成為最大的資產/50
促進“理性社會”/51
3.2從網絡運營到大數據運營/52
互聯網平臺如何使用用戶數據/53
建立數據分析保障管理體制/55
從基礎設施到產品提供/57
從網絡產品到數據產品/59
3.3如何運營大數據/60
互聯網基因/60
對內服務/63
對外服務/66
大數據營銷/68
3.4大數據發展的瓶頸/69
與傳統IT不同/70
機構和機制不同/71
新理論和新思維/71
轉型更難/72
3.5小結/72
04大數據的客戶體驗/74
4.1客戶是誰/75
內部客戶/外部客戶/77
個人客戶/集團客戶/78
校園客戶/80
4.2客戶的大數據需求是什么/80
取數——“取柴火”/82
取知識——“將柴火燒成炭”/83
取專業建議——“集體供暖”/84
4.3客戶體驗是什么/85
什么是體驗/85
數據如何可讀/90
“啤酒和尿布”的另一個角度解讀/95
4.4客戶體驗如何提升/96
服務不同角色/96
娛樂思維/98
管家式服務/98
4.5小結/99
05大數據產品設計/100
5.1大數據產品背景/101
產品長什么樣/101
谷歌是搜索門戶還是數據門戶/102
提品還是平臺/103
賣咨詢服務/104
智慧產品/104
5.2大數據產品內容/105
工具類/106
中間類/107
像棋譜一樣的知識庫/108
數據分析手機/109
互聯網聯通了人,數聯網聯通了大腦/110
5.3產品的“客戶流量”/110
吸引客戶/110
運營客戶/111
5.4大數據產品類比/113
大數據的搜索門戶/113
大數據的社交平臺/113
大數據的電商平臺/115
大數據的云化——在云里找數據/115
5.5大數據產品特點/115
目的決定產品特點/116
通過對比顯示價值/116
更多的群眾參與/116
5.6產品的界面優化/117
從蘋果App中學習什么/117
結果的可視化/117
5.7產品的用戶定位/117
如何讓孩子看懂/118
數據的消費者/118
DIY發燒友/118
產品的商業模式/118
5.8小結/119
06大數據的極致思維/120
6.1產品的極致/121
傻瓜化的App/121
新的觸摸屏在哪里/123
服務的極致/124
專家的極致/125
棋手的極致/126
智能改造之后的極致產品/127
智慧產品的極致/132
6.2思維的極致/134
兵書的知識提煉/134
參謀的極致/134
知識庫和運維/135
思維的“眾籌”/135
6.3營銷的極致/136
點對點的精準營銷/136
成本控制的極致/137
6.4“講故事”的極致/137
吸引人的標題/138
吸引人的敘事方法/139
吸引人的數據證據選擇/140
6.5小結/140
07大數據的快速迭代/142
7.1怎么“快”/143
標準零件的拼接/143
分析過程簡單/143
不要追求完美,但求不斷完善/144
7.2數據的標準/144
大數據是否還有邏輯模型/144
口徑的管理/145
業務元數據和技術元數據/145
7.3平臺的標準/146
云計算平臺的標準化/146
PaaS還是SaaS/147
7.4環境的標準/148
編程規范和標準/148
軟件結算的標準等/149
7.5迭代的知識積累/149
農業知識積累出的農歷/149
何時更新、如何更新/150
7.6小結/150
08大數據的平臺思維/151
8.1大數據的平臺定義/152
數據得到豐富,取得規模效益/153
運營能夠細分,拓展發展前景/153
8.2大數據平臺思維的特點/153
平臺越來越通用,應用越來越專業/153
孤立的數據是金,共享的數據是鉆/154
數據的多維決定著平臺價值的多樣/154
8.3大數據的平臺實體——“數聯網”/154
數據交換的高效網絡/155
數聯網的內容/155
訪問工具/160
數據管控/161
8.4大數據平臺的生態環境/180
誰會購買大數據產品/181
各方獲利的互聯網模式/182
速度彌補精度/184
8.5平臺SDK的開放性/185
平臺的可編程API接口/186
數據的標準/186
數據的可讀性/187
加工的簡化性/188
容易參與/190
人人參與/192
8.6互聯網企業的數據開放平臺/192
阿里巴巴的御膳房/192
騰訊的微信開放平臺/199
百度的阿拉丁/202
8.7人人的“數據”到數據的“人人”/204
8.8互聯網平臺升級到大數據平臺/205
互聯網平臺是新時代的農業文明/205
大數據平臺的價值最大化/205
電信運營商,新的電力公司or大數據公司/206
8.9小結/207
09大數據的跨界思維/208
9.1大數據跨界的背景/209
Hadoop的興起,去了IOE/209
大數據的滲透——大數據×/210
9.2大數據跨界的定義/211
大數據跨界的特點/211
大數據跨界的展望/213
大數據跨界的案例/215
9.3大數據的業務多維/216
橫看成嶺側成峰/216
數據的行業解讀/216
9.4大數據的行業交叉/216
電信數據與金融數據的交叉/217
電商數據與醫藥數據的交叉/219
9.5小結/220
10大數據實踐案例探索/222
10.1大數據提升客戶體驗/223
基于角色的應用/223
解決問題的應用/226
用戶的GUI界面/234
10.2大數據實現產品化/238
BI Store案例/238
自助分析工具/242
用戶的知識庫/251
10.3大數據的極致思維/254
思維導圖案例/255
大數據分析報告劇本/256
10.4大數據的跨界思維/258
大數據在交通行業的應用/258
大數據在金融行業的應用/259
大數據在制造業的應用/261
10.5大數據的平臺思維/261
淘寶的API開放平臺/261
某電信運營商的對外開放平臺/265
10.6大數據的快速迭代/267
多波次灰度營銷/267
數據字典的迭代/268
文章編號:2095-5960(2014)02-0036-07;中圖分類號:F840;文獻標識碼:A
一、引言
信息是金融行業中最重要的資源之一,而數據是信息最直接的表現方式。隨著電子技術發展以及世界金融市場交易規模的迅速擴大,金融行業中的數據量呈爆炸式增長趨勢,如每一天世界金融產品交易數據達到500G以上,其中保險公司的數據占比達到12%(第一屆CCF大數據學術會議,國家會議中心,2012年12月)。這充分說明金融行業已經進入了“大數據時代”。
按照Kenneth Cukier在《Big data》中的定義,大數據又被稱為巨量信息、海量數據等,指的是所涉及的信息量非常巨大,超過傳統軟件和技術所涉及的范圍[1],而所謂的大數據技術或大數據能力就是在這種海量數據下有效的數據分析技術,即能夠利用各種各樣類型的巨量數據,快速獲取有價值信息,并使之應用的能力[2]。鑒于金融行業的巨量數據存量以及每天的新增數據規模,大數據分析能力對其尤為重要[3],保險公司是金融行業的重要組成部分,也不可避免要面對大數據現狀,充分利用巨量數據來推動業務發展和創新,提升競爭力也自然成為當前最迫切的任務[4][5]。
為了詳細了解我國國內的大數據情況,我們對中國保險業進行了數據情況的統計(以下簡稱“中國保險業大數據背景調查”)。該統計所涉及的保險公司共122家,其中包括58家人身險公司、59家財產險公司以及5家再保險公司。在人身險公司中,中資公司35家,外資公司23家;在財產險公司中,中資公司38家,外資公司21家。這些公司的業務規模占全部保險市場的95%以上,可以認為調查結果具有一定的普遍性。
我們統計的數據種類包括以下五類:一是保單數據及保單維持數據:這部分數據組成了保險公司的業務系統,以專業的數據庫軟件來操作。二是核賠理賠數據:這部分數據隨著電子化進程加快,大部分也在業務系統中,同時部門內部也有對應的數據庫。三是投資理財數據:因為壽險經營時間長,需要對保費保值增值,所以壽險的保費投資是經營的重要方面,導致這部分數據非常豐富,相對來說,財產險公司中,這類數據量比例較小。四是定價數據:這部分數據是精算部門用來定價和利潤測試,以及用來向保監會報送各類報表運算時候需要的數據,有相當一部分來自于業務系統。五是風險管理數據,這部分數據相當零散,且涉及以上各類數據,同時還包括公司的財務數據、行業數據、監管數據、宏觀經濟數據乃至宏觀管理數據。六是再保險公司公司數據,再保險公司承擔保險公司的分出業務,通常掌握了很多家原保險公司的數據,具有比原保險公司更多的數據,這部分數據盡管有相當一部分來自于原保險公司,但大數據的核心并非是關注數據的重復問題,而是如何利用數據進行快速決策,所以我們把再保險公司的數據也統計在內。
我們對所有參與統計的原保險公司前五類數據并匯總,然后加上再保險公司數據,由此構成中國保險業整體的數據情況。這里需要注意到:匯總過程中會有很多冗余數據,例如投資相關的金融市場數據等,但從大數據的核心出發,這些數據應該不作區分。原因如下:
首先,大數據的本質是快速和預測,而并不關心重復數據的冗余情況,對重復數據冗余的處理其實是降低大數據應用效率的,大數據更關心的是基于整體的巨量信息快速進行決策和分析[6][7]。
其次,每家公司在經營過程中,即需要考慮公司本身特有的信息、特有的數據,同時也必然和其他公司一樣面對公共的信息、公共的數據,這些數據都是他們決策基礎[5]。
最后,重復的數據雖然存在但其對決策的影響其實是不同的,這和一同協作的數據有關,也和每家公司的大數據能力有關,換句話說,對每家公司來說,即使是重復的數據但也意味著不同的信息。
這種現狀正是本文研究的出發點,我們將以掌握的數據為基礎,在定價、巨災分析以及健康險方面進行大數據應用研究的嘗試。
二、跨部門大數據應用:壽險產品精算定價
產品精算定價能力是保險公司的核心競爭力之一,大數據在精算定價中的應用核心就是從“樣本精算”過渡到“全量精算”。
對壽險來講,保險公司基于“精算模型”,并使用“資產份額”和“宏觀定價”等方法來確定實際保費。對財險公司而言,保險公司通常利用歷史數據來獲得“損失模型”,并通過分析各因素作用來獲得最終保費。傳統的這些過程中,一般只涉及公司所掌握數據的很小一部分,是“樣本精算”,但為了獲得更大的市場空間,保險公司有必要利用大數據來獲得“定價”的比較優勢,實現“全量精算”。這里我們僅以壽險定價為例來進行應用研究。
壽險公司在長期經營過程中積累了大量的數據和信息,同時外部環境變化也積累了海量數據,而傳統的壽險產品定價對這些數據置若罔聞,仍然是基于保監會公布的00—03生命表和一些公司的有限信息來進行,這必然不能反映真實的風險狀況,也喪失了市場競爭中的比較優勢。
這里以一家普通的保險公司為例來說明大數據應用。我們將數據范圍擴展到公司的全部部門(包含整個業務部門乃至核保核賠部門),這些部門的數據經過唯一的ID(如身份證號)鏈接,形成一個龐大的海量數據記錄,在舍棄一些信息并整理后(僅包含索賠引起的死亡率信息)形成了一個900M的數據庫,涵蓋的時間是2003—2009。該數據即是進行“全量精算”的基礎。接下來,我們對數據庫進行整理并加上國家統計的數據(來自于《中國人口與就業統計年鑒》),獲得了從1983年開始的分年齡段死亡率表(表1)。
根據此定理,我們利用大數據的信息來進行參數估計,方法是最小二乘法或極大似然估計。保險公司僅需要在大數據的基礎上,進行程序運算,給出對應的距離或其他信息,就可以得到該極值分布的具體參數。如我們以上述例子為樣本,可以得到其參數估計值分別為-0.7和1.8。有了損失分布,財產險公司就可以用來進行定價或者進行分保安排,而再保險公司就可以進行風險控制。
五、結論
通過以上大數據在保險公司中的具體應用,我們得到幾點結論:
第一,保險公司應該在定價中充分利用公司所掌握的全部數據,讓定價從“樣本精算”轉移到“全量精算”上來,讓每個部門數據都發揮作用,通過整合和利用大數據技術,達到更精確的風險定價,從而獲得更大的定價空間。
第二,保險公司自身應該重視數據接力,甚至保險公司之間應該加強數據合作,通過針對性的保險產品覆蓋來實現客戶價值挖掘,擴大保險市場。
第三,保險公是不但要重視本行業的數據積累,還要重視并挖掘其他行業的數據價值,通過與自身數據的融合來實現大數據所帶來的價值。
參考文獻:
[1] Viktor and Kenneth, Big Data: A revolution that will transform how we live work and think [M]. Eamon Dolan/Houghton Mifflin Harcourt Press, 2013.
[2] Redman T.The impact of poor data quality on the typical enterprise [J].Communications of the ACM,1998,41(2):79-82.
[3] 張寧,云計算在保險公司信息化中的應用[J].數學的實踐與認識, 2012, 42(27): 97-103.
[4] Eckerson W.Data Warehousing Special Report:Data quality and the bottom line JR. Applications Development Trends,2002.
[5] English LP.Improving Data Warehouse and Business Information Quality:Methods for Reducing Costs and Increasing Profits[M].New York:Wiley,1999
[6] Swartz N.Gartner warns firms of‘dirty data’ [J].Information Management Journal, 2007, 41(3):6-12.
[中圖分類號] F83 [文獻標識碼] A [文章編號] 2095-3437(2014)14-0029-02
一、背景
數據是與自然資源、人力資源一樣重要的戰略資源,其背后隱含著巨大的經濟價值。近年來,“大數據”研究已經備受關注。[1]例如,2012年,美國政府在國內了“大數據”研究和《發展倡議》,投資約兩億美元發展大數據研究,用以強化國土安全、轉變教育學習模式和進一步加速科學和工程領域的創新速度和水平。繼1993年美國宣布“信息高速公路”計劃后,這項決定標志著美國的又一次重大科技發展部署。美國政府認為“大數據”研究勢必對未來的科技、經濟等各領域的發展帶來深遠影響。在大數據應用的技術需求牽引下,數據科學研究和人才培養引起了各國的重視。美國哥倫比亞大學和紐約大學、澳大利亞悉尼科技大學、日本名古屋大學、韓國釜山國立大學等紛紛成立數據科學研究機構;美國加州大學伯克利分校和伊利諾伊大學香檳分校、英國鄧迪大學等一大批高校開設了數據科學課程。
二、機器學習理論
機器學習(machine learning)是繼專家系統之后人工智能應用的又一重要研究內容,在某種意義上,機器學習或將認為是數據挖掘的同義詞。數據挖掘是指有組織、有目的地收集數據、分析數據,從海量數據中尋找潛在規律,并使之為決策規劃提供有價值信息的技術。機器學習是人工智能的核心部分,在金融、工業、商業、互聯網以及航天等各個領域均發揮著重要的作用。對機器學習研究的進展,必將對人工智能、數據挖掘領域的發展具有深遠影響。
機器學習方法主要包括:Exper System(專家系統)、K-Nearest Neighbor(K近鄰算法)、Decision Tree(決策樹)、Neural Net(神經網絡)、Support Vector Machine(支持向量機)、Cluster Analysis(聚類分析)等。近幾年,研究人員將遺傳算法、神經網絡、系統理論以及當代數學研究的最新進展,應用于金融領域。這使得金融領域數據挖掘在金融管理中備受青睞。例如,產品定價、金融風險管理、投資決策甚至金融監管都越來越重視金融數據挖掘,通過數據挖掘發現金融市場發展的潛在規律與發展動態。機器學習理論及其在金融領域的應用成為了一個比較熱的研究領域。[2] [3]
三、金融數據的特點
在眾多機器學習方法中,基于Logistic回歸、判別分析等傳統的統計方法,對金融模型假定條件非常嚴格,在實際應用中很難達到理想效果。其原因在于對金融數據的非線性和非平穩性的操作具有片面局限性,在實際處理金融數據時,既定假設與金融市場發展實際并不完全一致,這樣可能會影響模型的推廣能力和泛化能力。
基于分類樹方法、K-近鄰判別分析、遺傳算法等傳統的非參數統計方法,其預測能力較好,但不能量化解釋指標的程度。例如,K-近鄰判別分析是一種非參數距離學習方法,通常按照數據樣本之間的距離或相關系數進行度量,這樣會受到少數異常數據點的影響。但是,在相同樣本容量下,如果對于具體問題確實存在特定參數模型可以應用時,非參數方法效率相對較低。以神經網絡、支持向量機等為典型的機器學習方法,優點在于可以有效處理金融數據的非線性特性,并且不需要事先嚴格的統計假設,這樣會表現出較強的適應效果,充分體現人工智能、機器學習等方法的魅力。神經網絡預測精度是各種機器學習方法中相對較好的,因為在一定程度上,神經網絡可以按照任意精度近似非線性函數,為高度非線性問題的建模和算法提供相應支持。盡管神經網絡技術進步有目共睹,但仍然存在一些難題。例如,通常難以確定隱層節點數,并會存在“過學習”現象和局部極小值等問題。
四、支持向量機
傳統的統計模式識別方法是在樣本數目足夠多的情況下進行的,但是樣本數目足夠多在實際問題里面往往難以保證。1968年Vapnik等人首次提出了統計學習理論,專門從事有限樣本情況下機器學習規律的研究。在此基礎上,1995年Vapnik等人首先提出支持向量機(Support Vector Machine,簡稱SVM)的學習方法,它是數據挖掘中的一項新的技術。SVM是機器學習研究領域的一項重大成果,主要研究如何根據有限學習樣本進行模式識別和回歸預測,使在對未知樣本的估計過程中,期望風險最小。近年來,它被廣泛地應用于統計分類以及回歸分析中。近幾年的研究成果表明,SVM在實用算法研究、設計和實現方面已取得豐碩的成果,其在理論研究和算法實現方面都有突破性進展,逐漸開始成為克服維數災難和過學習等傳統問題的有力手段。支持向量機可以成功處理回歸分析和模式識別等諸多問題,并可推廣于預測和綜合評價等領域,因此可應用于管理、經濟等多種學科。支持向量機屬于一般化線性分類器,可以認為是提克洛夫規則化(Tikhonov Regularization)方法的一個特例,其特點是他們能夠同時最小化經驗誤差與最大化幾何邊緣區。支持向量機的優點表現在:1.它通過使用結構風險最小化代替傳統的經驗風險最小化,使用滿足Mercer 條件的核函數,把輸入空間的數據變換到高維的Hilbert 空間,將向量映射到一個更高維的空間里。在這個空間里建立有一個最大間隔超平面,實現了由輸入空間中的非線性分析到Hilbert 空間中的線性分析。2.訓練的復雜度與輸入空間的維數無關,只與訓練的樣本數目有關。3.稀疏性。決定最大間隔超平面的只是少數向量――支持向量,就推廣能力方面而言, 較少的支持向量數在統計意義上對應好的推廣能力。4.本質上,SVM算法是一個二次優化問題,能保證所得到的解是全局最優的解。綜上所述,SVM在一定程度上解決了以往困擾機器學習方法的很多問題,例如,模型選擇與“過學習”問題、非線性和高維小樣本等維數災難問題、局部極小問題等。[4]正是由于SVM具有完備的理論基礎和出色的應用表現,使其在解決高維小樣本、非線性、壓縮感知以及高維模式識別問題中表現出獨特的優勢,正成為自神經網絡之后,機器學習領域中新的研究熱點之一。[5] [6]
同其他機器學習方法比較,支持向量機更具嚴密的理論基礎,因而在模型表現上也略勝一籌,被成功應用于模式分類、非線性回歸,從使用效果來看,其結果較為理想。但從實踐角度分析來看,模型參數的選擇過度依賴人們的實驗方法和實踐技能,在一定程度上降低了模型的推廣泛化能力和應用領域。同時計算方面,訓練時間過長、核參數的確定,在大訓練樣本情況下, SVM面臨著維數災難,甚至會由于內存的限制導致無法訓練。目前支持向量機在金融數據挖掘方面也存在一定的局限性,主要表現以下幾方面:動態適應性、魯棒性、特征變量異質性調整、模型推廣精度等不盡如人意;建模方法與技術還有待進一步完善;支持向量機研究金融數據挖掘和金融問題的成果雖然不少,但大多集中在股票價格和股票市場走勢預測方面,關于公司財務危機預測、套期保值分析、金融市場連接機制分析及其創新成果方面有待加強。
五、結論
大數據時代下金融專業的數學重在以下方面的應用:深度學習(Deep Learning)、機器學習和數據挖掘、分布式計算,如MR、Hadoop等,在大數據中預測最先取得突破的技術環節將會是分析中的大數據挖掘與關聯分析、存儲結構和系統、數據采集和數據化。目前金融問題的研究方向和發展趨勢,主要集中在計量經濟方法,例如,格蘭杰因果分析、向量自回歸、條件異方差、隨機波動分析等。這些計量經濟方法和技術大部分使用了線性技術,以及與金融市場不太吻合的理論假設,基于這些方法的結果,例如,資產預測價格、發展動態以及風險評估結果和實際出入較大,影響了金融管理的效率。對于我們大學教師來說,如何將已有分析數據算法整合,讓學生抓住重點,挖掘到比較可靠的信息或知識,都將成為金融專業數學研究的方向和目標。
[ 注 釋 ]
[1] Anand Rajaraman Jeffrey David Ullman.大數據――互聯網大規模數據挖掘與分布式處理[M].北京:人民郵電出版社,2012.
[2] Kumar, P.R. and Ravi, V. 2007. Bankruptcy prediction in banks and firms via statistical and intelligent techniques-a review. European Journal of Operational Research, 180(1):1-28.
[3] M. Oet, R. Eiben, T. Bianco,D.Gramlich, S. Ong, and J.Wang,“SAFE: an early warning system for systemic banking risk,”in Proceedings of the 24th Australasian Finance and BankingConference, SSRN, 2011.
二、大數據背景下會計專業教學創新的主要方向
大數據要求會計教學提高學習主動性。相對于對科技進步較為敏感的網絡專業,會計專業的學生較為缺乏對新時代的敏感性和學習并適應新時代要求的主動性,會計專業的教學甚至科研都對大數據缺乏敏感度。在日新月異的新時代,會計教學不應只拘泥于傳統的教學內容,更要培養學生的自主學習意識,幫助學生在走上工作崗位后,能夠有不斷更新自己、與時俱進和不斷學習的習慣,才不會在發展浪潮中被淘汰。學習的主動性來源于自主學習意識和對新知識的認知感。自主學習意識是人的主觀能動作用,需要人對該事物的重要性和緊迫性有足夠認知,并有足夠自制力將其轉化為積極主動的動力。在大數據背景下增強會計專業學生的自主學習能力,需要會計教學的教師們充實和更新教學的內容,緊跟時代步伐,到一線企業公司了解工作的實務內容和要求,將大數據的實例轉化成題目或操作項目,引進到教學中來;還需要教師們創新教學手段,充分利用網絡資源和數據,引進全方位、多角度的操作實踐,讓學生充分認識到大數據的運用與教科書上會計基本理論知識的區別,并將會計的基本原理,從課本題目的小數據,延伸到工作中的大數據中,熟練運用和操作大數據。對新知識的認知感是青年學生的最大優勢,在足夠的興趣和主動性影響下,青年學生對大數據時代新鮮事物的感知性可能是其教師們都比不上的。這時就需要教師們因勢利導,充分發揮學生的認知感,認可學生的銳眼和創新想法,并組織學生進行交流,形成競爭意識,將學生對新知識的了解,轉化為教學內容,并引導學生進行課內課外的主動交流,互通有無,團結協作,互相學習,研究創新。
三、大數據視角下會計專業教學的創新
目前高職院校會計專業人才培養理念拘泥于培養記賬、算賬甚至做賬的會計從業人員。但是,會計專業學生所服務的有潛力的大中小型企業更需要會計人員在企業的戰略管理方面提供服務,即需要會計管理能力,尤其是在交易量特別巨大的行業市場,需要會計人才對相關市場進行大數據的收集和分析,為企業中短期決策提供數據依據支持。教學創新首先要做到教學理念的創新,只有理念先進了,教學改革創新才會順利進行,否則傳統勢力的存在會對教學改革產生負面影響。從教學理念上看,會計專業的教學理念需要適應科技經濟的社會發展需要,調整方向應該是:以核算能力的培養為基礎,以會計管理能力的培養為核心,運用新的科技手段,掌握大數據的處理和分析。教師必須先從自身做起,更新自己的觀念,充分體會和感受大數據對工作和生活的巨大影響。然后要對大數據在職業中的實際應用有所了解,對大數據給會計工作帶來的機遇與挑戰,知識的更新和創新有所了解,對社會的發展趨勢緊緊把握,將最新的信息引入到教學中來。在理念更新的基礎上,會計教學要對課程計劃進行創新,在傳統教學的理論基礎上,引進新的資源和知識體系,增強學生的實踐技能和工作能力。同時,也將會計理論潛移默化地引入到大數據的要求中去,培養學生對大數據的編制能力、處理能力、運算能力、檢查能力和總結能力。從實際操作來看,會計專業教學的創新,要在保證學生擁有接入相關網絡數據的、處理運算大數據能力的基礎計算機硬件和軟件設備的基礎上進行。首先應培養學生在網絡數據中挖掘有效資源的能力。教師在教學過程中應布置此類作業或實踐項目,鍛煉學生在網絡上查找和篩選數據的能力。在搜集數據的基礎上,在保證學生對傳統會計理論知識充分掌握的前提下,教師教學生使用相關軟件進行數據分析,培養學生對數據的預處理和建模創新能力,幫助學生養成管理型會計的思維方式。另外,由于大數據的工作量巨大,實際會計工作往往是由一個會計團隊合作進行的。在創新的課程中,必須通過課題或項目,讓學生組成項目小組進行實踐操作,通過團隊合作完成項目的方式,使學生能夠運用會計專業的各方面知識,分擔會計工作流程中的各個工作崗位的角色,培養團隊意識,學會分工合作,適應未來工作需要。在開設檢索課程和統計學課程之外,需要增設數據處理軟件工具的實務操作課程,在會計電算化的要求下,會計教學中必須教會學生如何熟練、巧妙地使用電算化的相關軟件,如ex-cel、用友等。在學校里,學生學習的都是基本用法,但是在實際工作中,由于行業不同、企業不同、數據性質不同、計算需要不同,會計需要自己編制一些適合的表格進行計算。那么,復雜套表的設計,公式的運用等就需要會計靈活地使用軟件進行設計,滿足會計實際工作中的需要。由于大數據的規模性和系統性,并且處理的數據量巨大,一個小小的差錯就可能導致結果的很大誤差或錯誤,會計工作中的準確性和對責任感的要求都是極為嚴格的。教學實踐中需要步步留痕,每一個步驟都是由團隊中的某位成員進行的,都有據可查,在作業結果錯誤時,對出錯的成員進行“懲罰”,以示團隊對準確性的嚴格要求,以利于團隊成員中個人責任感的提升。教學中也可以建立學分之外的獎懲機制,在項目進行的過程中和項目完成后,對優秀學生進行獎勵,對出過錯誤的學生進行“懲罰”。課程中還可以結合實務技能,引用互聯網上的實際數據,分門別類地對各行業的大數據進行立項分析,或者從某些大型企業的公開數據中,進行數據的引用,使用這些數據進行教學訓練,模擬公司會計實務操作流程,使學生能夠身臨其境地進行大數據的計算和分析,以總結性論文、報告或演講的形式將結論進行匯報,通過各組的相互對比,評價立項活動的各組業績是否正確,從而進行學分評價。完善會計網絡教學平臺建設和使用。學校可以設計搭建或引進會計網絡教學平臺,學生平時通過平臺進行課程學習、完成和提交作業、完成隨堂和結課測驗等功能。運用網絡促進學生學習,需要進一步完善網絡軟硬件設施的建設,及時升級更新教學平臺,引進會計的大數據資源,進行相關數據的自動或手動的實時監控收集,套用常用的建模,劃分統計模塊,進行項目操作。同時,教學平臺還要讓學生查看學習作業和隨堂測試結果,教師的評語和建議,及時了解自己不懂不會的知識點。教師也能全面了解學生隨堂知識的掌握情況,掌握學生學習動態數據,隨時改進教學進度和教學方法。會計教學的創新還可以與行業公司進行合作,承攬一些實際的會計工作項目,如預決算、招投標、核標、工程評估、財務報表、統計、科研調查等。這一與關聯公司的互動合作是互利互惠的,既能幫助公司完成工作,也能借此鍛煉學生的工作能力,促使學生將理論與實踐相結合,為學生的未來工作打好基礎。