時間:2023-10-08 09:42:35
序論:速發表網結合其深厚的文秘經驗,特別為您篩選了11篇數據分析的統計學基礎范文。如果您需要更多原創資料,歡迎隨時與我們的客服老師聯系,希望您能從中汲取靈感和知識!

2019年12月,農業農村部、中央網絡安全和信息化委員會辦公室關于印發《數字農業農村發展規劃(2019-2025年)》的通知,部署了用數字化引領驅動農業農村現代化,加快農業農村生產經營、管理服務的數字化改造的發展戰略,將全面提升農業農村生產智能化、經營網絡化、管理高效化、服務便捷化水平作為農業農村發展的目標[1]。農業農村的數字化建設離不開專業人才的培養。農林經濟管理專業畢業生的就業方向主要有農業經營單位、面向農業農村的政府管理部門、事業單位、科研院所等。隨著農業農村數字化發展戰略的推進,給傳統的農經人才培養帶來了一系列的挑戰[2]。在數字經濟和智慧農業的時展背景下,數據分析能力是農經專業學生重要的核心競爭力。如何提升農經專業學生數據分析能力,是農經專業人才培養中面臨的重要課題[3]。
1農業農村數字化發展戰略給農經人才培養帶來的挑戰
1.1對農經人才的數據思維的更高要求
在大數據時代,無論是農業生產經營活動,還是農村的行政管理中都有大量的數據資源。農業企業、農業合作經營組織、農產品產銷數據、農產品溯源數據為農業經營者提供了生產、物流、銷售環節大量的數據資源。經營者需要認識到數據是一種新的生產要素,要調動數據作為生產要素的屬性,讓數據分析為管理決策服務[4]。在數字中國的建設進程中,各級政府部門工作人員通過各級各部門的行政管理智能,收集了大量省、市、區、縣級的區域經濟社會發展數據。社區網格化管理下收集了微觀層面的農業經營單位數據、農村常住人口數據、醫保數據、扶貧數據、農村小額信貸數據。這些數據資源是政府提高行政效率、提高政務服務質量的寶貴資源。
1.2對農經人才的數據分析能力的更高要求
在大數據時代,每天都有海量數據生成,如何能更好地利用這些數據,讓數據能發揮其為管理決策服務的功能,與數據使用者的數據分析能力是密切相關的。例如,農業經營單位在農業生產環節的農業投入數據、農產品銷售數據、電商平臺的客戶反饋評論、農產品庫存的動態數據,如何整合分析這些數據,要求農業經營者系統掌握數據分析、數據挖掘、文本分析等多元化的數據分析方法。政府管理部門掌握的農業人口的遷移數據、農村常住人口網格管理數據、農村居民醫保數據、扶貧數據等,數據類型豐富,數據量龐雜,如何實現數據庫的整合,要求政府部門工作人員掌握數據庫管理、大數據分析技術。
2農經專業數據分析課程群建設中存在的問題
2.1課程之間連貫性不足
以筆者所在的高校為例,為農經專業本科生開設的數據分析類課程,見表1。數據分析課程群包括了通識教育、專業教育和實踐教育。從目前的課程設置來看,涵蓋了數據庫、統計學、經濟計量學、多元統計、大數據分析等領域,內容豐富。數據庫應用由計算機學院開設,是一門通識教育課程,在授課時教師往往將其視為一門計算機類的入門課程,在教學中沒有針對農經專業學生的特質,將數據庫的教學與其在農經領域的應用結合起來。學生在學習中往往會覺得該課程與專業聯系不夠緊密,教學內容枯燥,缺乏學習興趣。
2.2學生學習的軟件種類繁多,但不夠深入
在統計學和多元統計課程中,學生將學習EXCEL、SPSS或者R語言的應用,在經濟計量學課程中學生將學習Eviews或STATA的應用,在數據挖掘與大數據分析課程中學生將學習Python語言的應用。在每一門課程中學習的軟件都不同,對于軟件的學習缺乏連貫性和延續性,雖然學生接觸的軟件種類多,但是由于學時所限,每一種軟件都只是入門級的介紹,無法進入到深度學習。
2.3與專業課學習聯系不夠緊密,缺乏應用機會
學生缺乏在專業課學習中運用數據分析類課程所學知識的機會。數據分析類課程主要介紹數據分析方法和軟件的應用,但大部分都安排在第5學期和第6學期。學生在學習了數據分析方法后,缺少在專業學習領域里運用這些方法的機會。例如學生若要完成產業經濟學、農業技術經濟學、農產品國際貿易學的專題研究、課程論文,需要用到統計學、經濟計量學、大數據分析的方法,但在第2-4學期開設大量專業課的學期,數據分析類課程還沒有開設。若能將數據分析類課程盡量靠前安排,學生可以在后續的專業學習、課題研究中運用所學的方法,一方面夯實數據分析技能,另一方面也可以增加學生對專業課的學習興趣。
2.4排課不夠科學
在大三階段,學生可以選修多元統計、數據挖掘與大數據分析、Python語言三門選修課。但到了大三,學生專業課的學習任務重,選修課種類考慮繁多,學生選課可能出于興趣、學分安排或者準備考研保研考慮,并不是每一位同學都會選修上述課程。尤其是計算機能力不太強、對數學類課程感到困難的同學,會傾向于選擇難度小的課程。
3基于項目驅動式教學理念的數據分析課程群改革
3.1開展項目驅動式教學的意義
項目驅動教學法是基于行動導向的探究式教學方法,是將真實的或模擬的項目轉化為教學項目,結合課程內容將項目分解為若干工作任務,創設工作情境,引導學生完成任務,進而實現項目教學目標的教學活動[4-5]。項目驅動式教學法最顯著的特點是“以項目為主線、教師為主導、學生為主體”,改變了以往“教師講,學生聽”被動的教學模式,完善了學生主動參與、自主協作、探索創新的新型教學模式。與傳統教學方法相比,教學實施過程中,學生的目標更清晰明確,可避免傳統課堂教學的被動性,進而提高學生學習知識的興趣和主動性[6]。在數據分析課程群中引入項目驅動教學,一方面能讓學生運用所學的數據分析方法分析現實問題,創設數據分析情境,加深對所學方法的理解和運用,激發學習興趣,培養自主學習能力;另一方面也可以有針對性地創設圍繞“三農”問題的數據分析項目,讓學生從數據分析中加深對“三農”問題的感性認識,培養對農經專業學習的興趣,提升對農經專業的認同度。具體來講,可以從以下方面開展對數據分析課程群的改革[7]。
3.2統籌規劃教學內容,加強課程間的連貫和遞進
農經專業數據分析課程群目前主要包括必修課數據庫應用、統計學和經濟計量學,選修課多元統計、數據挖掘與大數據分析,以及實踐課R語言與統計應用、Python語言。統計學教學的重點在于對基礎性的統計方法的運用,經濟計量學教學的重點在于讓學生掌握經濟計量分析的范式,如何利用經濟計量模型開展實證分析。多元統計強調對復雜多維數據信息的提煉。數據挖掘與大數據分析教學的重點在于大數據時代數據挖掘方法的應用。此外,針對于目前學生所學的軟件門類過多,軟件操作不夠熟練,建議在統計學、多元統計、數據挖掘大數據分析中統一采用R語言進行教學,讓學生通過幾門課程的學習,能夠熟練掌握一種統計分析軟件。
3.3基于項目驅動對教學內容進行整合及優化,調動學生主動參與
例如統計學課程介紹了基礎性的統計分析方法,在后續課程經濟計量學、多元統計、數據挖掘與大數據分析中引導學生運用基礎性統計分析方法,對數據進行初步的統計分析和整理,為經濟計量分析、多元統計、數據挖掘做好數據處理上的準備,讓學生體會到關聯課程中所學知識的聯結。鼓勵學生積極參與“三下鄉”活動,開展田野調查實踐,圍繞“三農”開展調研,運用統計和計量方法對調研數據進行分析,鼓勵學生參與到教學中來,培養學生的學習興趣,學以致用。
3.4建設“項目驅動”實踐教學模塊
結合農經專業課程體系,建設數據分析課程群“項目驅動”實踐教學模塊。在農經專業的課程體系中開設的農業經濟學、農產品貿易、農村社會學等專業性課程對大量的“三農”問題進行了探討,這類課程中涉及的城鄉差異問題、收入和消費問題、農產品價格波動、農產品貿易等現實問題的研究,都離不開基于現實數據的定量分析。因此,在農經專業的數據分析課程群中可以結合教學內容引導學生對專業課學習中熱點問題的研究,圍繞課程教學大綱,建設“項目驅動”實踐教學模塊,理論聯系實際,讓學生在研究項目中運用所學的數據分析方法,加深對專業知識的理解。
4農經專業數據分析課程群優化方案
在大數據時代,數據分析能力是學生的核心競爭力之一。數據分析類課程在建設中要強調理論與實踐的結合,不能只是將教學停留在課堂上,引入體現專業特色的實踐教學環節。可以從以下幾方面開展數據分析課程群的優化:第一,數據分析基礎類必修課安排在大一學年。在第1學期,可以安排R入門、Python入門、數據可視化課程,讓學生盡早接觸當前主流的數據分析軟件,激發學生對R或Python的學習興趣,讓學生自我拓展學習空間。R入門、Python入門、或者數據可視化課程都屬于數據分析的基礎課程,無需其他先修課程。在這一時期,讓學生開始接觸數據分析軟件,學習數據可視化的分析工具,有利于培養學生的數據思維、數據意識和軟件實操能力。第二,將與農經專業課有關的專業必修課統計學、經濟計量學安排在第3-4學期學習。統計學課程需要學生先行修讀高等數學和概率論課程,經濟計量學需要學生先行修讀微觀經濟學、宏觀經濟學,因此可安排在第3-4學期。讓學生在掌握了一定經濟管理專業知識后,可以更好地體會統計學、經濟計量學方法論學科的應用價值。第三,將數據分析進階類選修課多元統計、大數據分析、數據挖掘、機器學習等課程安排在第5-6學期。為高年學生提供豐富的數據分析類選修課,讓學生結合自己的興趣、未來的發展規劃學習更加多元化的數據分析技術。鼓勵學生能在專業論文習作、學科競賽中有更多的機會運用自己所學的數據分析方法,增加學生的收獲感和成就感,挖掘學生的學習潛力。第四,改革課程考核評價體系,采用項目式管理和評估的思路,由學生自主開展一個數據分析項目,從收集數據、提出問題、分析數據到提煉研究結論,開展小組團隊成員互評。教師跟蹤學生的項目開展過程,從學生的學習態度、投入程度、數據分析質量等綜合評價學生的學習效果。
5結束語
將項目驅動教學引入到農經專業數據分析課程群的建設,讓學生參與到教學中去,突破傳統教學中“教師教學生學”的局面,讓學生通過參與項目,運用數據分析方法解決項目中的實際問題,激發學生的學習興趣和潛能,讓學生體會到所學知識的應用價值,讓學生不再對數據分析類課程望而生畏。本文的研究對于農經專業學生數據分析能力的培養有重要的意義,強調理論與實踐的結合,提高學生數據分析的高階能力,也能為同類課程開展項目驅動教學提供借鑒。
參考文獻:
[1]農業農村部中央網絡安全和信息化委員會辦公室關于印發《數字農業農村發展規劃(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].
[2]李虹賢.農業經濟管理專業人才培養模式創新研究與實踐[J].智慧農業導刊,2022,2(7):110-112.
[3]馮開文,陶冶.農業經濟管理專業實踐教學改革———以中國農業大學經濟管理學院為例[J].教育現代化,2017,4(23):54-56+63.
[4]杜洪燕,陳俊紅.鄉村振興背景下中國數字農業高質量發展路徑研究[J].南方農業,2021,15(21):213-214.
[5]金娥.基于項目式學習的《現代教育技術應用》課程學習框架的設計與實踐研究[D].武漢:華中師范大學,2021.
二、基于大數據分析的特點科學構建課程體系
大數據背景下,人們可以通過互聯網、數據庫以及各種通信工具獲得海量數據,人們日常生活、學習和工作的各類事物都可以實現信息化,世界幾乎是由各種信息和數據所構成的。大數據的特點可以歸結為四個V,數量大(Volume)、類型繁多(Variety)、價值密度低(Value)、速度快時效高(Velocity)[6]8-9。大數據的真正意義不在于能提供龐大的數據量,而是對海量的數據進行專業的處理和分析,并從中獲取用戶關注的信息。結合當前互聯網應用中大數據本身的特點,從大數據中挖掘出重要知識并對之深度學習和分析的工具和方法也應與時俱進地發生改變,傳統的統計方法和統計分析工具已無法滿足大數據分析的需要。然而,在大多數高等院校中,統計學專業人才培養的課程體系并沒有考慮社會的實際應用需求,仍然停留在以傳統的統計模型框架為主導的課程體系設置,本科生教育的主要專業課程包括:數學分析、高等概率論與數理統計、應用隨機過程、回歸分析和多元統計分析等[10]248-249,這些課程內容和知識結構還不足以滿足大數據時代對數據分析專業人才知識結構的要求,課程體系設置中缺少能有效整合的數據分析能力培養模塊[11]66-68。因此,有必要針對各類院校師生各自的專業特點和學科基礎,分層次、分階段地展開課程體系改革。(一)參考國內外先進高校大數據分析專業的課程設置,結合本校的師資和專業結構特點采取靈活的策略制定課程計劃,在實施學分制改革的高校中各類學生可以在學業導師指導下實施符合學生自身特點的課程學習方案。(二)以大數據分析人才需求驅動的課程體系改革要考慮市場的行業需求變化、大數據應用中跨學科的特點。素質好的數據分析人員不僅僅要具備專業的數據分析能力,還應該對具體數據中涉及的學科知識有較好的儲備,能將不同行業的專業知識與數據分析緊密關聯起來,實現大數據分析的效用最大化。此外,在充分借鑒國內外大學成功經驗的基礎上,課程設置應該與學生的學術傾向和基礎能力緊密結合,注重基礎課程教育的同時強調文理滲透,同時要兼顧學生的興趣與學習的聯系,在課程體系的設置中需要增設一些多領域、跨學科的選修課程,如經濟學、金融學、保險學、管理學和會計學等。因此,校內跨學科或高校與高校之間聯合培養是實現跨學科課程建設的有效方法之一。(三)科學構建課程體系的主要思路還包括根據大數據時代需求,對專業必修和專業選修課程在課程時間、順序及內容等方面進行改革。專業必修課程重點內容為統計學和計算機科學的交叉部分,在講授統計基礎理論(如多元統計、決策樹、時間序列等)課程基礎上設置大數據案例分析課程,在案例分析過程中讓學生實際操作企業當前應用的大數據計算平臺[6]8-9,從而增強學生大規模分布式計算技能。為提高學生的實際動手和二次開發能力,專業選修課程需更多地開設與數據挖掘及面向數據的編程語言相關的課程,如數據挖掘算法、C++、Java和Python等課程,強化學生的數據挖掘和分析能力。
三、基于協同創新的理念開展實踐教學改革
統計學是一門實質性的社會科學,既研究社會生活的客觀規律,也研究統計方法。統計學繼承和發展基礎統計的理論成果,堅持統計學的社會科學性質,使統計理論研究更接近統計工作實際。隨著社會的不斷發展,統計學的應用越來越廣泛,并不斷發展。
一、 統計學中的幾種統計思想
(一)統計思想的形成
統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。
(二)比較常用的幾種統計思想
所謂統計思想,就是統計實際工作、統計學理論及應用研究中必須遵循的基本理念和指導思想。統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想。現分述如下:
1.均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。
2.變異思想
統計研究同類現象的總體特征,它的前提則是總體各單位的特征存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
3.估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。
4.相關思想
事物是普遍聯系的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。
5.擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現得非常復雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數量上所體現的模式和基于此而預示的可能性”。
6.檢驗思想
統計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特征的假設是否可信。
(三)統計思想的特點
作為一門應用統計學,它從數理統計學派汲取新的營養,并且越來越廣泛的應用數學方法,聯系也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現出:(1)統計思想強調方法性與應用性的統一;(2)統計思想強調科學性與藝術性的統一;(3)統計思想強調客觀性與主觀性的統一;(4)統計思想強調定性分析與定量分析的統一。
二、對統計思想的一些思考
(一)要更正當前存在的一些不正確的思想認識
英國著名生物學家、統計學家高爾頓曾經說過:“統計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯的是,有些人認為只有推斷統計才是科學,描述統計不是科學,并延伸擴大到只有數理統計是科學、社會經濟統計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統計的無知。比利時數學家凱特勒不僅研究概率論,并且注重于把統計學應用于人類事物,試圖把統計學創建成改良社會的一種工具。經濟學和人口統計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
(二)要不斷拓展統計思維方式
統計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數據信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數據信息為依據,歸納得出具有一般特征的結論。歸納推理是要在數據信息的基礎上透過偶然性去發現必然性。演繹推理是對統計認識能力的深化,尤其是在根據必然性去研究和認識偶然性方面,具有很大的作用。
(三)深化對數據分析的認識
任何統計研究都離不開數據分析。因為這是得到統計研究結論的必要環節。雖然統計分析的形式隨時代的推移而變化著,但是“從數據中提取一切信息”或者“歸納和揭示”作為統計分析的目的卻一直沒有改變。對統計數據分析的原因有以下三個方面:一是基于同樣的數據會得出不同、甚至相反的分析結論;二是我們所面對的分析數據有時是缺損的或存在不真實性;三是我們所面對的分析數據有時則又是海量的,讓人無從下手。雖然統計數據分析已經經歷了描述性數據分析(DDA)、推斷性數據分析(IDA)和探索性數據分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數據分析的認識,圍繞“準確解答特定問題并且從數據中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續開展數據分析方法技術的研究。
參考文獻:
[1] 陳福貴.統計思想雛議[J].北京統計,2004.(05) .
[2] 龐有貴.統計工作及統計思想[J].科技情報開發與經濟,2004.(03) .
[3] 范文正.幾種基本統計思想的現實意義[J].統計與決策,2007.(08) .
[4] 邢莉.《九章算術》中的統計學思想探究[J].統計研究,2008.(03).
【論文摘要】所謂統計思想,就是在統計實際工作、統計學理論的應用研究中,必須遵循的基本理念和指導思想。統計思想主要包括均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想等思想。文章通過對統計思想的闡釋,提出關于統計思想認識的三點思考。
1關于統計學
統計學是一門實質性的社會科學,既研究社會生活的客觀規律,也研究統計方法。統計學是繼承和發展基礎統計的理論成果,堅持統計學的社會科學性質,使統計理論研究更接近統計工作實際,在國家和社會得到廣泛發展。
2統計學中的幾種統計思想
2.1統計思想的形成
統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。
2.2比較常用的幾種統計思想
所謂統計思想,就是統計實際工作、統計學理論及應用研究中必須遵循的基本理念和指導思想。統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想。現分述如下:
2.2.1均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。
2.2.2變異思想
統計研究同類現象的總體特征,它的前提則是總體各單位的特征存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。
2.2.4相關思想
事物是普遍聯系的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。
2.2.5擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現得非常復雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數量上所體現的模式和基于此而預示的可能性”。
2.2.6檢驗思想
統計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特征的假設是否可信。
2.3統計思想的特點
作為一門應用統計學,它從數理統計學派汲取新的營養,并且越來越廣泛的應用數學方法,聯系也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現出:(1)統計思想強調方法性與應用性的統一;(2)統計思想強調科學性與藝術性的統一;(3)統計思想強調客觀性與主觀性的統一;(4)統計思想強調定性分析與定量分析的統一。
3對統計思想的一些思考3.1要更正當前存在的一些不正確的思想認識
英國著名生物學家、統計學家高爾頓曾經說過:“統計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯的是,有些人認為只有推斷統計才是科學,描述統計不是科學,并延伸擴大到只有數理統計是科學、社會經濟統計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統計的無知。比利時數學家凱特勒不僅研究概率論,并且注重于把統計學應用于人類事物,試圖把統計學創建成改良社會的一種工具。經濟學和人口統計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
3.2要不斷拓展統計思維方式
統計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數據信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數據信息為依據,歸納得出具有一般特征的結論。歸納推理是要在數據信息的基礎上透過偶然性去發現必然性。演繹推理是對統計認識能力的深化,尤其是在根據必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數據分析的認識
任何統計研究都離不開數據分析。因為這是得到統計研究結論的必要環節。雖然統計分析的形式隨時代的推移而變化著,但是“從數據中提取一切信息”或者“歸納和揭示”作為統計分析的目的卻一直沒有改變。對統計數據分析的原因有以下三個方面:一是基于同樣的數據會得出不同、甚至相反的分析結論;二是我們所面對的分析數據有時是缺損的或存在不真實性;三是我們所面對的分析數據有時則又是海量的,讓人無從下手。雖然統計數據分析已經經歷了描述性數據分析(DDA)、推斷性數據分析(IDA)和探索性數據分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數據分析的認識,圍繞“準確解答特定問題并且從數據中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續開展數據分析方法技術的研究。
新晨
參考文獻:
[1]陳福貴.統計思想雛議[J]北京統計,2004,(05).
計算機的出現本來就是為了解決人們手工計算的無奈。如今的智能手機,小小的身軀就可以超過十年前巨型機的運算能力。
一、關于統計學
統計學是一門實質性的社會科學,既研究社會生活的客觀規律,也研究統計方法。統計學是繼承和發展基礎統計的理論成果,堅持統計學的社會科學性質,使統計理論研究更接近統計工作實際,在國家和社會得到廣泛發展。
二、統計學中的幾種統計思想
2.1統計思想的形成
統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。
2.2比較常用的幾種統計思想
所謂統計思想,就是統計實際工作、統計學理論及應用研究中必須遵循的基本理念和指導思想。統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想。現分述如下:
2.2.1均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。
2.2.2變異思想
統計研究同類現象的總體特征,它的前提則是總體各單位的特征存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。
2.2.4相關思想
事物是普遍聯系的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。
2.2.5擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現得非常復雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數量上所體現的模式和基于此而預示的可能性”。
2.2.6檢驗思想
統計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特征的假設是否可信。
2.3統計思想的特點
作為一門應用統計學,它從數理統計學派汲取新的營養,并且越來越廣泛的應用數學方法,聯系也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現出:(1)統計思想強調方法性與應用性的統一;(2)統計思想強調科學性與藝術性的統一;(3)統計思想強調客觀性與主觀性的統一;(4)統計思想強調定性分析與定量分析的統一。
三、對統計思想的一些思考
3.1要更正當前存在的一些不正確的思想認識
英國著名生物學家、統計學家高爾頓曾經說過:“統計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯的是,有些人認為只有推斷統計才是科學,描述統計不是科學,并延伸擴大到只有數理統計是科學、社會經濟統計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統計的無知。比利時數學家凱特勒不僅研究概率論,并且注重于把統計學應用于人類事物,試圖把統計學創建成改良社會的一種工具。經濟學和人口統計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
3.2要不斷拓展統計思維方式
統計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數據信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數據信息為依據,歸納得出具有一般特征的結論。歸納推理是要在數據信息的基礎上透過偶然性去發現必然性。演繹推理是對統計認識能力的深化,尤其是在根據必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數據分析的認識
任何統計研究都離不開數據分析。因為這是得到統計研究結論的必要環節。雖然統計分析的形式隨時代的推移而變化著,但是“從數據中提取一切信息”或者“歸納和揭示”作為統計分析的目的卻一直沒有改變。對統計數據分析的原因有以下三個方面:一是基于同樣的數據會得出不同、甚至相反的分析結論;二是我們所面對的分析數據有時是缺損的或存在不真實性;三是我們所面對的分析數據有時則又是海量的,讓人無從下手。雖然統計數據分析已經經歷了描述性數據分析(DDA)、推斷性數據分析(IDA)和探索性數據分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數據分析的認識,圍繞“準確解答特定問題并且從數據中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續開展數據分析方法技術的研究。
參考文獻:
[1]陳福貴.統計思想雛議[J]北京統計,2004,(05).
關鍵詞:
大數據;人才培養模式;教學模式
2015年9月5日,我國政府公開《國務院關于印發促進大數據發展行動綱要的通知》,大數據逐步走上我國經濟社會發展的大舞臺,在社會各個領域中發揮著巨大的促進作用。高等教育作為我國培養高素質人才的主要陣地,避免不了受到大數據的沖擊和影響。有效利用大數據是化解沖擊并促進高等教育改革的明智之舉。高等教育改革的關鍵是改革人才培養模式,將大數據融入人才培養模式改革的各個環節會達到事半功倍的效果。
一、大數據引領統計學專業人才培養模式的改革方向
1.大數據引領培養目標的改革方向。隨著大數據的迅猛發展,大數據分析公司不斷涌現,傳統的調查公司、數據分析公司紛紛轉型,社會急需大量的大數據分析人才。統計學專業按以往培養目標培養的數據分析人才已經不能滿足社會需要,因此必須對人才培養目標進行改革,培養目標應從培養專門的統計人才轉換為培養精通統計學知識、計算機技術(大數據分析技術),了解相關行業背景的復合型統計人才,保障統計學專業能夠為社會經濟發展輸送高質量的大數據分析人才。2.大數據引領課程設置的改革方向。課程設置是實現培養目標的關鍵環節,為實現培養大數據分析人才的目標,課程設置應該與培養目標相配套。課程設置的核心課程中應該引入大數據技術相關的計算機軟件、語言及算法課程,選修課程中應該增設一些輔助大數據分析的數據挖掘類相關課程及不同行業的相關專業背景課程。3.大數據引領實踐教學的改革方向。實踐教學環節設計的基本原則是能夠有效檢驗理論教學環節的學習效果,同時鍛煉學生的分析問題,解決問題的能力。因此,相應于培養目標和課程設置的改革,實踐教學環節的改革應注重學生大數據分析能力的檢驗和鍛煉,積極為學生創造豐富的大數據分析實踐機會。例如,在調查分析課程中引導學生改變傳統的調查方法,盡量通過數據挖掘揭示某一類現象背后的發展規律,積極開展與大數據分析公司或者相關行業的企業的合作,為學生進行大數據分析實踐提供數據及技術支持。4.大數據引領教學方法和手段的改革方向。MOOC、翻轉課堂和大量的在線資源的出現為統計學專業教學方法和手段的改革提供了豐富的資源基礎,有效構建充分利用各種資源的混合教學模式將成為統計學專業人才培養模式改革的一個重要組成部分。5.大數據引領評價方法的改革方向。傳統的評價方法主要注重期末時的總結性評價,忽略過程評價,因此應廣泛和合理利用教學各個環節留下的痕跡,即形式各樣的數據,創新教育教學評價方法,以此達到對學生、教師及教學效果的科學評價。
二、大數據融入統計學專業人才培養模式的構建
1.大數據融入人才培養目標的制定。人才培養目標的制定一方面要適應經濟社會發展的需要,另一方面要從生源質量,辦學條件出發,不能盲目追求高目標,因此適當對本校統計學專業歷屆生源質量和辦學軟硬件條件等相關數據進行挖掘和分析,有利于制定切實可行的人才培養目標。當然這需要人才培養目標制定者有一定的數據挖掘和分析的能力,需要學校各個相關部門的配合,實際操作起來存在一定困難。2.大數據融入教學方法和手段的選擇。教學方法和手段的選擇一方面依靠豐富的資源,打破傳統的大客廳式的封閉教學模式,另一方面要注重以學生為本和因材施教,這就需要對每個學生的基本素質有客觀的把握,僅靠教師的力量很難做到這一點,因此應適當引入相關技術和設備幫助收集課堂教學,課后作業等教學各個環節的實時數據,利用大數據技術全方位綜合考量每一位學生的基本素質,為教學方法和手段的選擇提供客觀的依據,真正意義上做到因材施教。對于一些利用計算機或其他電子設備完成的環節,收集數據的同時,應適當建立針對不同學生的教學策略,以此實現個性化教育。3.大數據融入實踐教學環節的設置。統計學專業的實踐環節設置應充分考慮利用學習分析和數據挖掘技術分析學生的學習心理,學習行為及學習能力,充分了解學生的前期學習情況,分析教師課堂教學水平和教學能力,充分挖掘教師的特長,以此為基礎打造實踐教學環節師生的完美匹配,不再拘泥于一個班級或一個專業的學生同時進行相同的實踐項目,可以有效提高實踐教學的水平和學生的實踐能力。4.大數據融入教學評價體系的完善。傳統的教學評價體系不能夠客觀評價人才培養的各個環節的效果,通常是對結果的評價。因此,學校需要利用大數據技術全面分析和挖掘每一個環節的相關數據,包括學生的學習過程,教師的教學過程等,有效利用數據說話,避免對學習效果及教學效果的片面評價,完善統計學專業的教學評價體系。大數據為統計學專業人才培養模式的構建帶來了機遇的同時也提出了挑戰,我們不能盲目跟風,應認真結合統計學專業學科特點及各方面的條件,合理利用大數據,構建切實可行的人才培養模式。
參考文獻:
1關于統計學
統計學是一門實質性的社會科學,既研究社會生活的客觀規律,也研究統計方法。統計學是繼承和發展基礎統計的理論成果,堅持統計學的社會科學性質,使統計理論研究更接近統計工作實際,在國家和社會得到廣泛發展。
2 統計學中的幾種統計思想
2.1 統計思想的形成
統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。
2.2 比較常用的幾種統計思想
所謂統計思想,就是統計實際工作、統計學理論及應用研究中必須遵循的基本理念和指導思想。統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想。現分述如下:
2.2.1 均值思想
均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。
2.2.2 變異思想
統計研究同類現象的總體特征,它的前提則是總體各單位的特征存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
2.2.3 估計思想
估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。
2.2.4 相關思想
事物是普遍聯系的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。
2.2.5 擬合思想
擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現得非常復雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數量上所體現的模式和基于此而預示的可能性”。
2.2.6 檢驗思想
統計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特征的假設是否可信。
2.3 統計思想的特點
作為一門應用統計學,它從數理統計學派汲取新的營養,并且越來越廣泛的應用數學方法,聯系也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現出:(1)統計思想強調方法性與應用性的統一;(2)統計思想強調科學性與藝術性的統一;(3)統計思想強調客觀性與主觀性的統一;(4)統計思想強調定性分析與定量分析的統一。
3 對統計思想的一些思考
3.1 要更正當前存在的一些不正確的思想認識
英國著名生物學家、統計學家高爾頓曾經說過:“統計學具有處理復雜問題的非凡能力,當科學的探索者在前進的過程中荊棘載途時,唯有統計學可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現實問題可能要比想象的復雜得多。此外,有些人認為方法越復雜越科學,在實際的分析研究中,喜歡簡單問題復雜化,似乎這樣才能顯示其科學含量。其實,真正的科學是使復雜的問題簡單化而不是追求復雜化。與此相關聯的是,有些人認為只有推斷統計才是科學,描述統計不是科學,并延伸擴大到只有數理統計是科學、社會經濟統計不是科學這樣的認識。這種認識是極其錯誤的,至少是對社會經濟統計的無知。比利時數學家凱特勒不僅研究概率論,并且注重于把統計學應用于人類事物,試圖把統計學創建成改良社會的一種工具。經濟學和人口統計學中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產。
3.2要不斷拓展統計思維方式
統計學是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數據信息(尤其是不完全甚至劣質的信息)去產生新的知識或去驗證一個假設,即以所掌握的數據信息為依據,歸納得出具有一般特征的結論。歸納推理是要在數據信息的基礎上透過偶然性去發現必然性。演繹推理是對統計認識能力的深化,尤其是在根據必然性去研究和認識偶然性方面,具有很大的作用。
3.3深化對數據分析的認識
任何統計研究都離不開數據分析。因為這是得到統計研究結論的必要環節。雖然統計分析的形式隨時代的推移而變化著,但是“從數據中提取一切信息”或者“歸納和揭示”作為統計分析的目的卻一直沒有改變。對統計數據分析的原因有以下三個方面:一是基于同樣的數據會得出不同、甚至相反的分析結論;二是我們所面對的分析數據有時是缺損的或存在不真實性;三是我們所面對的分析數據有時則又是海量的,讓人無從下手。雖然統計數據分析已經經歷了描述性數據分析(DDA)、推斷性數據分析(IDA)和探索性數據分析(EDA)等階段,分析的方法技術已經有了質的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數據分析的認識,圍繞“準確解答特定問題并且從數據中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續開展數據分析方法技術的研究。
參考文獻
[1] 陳福貴.統計思想雛議[J]北京統計, 2004,(05) .
統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想等。統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。作為一門應用統計學,它從數理統計學派汲取新的營養,并且越來越廣泛的應用數學方法,聯系也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點:(1)統計思想強調方法性與應用性的統一;(2)統計思想強調科學性與藝術性的統一;(3)統計思想強調客觀性與主觀性的統一;(4)統計思想強調定性分析與定量分析的統一。
1.均值思想。均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。
2.變異思想。統計研究同類現象的總體特征,它的前提則是總體各單位的特征存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
3.估計思想。估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。
4.相關思想。事物是普遍聯系的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。
5.擬合思想。擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現得非常復雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數量上所體現的模式和基于此而預示的可能性”。
6.檢驗思想。統計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特征的假設是否可信。
二、對統計思想的若干思考
統計思想主要包括:均值思想、變異思想、估計思想、相關思想、擬合思想、檢驗思想等。統計思想不是天然形成的,需要經歷統計觀念、統計意識、統計理念等階段。統計思想是根據人類社會需求的變化而開展各種統計實踐、統計理論研究與概括,才能逐步形成系統的統計思想。作為一門應用統計學,它從數理統計學派汲取新的營養,并且越來越廣泛的應用數學方法,聯系也越來越密切,但在統計思想的體現上與通用學派相比,還有著自己的特別之處。其基本特點:(1)統計思想強調方法性與應用性的統一;(2)統計思想強調科學性與藝術性的統一;(3)統計思想強調客觀性與主觀性的統一;(4)統計思想強調定性分析與定量分析的統一。
1.均值思想。均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統計學理論,是統計學的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發展趨勢,避免個別偶然現象的干擾,故也體現了總體觀。
2.變異思想。統計研究同類現象的總體特征,它的前提則是總體各單位的特征存在著差異。統計方法就是要認識事物數量方面的差異。統計學反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。
3.估計思想。估計以樣本推測總體,是對同類事物的由此及彼式的認識方法。使用估計方法有一個預設:樣本與總體具有相同的性質。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴謹的必要步驟。
4.相關思想。事物是普遍聯系的,在變化中,經常出現一些事物相隨共變或相隨共現的情況,總體又是由許多個別事務所組成,這些個別事物是相互關聯的,而我們所研究的事物總體又是在同質性的基礎上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關聯的。
5.擬合思想。擬合是對不同類型事物之間關系之表象的抽象。任何一個單一的關系必須依賴其他關系而存在,所有實際事物的關系都表現得非常復雜,這種方法就是對規律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關系的變化過程在數量上所體現的模式和基于此而預示的可能性”。
6.檢驗思想。統計方法總是歸納性的,其結論永遠帶有一定的或然性,基于局部特征和規律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數量特征的假設是否可信。
二、對統計思想的若干思考
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2014)49-0248-02
隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、互聯網應用的豐富,更多的傳感設備、移動終端接入到網絡,由此產生的數據及增長速度將比歷史上的任何時期都要多,都要快。“大數據”時代已經來臨,它對人類的數據駕馭能力提出了新的挑戰,也為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。大數據是指海量數據集,其來源包括動漫數據、企業IT應用帶來的數據、博客、點擊流數據、社交媒體、機器和傳感數據等。它是互聯網、電子商務的又一次重大革命,對數據處理、數據挖掘、數據分析提出了新的挑戰。如今互聯網行業、電子商務行業中的數據應用及分析已經相當普遍,為了應對大數據時代的要求,同時要具備較強的統計學功底和嫻熟的計算機軟件運用能力,而今完全具備這些能力的數據分析專業人才是極其匱乏的。數據分析師便應運而生,不僅互聯網行業、電子商務行業需要大量的數據分析師,近年來項目數據分析事務所不斷涌現,而項目數據分析師因其專業技能及量化的數據分析為客戶以及所在單位控制決策風險、保證利益最大化而備受各界青睞,以待遇優厚和地位尊崇而聞名國際,也被視為我國21世紀的黃金職業。《華商報》將項目數據分析師納入了新七十二行,《HR管理世界》將項目數據分析師評為七大賺錢職業。本文就如何在統計學專業開展數據分析方向進行了闡述,首先論述了數據分析的重要意義,其次討論了數據分析方向的課程構建,最后分析了如何加強理論與實踐環節的結合。
一、數據分析的重要意義
大數據預測美國總統:美國時代周刊報道稱,數據驅動的競選決策才是奧巴馬競選獲勝的關鍵。數據分析團隊在籌集競選經費、鎖定目標選民、督促選民投票等各個環節的決策中都發揮了重要作用。這意味著華盛頓競選專家的作用極具下降,能夠分析大數據的量化分析家和程序員的地位卻大幅提升。如今從事專業數據分析工作的企業如項目數據分析師事務所、數據挖掘公司等都應市場需求而大力發展,并且受到風險投資的青睞。如美國社交數據挖掘公司Datasift于2012年宣布,獲得1500萬美元風險投資。2013年,DataSift成為Twitter的“認證合作伙伴”,主要負責海量微博社交數據分析。這是該公司今年第二筆融資,五月份其曾融資720萬美元。又如面向開發者的大數據應用軟件平臺服務提供商Continuity最近獲得1000萬美元的融資,目前融資總額已經達到1250萬美元。
數據分析的應用無處不在,那什么是數據分析呢?數據分析就是用適當的統計方法對數據進行分析,以求最大化地開發數據的功能,發揮數據的作用。是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。數據分析技術不僅能通過對真實數據的分析去發現問題,還能夠通過經濟學原理建立數學模型,對投資或其他決策是否可行進行分析,預測未來的收益及風險情況,為做出科學合理的決策提供依據。在提高工作效率的基礎上,也增強企業管理的科學性。無論是在國家政府部門,還是企事業單位中,數據分析工作都是進行決策和做出工作決定之前至關重要的一個環節。因此,針對項目可行性、風險承載力、投資回報率以及相關經濟效益指標等方面的分析工作顯得格外重要。在這個工作過程中,專業的數據分析人員扮演著無比重要的角色,數據分析成果的質量高低直接決定著項目投資、企業經營決策計劃最終的方向。所以,各個行業對數據分析人員的需求之多是不言而喻的。傳統行業,如政府機構:一類是計委、經委、統計局等一些經濟綜合管理部門所設有的調研處、研究室和情報所。第二類是商業、糧食、物資、銀行等經濟主管業務部門會設有信息中心或調研室,從本系統、本部門的業務出發進行專業性調研,提供支持本部門的市場信息。而伴隨著數據分析應用的擴大,其在新興行業中也得到了發展,如計算機軟硬件及IT行業、電子商務與網絡游戲、金融保險、消費品、咨詢業與廣告媒體、大型設備與重工業以及房地產行業等對數據分析師的需求量很大,尤其是電子商務,由于利用互聯網,能夠比傳統零售業具有更好的數據收集和管理能力,能積累海量的數據,因此更看重從海量數據中挖掘出用戶偏好和市場機會。研究機構:比如市場研究公司、咨詢公司、證券公司、研究院。自主創業:取得注冊項目數據分析師(CPDA)資格證可以自主創建或就業于項目數據分析師事務所等。所以,數據分析的行業應用是極其廣泛的,并且隨著大數據時代的到來,數據分析尤其是數據挖掘將借助互聯網的發展,逐步形成人們依靠的重點,并可能成為未來發展與競爭的重點之一。由此我們可以看到數據分析師的就業前景是非常廣泛而樂觀的,無論是數學專業、統計專業,還是計算機專業的學生,都可以通過系統的學習數據分析課程來適應對數據分析人才的要求。
二、課程體系構建
1.主干課程。主干課程包含高代、數分、概率論、數理統計、多元統計分析、時間序列分析、市場調查與分析、統計預測與決策、數據結構、C語言、數據分析、數據挖掘、大數據分析與展示。理論課程的學習可以使學生了解數據分析的基本內容,學會如何對已獲取的數據進行加工處理,如何對實際問題進行定量分析,以及如何解釋分析的結果。掌握幾種常用數據分析方法的統計思想及基本步驟,并具備一定的分析論證能力。
2.實驗課程。數據分析的操作離不開計算機。目前數據分析行業常用的一些統計軟件有SAS、SPSS和R軟件。SAS軟件是一個模塊化、集成化的大型應用統計系統。它的功能包括數據訪問、數據儲存及管理、應用開發、圖形處理、數據分析、報告編制、運籌學方法、計量經濟學與預測等。SPSS軟件是一個社會科學統計軟件包,是采用圖形菜單驅動界面的統計軟件,SPSS的基本功能包括數據管理、統計分析、圖表分析、輸出管理等。R軟件是一套完整的數據處理、計算和制圖軟件系統,包括:數據存儲和處理系統、完整連貫的統計分析工具、優秀的統計制圖功能、可操縱數據的輸入和輸入等功能。這三個軟件在數據分析中針對不同行業的需求有不同方向的應用。
3.專業課程。從數據分析的行業需求出發,好的數據分析人員不僅要有較強的數據分析能力,還要有該行業的背景及相關知識的儲備,這樣才能將數據分析與行業特性聯系起來,發揮數據分析的最大功能,即所謂的“因地制宜”。同時要兼顧學生的興趣與學習的聯系,需提供多領域的課程選擇,如:經濟學、金融學、保險學、管理學、會計學等。而在軟件學習方面也要拓寬渠道,除了實驗課程安排學習的軟件,學生可根據自身發展意向再多掌握一些軟件如:SQL數據庫,熟悉office常用功能,尤其熟練運用Word和PowerPoint、Excel圖表及數據分析等。同時還應該結合對數據分析師的要求設置一些相關課程:投資數據分析、市場調研與預測、預測技術分析、現金流量表編制、風險投資項目篩選、不確定性分析、編制數據分析報告等。
三、實踐環節
培養數據分析的專業型人才目的就是為了學以致用。數據分析本身就是為了從數據中發現問題、建立模型、預測收益風險企業決策進而做出合理正確的決策判斷。因此,學習了基本的知識和技能就要運用到實際操作中。學校可以和本地的數據分析事務所,或者大量需求數據分析人員的互聯網行業建立實訓基地,進行合作式教學,使得學生在實習的過程中能夠理論聯系實際,切身體會數據分析的商業操作體系,這樣就能夠促進學生有目的、有取舍地針對自身情況學習鉆研,繼而就能夠培養出適應經濟發展,滿足市場需求的應用型人才。
四、結語
在大數據時代到來之時,數據分析在互聯網中的應用將會空前廣泛,與此同時對數據分析師的需求也將會井噴,無論是在軍事、工業、企業還是在政治上,大數據分析都將會十分緊缺。因此,目前對數據分析師的培養刻不容緩。本文從分析數據分析行業發展及其重要意義、數據分析專業課程設置以及教學實踐環節方面對構建數據分析課程體系進行了探討。不僅從教學課程的內容上予以安排,而且更加注重引導學生自主學習,特別強調理論結合實踐的合作式教學。希望能夠結合行業需求合理地構建課程,培養出專門從事數據分析的項目數據分析師,從而能夠滿足市場需求和自身發展。
參考文獻:
[1]范金城.數據分析[M].科學出版社,2010.