時間:2021年08月18日 分類:文學論文 次數:
摘要:在高校人文社科效率影響因素研究中提出回歸盲點概念,提出采用BP人工神經網絡進行學習,將其結果權重作為影響因素影響大小的思路,并采用偏最小二乘法和嶺回歸進行穩健性檢驗,同時基于教育部高校人文社科省際面板數據,首先測度出SBM超效率,然后分析其影響因素。結果發現:近年來高校人文社科效率總體呈下降趨勢,地區差距不大;學術論文是人文社科效率的最重要影響因素;研發人員對效率影響超過研發經費;學術著作和研究報告對人文社科效率影響較小;出現回歸盲點時應采用BP人工神經網絡分析效率影響因素。本文還對采用BP人工神經網絡解決回歸盲點問題的適用條件進行了討論。
關鍵詞:回歸盲點人文社科BP神經網絡偏最小二乘法嶺回歸
引言人文社會科學是人類的精神家園,高等院校是人文社科的重要載體。在人類社會發展進程中,人文社科發揮著價值導向和文化建設功能,推動人類社會進步。從人類個體角度,人文社科具有關懷人生,塑造健全人格的作用,能夠啟迪心智、滋潤心靈、解放思想、提升精神境界。目前從事人文社科研究的機構包括高等院校、科研院所以及少數民間機構。高等院校是重要的國家戰略資源之一,是經濟增長方式轉變的關鍵力量[1]。雖然國家和地方人文社科科研院所較多,但這些科研院所主要側重人文社科的應用研究,其規模和研究人數也遠遠小于高等院校,廣大高校無疑是人文社科理論研究與應用研究的主要力量。
提高人文社科的研究效率非常重要。人文社科效率本質上就是產出投入比,即如何利用有限的投入取得最大產出。人文社科研究屬于公共物品,在絕大多數情況下,人文社科研究難以取得經濟回報,更多是服務社會,服務政府,絕對以社會效益為主。人文社科研究的資源和經費投入主要依賴政府,同樣屬于公共資源。在這樣的背景下,如何合理分配有限的人文社科資源,提高研究效率至關重要。通過科學的方法,找到人文社科效率的關鍵影響因素,對于人文社科效率提升無疑具有重要意義。
在人文社科效率的影響因素研究中存在“回歸盲點”問題。回歸盲點是本文所提出來的新的概念,所謂回歸盲點,就是在多元回歸中,如果一些公認關鍵變量的回歸系數沒有通過統計檢驗,或者即使通過統計檢驗,但該變量符號與人們的常識相反,在這樣的情況下,得出的結論是這些變量的績效較低,但不可能沒有作用,必須對其貢獻進行估計,但傳統基于回歸的方法已經不能解決這個問題,這就是回歸盲點。根據伍德里奇[2]的觀點,某關鍵變量即使績效較低,但也發揮了作用。
目前關于人文社科效率的影響因素研究,幾乎全部采用的是多元回歸法,因此同樣面臨回歸盲點問題。在回歸盲點下研究高校人文社科效率的影響因素具有重要意義。第一,它有利于對人文社科效率的影響因素進行全面分析,并且客觀評價所有影響因素的影響大小,從而找到關鍵問題,為進一步提高人文社科效率提供解決思路。第二,從方法論角度,首次提出研究盲點問題,探索通過人工神經網絡來解決這個問題,并進行穩健性檢驗,在研究方法上有所創新。
1文獻綜述
關于高校效率的研究國際上已經有不少成果,其中許多是以人文社科作為研究對象。Worthington等[3]采用經典CCR和BCC效率模型對澳大利亞高校教育、科研、競爭力等整體效率進行了評價。Athanassopoulos等[4]將英國45所高校分成自然科學為主、自然科學與人文社科兼顧、人文社科為主3個類型,并采用DEA效率分析進行測度。Johnes等[5]運用DEA對中國109所高校2003年、2004年的效率進行評價,發現綜合性高校的效率更高,且沿海地區高校的研究效率高于西部地區。
Chu等[6]研究發現,1993~1995年間內地高校的科研效率總體有所改善,東部地區要比中西部地區更高效。Colbert等[7]研究了美國頂尖MBA項目的效率,取得了較好的評價效果。Johnes[8]以畢業生等級作為教學質量,分析英國100所高校的辦學效率。國內學者關于人文社科效率的相關研究成果也比較豐富,主要研究集中在高校研發效率。
陸根書、劉蕾[9]運用DEA方法對2000~2003年教育部直屬68所高校人文社會科學研究效率進行評價,發現人文社科研究效率逐年遞增趨勢,總體水平還有待提高。姜彤彤[10]對我國除西藏外30個省份高校2001~2011年人文社科效率及其區域差異情況進行評價分析,發現各省技術效率、純技術效率和規模效率平均值較高,但隨著時間的推移有下降趨勢,不同省份效率差異巨大。袁衛、李沐雨等[11]基于變換參考集DEA排序方法,引入ESI指標,區分人文社科和自然科學科研產出,分析了教育部直屬的72所高校辦學效率。王甲旬、邱均平[12]研究發現,中國高校人文社科研究的整體技術效率處于中等偏上水平,且受到純技術效率的影響較大,即科研管理對科研效率的影響較大。
祝夢、孟溦等[13]針對不同學科之間差異和不可比性等問題,構建多層次分類RD-DEA模型,并對教育部直屬高校科研效率進行分析,結果更加客觀。還有一些學者以少數高;蚋咝炔坎煌瑱C構為研究對象研究人文社科效率。陳俊生、周平等[14]以兩所高校15個人文社科學院為研究對象,構建二次相對效率和超效率模型,發現技術效率和管理效率無明顯線性關系。賈永堂、董潔[15]對某大學的研究發現,其人文社科的全要素生產率處于穩步提升之中,學術研究效率高于自然科學。胡公啟[16]基于DEA-Malmquist指數方法測度江蘇省文科第一批次高校人文社科研究效率,發現技術進步是制約效率提高的核心因素,全要素生產率指數有所增長,但幅度不高。
關于創新效率的影響因素,一些學者從宏觀區域角度展開研究。Fritsch等[17]研究發現,專業化水平、知識轉移程度、研發投入對區域創新效率的影響顯著。王軍[18]實證研究發現,東部地區創新效率與市場化程度、對外開放程度、高等教育程度、基礎設施水平正相關,與金融深度負相關,中西部地區與高等教育程度、基礎設施水平負相關。趙清軍、車鑫等[19]對省際創新效率的研究發現,技術進步是關鍵性因素,人力資本影響顯著。楊玉楨、楊銘[20]研究基礎研究效率,發現人口密度、貿易開放度與其正相關,財政支出結構與其負相關,社會信息化水平影響程度不大。
劉永松、王婉楠等[21、22]則研究了國家創新效率、高技術企業創新效率及影響因素。還有一些學者以高校作為研究對象研究效率的影響因素,Agasisti等[23]、Munoz[24]基于隨機前沿DEA模型研究發現,政府公共政策指數是高校創新效率的影響因素。蔡翔、趙娟[25]研究了大學協同創新效率的影響因素,發現研發人力資本作用遠大于研發物質資本。鄧理、岳振興等[26]研究認為,地區經濟社會水平是影響高?蒲行实闹匾獠恳蛩,科學合理的體制機制是高校科研效率的內部影響因素。
王曉珍、蔣子浩[27]研究認為,經濟優勢、區位優勢、政府扶持力度、基礎設施狀況對高校創新效率具有較顯著影響。李瑛、任珺楠[28]基于110所原211高校人文社科數據,運用DEA-Malmquist指數進行分析,發現這些高校的效率整體呈下降趨勢,主要原因是技術退步,并且區域之間差異不大。從現有研究看,關于高校人文社科效率的研究成果比較豐富,涉及學科評價、專業評價、項目評價、學校評價、地區評價等。關于創新效率的影響因素,研究成果也比較豐富,涉及的因素包括技術進步、公共政策、經濟發展水平、基礎設施、物質資本、人力資本、企業規模、人口密度、對外開放度等。關于人文社科效率的影響因素,也有不少研究,涉及的影響因素包括公共政策、經濟水平、研發經費、人力資源、基礎設施、技術進步等。
總體上,在以下幾個方面有待深入研究:第一,效率本質上就是產出投入比,因此效率的影響因素可以分為兩類:第一類是投入產出變量,這是效率的當然影響因素,不可能不發揮作用;第二類才是其他影響因素,F有的研究集中在第二類影響因素,對第一類影響因素或者稱為決定因素的研究較少,有必要加強研究。第二,由于存在回歸盲點,很多對人文社科效率具有重要影響的變量被忽視了,被簡單判定為不相關,或者出現回歸符號錯誤,迫切需要進一步研究。本文基于教育部高校人文社會科學信息網上的省際高校數據,在對回歸盲點及其產生原因分析的基礎上,提出采用BP人工神經網絡來分析效率影響因素的新思路,并結合采用偏最小二乘法、嶺回歸來進行穩健性檢驗,最后得出研究結論并對BP人工神經網絡的適用條件進行討論。
2理論分析與研究方法
2.1人文社科投入產出效率模型——SBM超效率模型本文重點研究人文社科效率的影響因素,測度人文社科科研效率是其前提。為了提高效率影響因素研究的區分度,本文采用SBM超效率模型進行測度。超效率SBM模型是一種基于要素冗余的非徑向非角度相對效率測算方法,能夠很好地處理投入要素的松弛問題,并且能夠較好地處理非期望產出,并得到超效率值[29]。
2.2效率影響因素回歸盲點產生原因第一是多重共線性。所謂多重共線性,就是由于自變量之間相關導致的回歸系數統計檢驗不顯著現象。比如人文社科研究中,研發經費投入與研發人員投入是相關的,當這種相關度較高時就會產生多重共線性。一般在統計檢驗中,用方差膨脹系數VIF可以進行共線性診斷,當VIF>10時,就可以判定存在多重共線性現象。對于多重共線性的解決,除了增加樣本數量、采用面板數據、變換函數形式外,還可以采用嶺回歸或偏最小二乘法進行回歸,以最大限度降低多重共線性的影響,從而降低回歸盲點問題。
第二是非線性關系。在回歸分析中,自變量與因變量之間的關系一般是取對數后進行線性分析,但是自變量與因變量之間的關系可能比較復雜,有時在回歸中,可以適當引入自變量的2次項進行優化,但因為一般很難知道兩者非線性關系的函數形式,所以單靠回歸分析很難解決回歸盲點問題。
第三是回歸數據自身的問題。比如在人文社科效率的影響因素分析中,如果效率采用的是普通效率,其極大值為1,這樣就會導致許多效率為1的決策單元效率相等,在回歸分析中就沒有區分度,從而導致影響因素分析失效,出現回歸盲點問題。解決的方法之一就是采取超效率分析,由于超效率是大于1的,這樣就提高了效率的區分度,一定程度上緩解了回歸盲點問題。
2.3偽回歸盲點問題
回歸盲點的界定是比較嚴格的,就是自變量與因變量一定要相關,必須有經濟理論支持。比如人文社科的投入產出分析,根據知識生產函數,研發經費和研發勞動力無疑對人文社科成果具有重要的支撐作用,如果研發經費或研發勞動力出現回歸盲點,這是可以肯定的。再比如人文社科效率的影響因素分析,由于投入產出變量決定了人文社科效率,因此人文社科任何一個投入或產出變量出現回歸盲點問題,也是可以肯定的。但對于投入產出變量以外的變量,如經濟發展水平、公共政策、地域因素等,一旦出現回歸系數沒有通過統計檢驗,或即使通過統計檢驗但符號錯誤,是不能簡單認定為回歸盲點的,需要根據經濟理論進行全面細致的分析,因為有些變量可能本來就不相關。
2.4人文社科效率的影響因素分析
虛線框中的內容為人文社科投入產出系統,投入變量為研發經費和研發勞動力,產出變量包括學術論文、學術著作和研究報告。根據投入產出變量可以測度出人文社科效率,在此基礎上可以進一步分析效率的影響因素。需要注意的是,效率影響因素包括兩大類。一類是投入產出系統內的影響因素,具體包括研發經費、研發人員、學術論文、學術著作和研究報告。通常情況下,投入變量的回歸系數應該為負數,產出變量的回歸系數應該為正數。
這是因為根據效率的定義,投入越小,效率越高,產出越大,效率越高。這些變量在回歸中一旦出現不相關,或者雖然通過統計檢驗但符號錯誤,就是回歸盲點問題,需要加以解決。另一類效率的影響因素是投入產出系統外的影響因素,如果在回歸中發現這些變量沒有通過統計檢驗,或者雖然通過統計檢驗但符號錯誤,此時是不能簡單認定為回歸盲點問題,要根據經濟理論進行綜合判斷。比如政府科技政策,即使沒有通過統計檢驗,也應該認定為回歸盲點問題,將其納入到后續的進一步分析,因為政府科技政策同樣屬于人文社科投入。但如果經濟發展水平沒有通過統計檢驗,由于這是系統外變量,那就不是回歸盲點變量。
2.5基于BP神經網絡的效率影響因素分析
BP人工神經網絡為人文社科效率的影響因素提供了一種新的分析手段,假如將人文社科投入產出作為一個黑箱,效率是其產出之一,人文社科的所有投入產出變量均可視為效率的投入。通過建立BP人工神經網絡模型并進行訓練,這樣就得到了效率的影響因素模型,同時得到各投入產出變量的權重,它的大小就反映了人文社科效率影響因素的大小。
采用BP神經網絡分析人文社科效率的影響因素有以下優點:
第一,由于BP人工神經網絡的權重是大于0的,因此就有效解決了回歸盲點問題。無論是投入產出研究還是影響因素研究,只要人工神經網絡學習效果較好,那么所有投入變量或影響因素的權重之和為100%,但任何一個變量的權重均大于0,這是該變量對因變量作用的體現。而回歸分析如果回歸系數沒有通過統計檢驗,或者通過統計檢驗回歸系數為負數,前者說明該變量沒有作用,后者說明該變量具有負面作用,這和客觀事實是不吻合的。實際情況是該變量盡管績效不高,但應該有一定的貢獻,BP人工神經網絡就解決了這個問題,貢獻就是該變量的權重。
第二,BP人工神經網絡的最大優點是能夠模擬投入產出變量之間復雜的非線性關系,而人文社科效率的影響因素就是典型的非線性關系,人文社科效率是根據投入產出變量采用線性規劃計算出來的,再研究其與投入產出變量的關系本身就是個復雜的非線性過程。
2.6穩健性檢驗
對于BP人工神經網絡的效率影響因素分析結果,需要進行進一步的穩健性檢驗。通常情況下,產出變量往往只有1個,而投入變量可以有多個,因此可以采用嶺回歸和偏最小二乘法來進行穩健性檢驗,因為這兩種回歸方法較好地克服了多重共線性問題。
3研究數據與實證結果
3.1數據來源
本文所有數據均來自于教育部“中國人文社會科學信息網”,數據選取省際人文社科投入產出數據。研發經費選取內部支出,研發勞動力選取研發人員數,另外一個可采用的數據為研發人員折合全時當量,考慮到人文社科研究的特點,選取研發人員指標更好一些。學術論文和學術著作均為原始統計數據,研究報告采用已采納的研究報告數,這更能體現研究高質量研究報告的水平。
需要說明的是,部分省市的研究報告數據為0,在回歸分析中不能取對數,因此采用全部加1的方式進行了必要的處理。此外在分析效率影響因素時,投入越多意味著浪費越多,對效率是會產生反向影響的,期望回歸系數為負數。為了避免這個問題,借鑒Scheel[31]將負產出的絕對值看作投入,而將負投入的絕對值看作產出的做法,采用另外一種思路處理投入變量,采用極大值減去原始數據再加上1的方法進行了變量正向處理,這樣方便進行后續的實證分析。
3.2效率分析結果
最近10年來人文社科效率平均值為0.713,屬于中等偏高水平,但總體上是在降低,近年來趨于穩定。主要原因是人文社科投入增加較快,而產出增速偏低。2009年高校人文社科研發經費內部支出為54.63億元,2018年達到190.54億元,平均年增長14.89%。從研發人員看,也處于穩步增長狀態,從2009年425939人增加到2018年764235人,平均每年增長6.7%。從產出看,2009年高校人文社科的論文、學術著作分別為312807篇、27021部,2018年分別為363712篇、30109部,增速分別為1.69%和1.21%,遠低于投入增長。
3.3面板數據效率影響因素分析
首先基于傳統的面板數據模型,采用公式(2)估計高校人文社科效率的影響因素,首先進行共線性診斷,發現學術論文方差膨脹因子VIF為11.336,存在多重共線性問題,其他變量中,學術著作的方差膨脹因子VIF為9.457,也接近10的閾值。對于面板數據,首先采用隨機效應模型進行估計,然后再進行Hausman檢驗,Hausman檢驗值為10.207,p值為0.070,不能拒絕原假設,應采用固定效應模型進行估計。
從回歸結果看,研究報告回歸系數為-0.016,沒有通過統計檢驗,說明其存在回歸盲點問題,因為研究報告是人文社科應用研究最典型的體現,是人文社科研究重要的產出之一,它和效率不相關只是統計學上的不相關,并不是理論上和實際上不相關。
人文社科論文范例:人文社科博士畢業生就業能力供需匹配分析
4研究結論
(1)近年來高校人文社科效率總體呈下降趨勢,地區差距不大研究發現,2009-~2018年期間,中國高校人文社科效率平均值為0.715,總體上處于中等偏上水平。從增長趨勢看,高校人文社科效率總體上處于下降態勢,主要原因是研發經費和研發人員增長相對較快,而科研成果除了研究報告增長較快外,學術論文和學術著作增長緩慢。從地區差距看,不同地區效率分布差距不大,效率較高地區既有東部經濟發達地區,也有中西部經濟欠發達地區。
(2)學術論文是人文社科效率的最重要影響因素人文社科研究有其自身的特點,學術論文在人文社科研究中占據十分重要的地位。人文社科學術論文中,大多數屬于基礎研究,少數屬于應用研究,同時受學科領域的影響。學術著作是系統化的學術研究,既包括基礎研究,也包括應用研究,以基礎研究為主。研究報告是典型的人文社科應用研究,隨著國家對智庫研究的重視,近年來研究報告增速較快。對于人文社科效率而言,提高效率的方式無非兩大類,一是降低投入,二是增加產出。從產出對效率影響的角度,學術論文是最重要的。本文基于BP人工神經網絡的研究表明,學術論文對效率影響的權重最大,這和客觀事實及經驗是相符的。
(3)研發人員對效率影響超過研發經費從投入角度分析人文社科效率的影響因素,BP人工神經網絡的研究結果表明,研發人員的權重為34.28%,研發經費的權重為20.37%,研發人員對效率的影響要明顯大于研發經費。這是因為,人文社科更強調人文精神、學者特質、學術積累、研究偏好等因素,而這些因素往往與研發人員個體相關,與研發經費相關不大。此外不同人文社科學科、不同研究領域對研發經費的需求具有很大的異質性。人文社科研究中研發人員對效率的影響更大,這是由人文社科學科特點所決定的。
(4)學術著作和研究報告對人文社科效率影響較小基于BP人工神經網絡的研究發現,學術著作和研究報告對人文社科效率影響的權重均低于4%,影響較小。其主要原因是,學術著作所體現的學術思想許多已經通過學術論文發表,盡管學術著作比較系統,但其中的許多精華已經得到體現,這樣其相對重要性就會下降。人文社科研究目前主要以基礎研究為主,應用研究盡管增長較快,但所占的比重還不大,因此對效率影響不大。
(5)出現回歸盲點時應采用BP人工神經網絡分析效率影響因素本文首次提出回歸盲點問題,即確定影響因素作用大小傳統回歸分析難以深入問題,其產生的原因主要包括多重共線性、非線性關系以及數據自身問題。在這樣的情況下,采用BP人工神經網絡進行進一步分析就是一種有效手段,該方法的穩健性通過偏最小二乘法或嶺回歸得到了進一步的驗證,是一種有效的解決手段。
參考文獻
[1]Kong-raeLee,JinChen,JizhenLi,etal.Betterinnovation,BetterFuture:WorkingTogetherforInnovatingAsia[J].AsianJournalofTechnologyInnovation,2017,25(1):1-4.
[2]J.M.伍德里奇.計量經濟學導論:現代觀點[M].中國人民大學出版社,2003.
[3]WorthingtonAC,LeeBL.Efficiency,technologyandProductivityChangeinAustralianUniversities1998-2003[J].EconomicsofEducationReview,2008,27(3):285-298..
[4]AthanassopoulosAD,ShaleE.AssessingtheComparativeEfficiencyofHigherEducationInstitutionsintheUKbytheMeansofDataEnvelopmentAnalysis[J].EducationEconomics,1997,5(02):117-134.
[5]JohnesJ,LiYU.MeasuringtheResearchPerformanceofChineseHigherEducationInstitutionsUsingDataEnvelopmentAnalysis[J].ChinaEconomicReview,2008,19(4):679-696.
作者:俞立平