亚洲女同精品中文字幕-亚洲女同japan-亚洲女人网-亚洲女人天堂a在线播放-极品小帅哥连坏挨cao记-极品销魂一区二区三区

學(xué)術(shù)咨詢

讓期刊論文更省時(shí)、省事、省心

生物醫(yī)學(xué)領(lǐng)域科學(xué)數(shù)據(jù)集復(fù)用特征研究

時(shí)間:2021年04月29日 分類:農(nóng)業(yè)論文 次數(shù):

摘要:[目的/意義]隨著數(shù)據(jù)技術(shù)的進(jìn)步,圍繞科學(xué)數(shù)據(jù)集進(jìn)行的管理和研究工作均受到廣泛關(guān)注。科學(xué)數(shù)據(jù)集復(fù)用可以使科學(xué)數(shù)據(jù)資源得到有效地開(kāi)發(fā)和利用,實(shí)現(xiàn)科學(xué)數(shù)據(jù)集價(jià)值最大化。本文著眼于科研人員數(shù)據(jù)集復(fù)用行為,探索其特征和偏好,以期為科研人員復(fù)用數(shù)

  摘要:[目的/意義]隨著數(shù)據(jù)技術(shù)的進(jìn)步,圍繞科學(xué)數(shù)據(jù)集進(jìn)行的管理和研究工作均受到廣泛關(guān)注。科學(xué)數(shù)據(jù)集復(fù)用可以使科學(xué)數(shù)據(jù)資源得到有效地開(kāi)發(fā)和利用,實(shí)現(xiàn)科學(xué)數(shù)據(jù)集價(jià)值最大化。本文著眼于科研人員數(shù)據(jù)集復(fù)用行為,探索其特征和偏好,以期為科研人員復(fù)用數(shù)據(jù)集、科研機(jī)構(gòu)進(jìn)行科學(xué)數(shù)據(jù)管理和數(shù)據(jù)服務(wù)提供參考。[方法/過(guò)程]文章運(yùn)用文獻(xiàn)計(jì)量方法從多個(gè)維度統(tǒng)計(jì)分析PubMedCentral的OpenAccess文獻(xiàn)中科學(xué)數(shù)據(jù)集復(fù)用行為的特征規(guī)律,并對(duì)高頻復(fù)用的科學(xué)數(shù)據(jù)集和文獻(xiàn)的被引情況進(jìn)行解析。[結(jié)果/結(jié)論]研究結(jié)果表明:生物醫(yī)學(xué)領(lǐng)域科研人員數(shù)據(jù)集復(fù)用現(xiàn)象較為普遍;相對(duì)于沒(méi)有數(shù)據(jù)集復(fù)用的文獻(xiàn),有數(shù)據(jù)集復(fù)用的文獻(xiàn)被引量更高;數(shù)據(jù)集的復(fù)用頻率和論文影響力之間存在顯著的正向相關(guān)關(guān)系,說(shuō)明復(fù)用已廣泛使用的科學(xué)數(shù)據(jù)集除了能夠減輕其數(shù)據(jù)獲取的負(fù)擔(dān),還能夠在一定程度上擴(kuò)大研究成果的影響力。此外,共享科學(xué)數(shù)據(jù)集也可以為數(shù)據(jù)集提供者帶來(lái)相應(yīng)的引文和學(xué)術(shù)聲譽(yù)收益。

  關(guān)鍵詞:數(shù)據(jù)復(fù)用;科學(xué)數(shù)據(jù)集;生物醫(yī)學(xué);文獻(xiàn)計(jì)量;信息抽取

生物醫(yī)學(xué)

  2009年微軟曾在《Science:科學(xué)研究的第四種范式》論文集中提出,在諸多學(xué)科中,科學(xué)研究范式已經(jīng)由基于假設(shè)的研究(實(shí)驗(yàn)、理論、仿真)向基于探索的研究——數(shù)據(jù)密集型計(jì)算(ataIntensive)進(jìn)行演變[1]。在此之后,通過(guò)探索和挖掘數(shù)據(jù)以獲取所需信息逐漸成為科學(xué)研究的趨勢(shì)。

  生物方向評(píng)職知識(shí):生物醫(yī)學(xué)工程研究是什么期刊

  越來(lái)越多的科研人員開(kāi)始意識(shí)到研究數(shù)據(jù)能夠?yàn)楹笃诘目蒲泄ぷ魈峁┰假Y料,而且成為科研活動(dòng)的重要產(chǎn)出之一。作為科學(xué)文獻(xiàn)中使用的數(shù)據(jù)集合,科學(xué)數(shù)據(jù)集是當(dāng)今時(shí)代學(xué)術(shù)資源開(kāi)放存取的重要組成部分,也是數(shù)據(jù)公開(kāi)共享的重要內(nèi)容。合理利用開(kāi)放的科學(xué)數(shù)據(jù)集將會(huì)為個(gè)人和社會(huì)帶來(lái)巨大的效益和回報(bào),包括數(shù)據(jù)重復(fù)搜集過(guò)程的減少、科研效率的提高以及科研產(chǎn)出的增加[2]。

  工程學(xué)[3]、社會(huì)科學(xué)[47]、健康科學(xué)[8]、生物學(xué)[9]等領(lǐng)域科研人員的科學(xué)數(shù)據(jù)集復(fù)用實(shí)踐均有較為長(zhǎng)遠(yuǎn)的歷史,關(guān)于科研人員數(shù)據(jù)集復(fù)用行為的研究成果日益豐富。近年來(lái),相關(guān)學(xué)者主要從以下視角對(duì)科學(xué)數(shù)據(jù)的復(fù)用展開(kāi)研究。①數(shù)據(jù)復(fù)用的影響因素。文靜等[10]、李佳潞[11]和魏銀珍等[12]對(duì)不同研究領(lǐng)域的科研人員數(shù)據(jù)復(fù)用意愿的影響因素進(jìn)行了探究。Kim等[13]結(jié)合制度理論和計(jì)劃行為理論制定了一個(gè)綜合的理論框架,探索了影響科學(xué)家數(shù)據(jù)復(fù)用行為的因素。

  Yoon等[14]從復(fù)用者的角度出發(fā),采用定量方法探討了數(shù)據(jù)復(fù)用中的正向影響因素。②數(shù)據(jù)復(fù)用的使用意愿和感受。Renata等[15]結(jié)合理性行為理論,使用DataONE的全球科學(xué)家調(diào)查報(bào)告,從科學(xué)家自我評(píng)估的角度研究其復(fù)用數(shù)據(jù)的信念、態(tài)度與復(fù)用行為之間的關(guān)系。Fanie等[16]利用信息系統(tǒng)和信息科學(xué)領(lǐng)域的文獻(xiàn)構(gòu)建了一個(gè)模型來(lái)探討數(shù)據(jù)質(zhì)量和數(shù)據(jù)復(fù)用者滿意度之間的關(guān)系。③數(shù)據(jù)復(fù)用的政策研究。孫浩和陳美[17]從政策法規(guī)的角度調(diào)查了荷蘭政府開(kāi)放數(shù)據(jù)的政策支持和法律保障,為我國(guó)政府開(kāi)放數(shù)據(jù)提供參考。鄧靈斌[18]運(yùn)用文獻(xiàn)調(diào)研和綜合分析等方法,闡述《數(shù)據(jù)安全法(草案)》的制訂歷程、主要內(nèi)容、亮點(diǎn)與特色以及有待完善之處,并對(duì)我國(guó)圖書(shū)情報(bào)界提出對(duì)策和建議。④數(shù)據(jù)復(fù)用的標(biāo)準(zhǔn)制定。

  《醫(yī)學(xué)圖書(shū)館協(xié)會(huì)雜志》(JapanMedicalLibraryAssociation,JMLA)制定并從2019年10月日起開(kāi)始實(shí)施了一項(xiàng)數(shù)據(jù)共享政策,該政策有利于提高已發(fā)表研究的嚴(yán)謹(jǐn)性和可重復(fù)性,實(shí)現(xiàn)數(shù)據(jù)復(fù)用并促進(jìn)開(kāi)放科學(xué)[19]。RoaMartinez等[20]提出一種基于數(shù)據(jù)集元數(shù)據(jù)的元素定義通用結(jié)構(gòu),為各種角色的專家學(xué)者識(shí)別、共享和評(píng)估數(shù)據(jù)復(fù)用提供服務(wù)。Abella[21]結(jié)合BernersLee的星級(jí)模型和其他因素評(píng)估了巴塞羅那開(kāi)放數(shù)據(jù)門戶網(wǎng)站上數(shù)據(jù)集的質(zhì)量。圖書(shū)情報(bào)機(jī)構(gòu)也制定了一系列標(biāo)準(zhǔn)和方案,如數(shù)據(jù)類型和格式標(biāo)準(zhǔn)(如PRONOM1,ResearchDataAlliance2)、元數(shù)據(jù)方案(如schema.org)[22]。

  其他學(xué)者從數(shù)據(jù)集復(fù)用行為的模型和框架[23]、道德準(zhǔn)則[24]、復(fù)用收益[25]等方面為數(shù)據(jù)集復(fù)用提供了相應(yīng)的理論與實(shí)踐支持,以保證數(shù)據(jù)集的完整性、真實(shí)性、合理性和有效性,實(shí)現(xiàn)數(shù)據(jù)的可持續(xù)使用。鑒于目前國(guó)內(nèi)外關(guān)于科學(xué)數(shù)據(jù)集復(fù)用識(shí)別及復(fù)用特征探究的研究較少,為進(jìn)一步補(bǔ)充現(xiàn)有研究,本文首先基于規(guī)則自動(dòng)識(shí)別出生物醫(yī)學(xué)領(lǐng)域科學(xué)文獻(xiàn)中的科學(xué)數(shù)據(jù)集,然后根據(jù)科研人員復(fù)用數(shù)據(jù)集的行為特征和偏好,探索數(shù)據(jù)集的可靠性以及學(xué)術(shù)影響,以期為科研人員復(fù)用數(shù)據(jù)以及科研機(jī)構(gòu)進(jìn)行科學(xué)數(shù)據(jù)管理和數(shù)據(jù)服務(wù)提供參考。

  1數(shù)據(jù)收集與處理

  1.1數(shù)據(jù)來(lái)源

  本文從NCBI中的PubMedCentral(PMC)開(kāi)放獲取子集(OpenAccess)采集文獻(xiàn)全文并識(shí)別其中的科學(xué)數(shù)據(jù)集。NCBI(NationalCenterforBiotechnologyInformation)是美國(guó)國(guó)家生物技術(shù)信息中心,隸屬于美國(guó)國(guó)立衛(wèi)生研究院下設(shè)的國(guó)家醫(yī)學(xué)圖書(shū)館,不僅擁有大約40個(gè)在線文獻(xiàn)和分子生物學(xué)數(shù)據(jù)庫(kù),也提供在線生物醫(yī)學(xué)信息和生物信息學(xué)工具。PMC是包含了生物醫(yī)學(xué)和生命科學(xué)期刊文獻(xiàn)的數(shù)字信息中心,其中的開(kāi)放獲取子集允許用戶通過(guò)服務(wù)接口批量檢索并下載文獻(xiàn)集合進(jìn)行文本挖掘。本文通過(guò)PMC提供的FTP服務(wù)接口批量下載了2020年之前的文件包,根據(jù)索引文件獲取文獻(xiàn)的基本信息,然后提取本地文件包中NXML格式的全文文獻(xiàn),獲得2687283篇文獻(xiàn)。

  1.2基于規(guī)則的科學(xué)數(shù)據(jù)集識(shí)別

  在2687283篇文獻(xiàn)的基礎(chǔ)上,本文選擇具有代表性且格式規(guī)范的GeneExpressionOmnibus(GEO)、RefSeq、Assembly和ClinVar數(shù)據(jù)庫(kù),獲取文獻(xiàn)并識(shí)別出文獻(xiàn)中的數(shù)據(jù)集。CBI已為這個(gè)數(shù)據(jù)庫(kù)中的科學(xué)數(shù)據(jù)集分配唯一標(biāo)識(shí)符——登錄號(hào),并允許通過(guò)登錄號(hào)的整數(shù)擴(kuò)展跟蹤記錄的更改版本。

  在科學(xué)數(shù)據(jù)集識(shí)別結(jié)果的基礎(chǔ)上,根據(jù)規(guī)則深入解讀NISOJATS1.2期刊文獻(xiàn)標(biāo)簽集,挖掘并獲取存在科學(xué)數(shù)據(jù)集利用行為的文獻(xiàn)信息,包括文獻(xiàn)所在期刊名稱、文獻(xiàn)類型、作者、出版年份等。為獲取復(fù)用的數(shù)據(jù)集以及所在文獻(xiàn)的相關(guān)信息,本文統(tǒng)計(jì)了同一數(shù)據(jù)集在有數(shù)據(jù)集利用行為的文獻(xiàn)中出現(xiàn)的次數(shù),并按照數(shù)量降序排列,去除數(shù)量為的數(shù)據(jù)集及相關(guān)記錄,余下11242個(gè)復(fù)用的數(shù)據(jù)集、77189篇有數(shù)據(jù)集復(fù)用行為的文獻(xiàn),以此作為后續(xù)數(shù)據(jù)集復(fù)用特征研究的基礎(chǔ)。

  2科學(xué)數(shù)據(jù)集復(fù)用特征分析

  2.1數(shù)據(jù)集復(fù)用時(shí)間特征分析

  分析生物醫(yī)學(xué)領(lǐng)域有科學(xué)數(shù)據(jù)集復(fù)用行為的文獻(xiàn)及文獻(xiàn)中復(fù)用的科學(xué)數(shù)據(jù)集,其時(shí)間分布特征展示如下:①數(shù)據(jù)集復(fù)用最早可追溯至1999年D.MEckley等的研究,該研究參考了最早由M.D.Welch等[26]提及的NP_005712肌動(dòng)蛋白相關(guān)蛋白同源物的序列,使用生化、超微結(jié)構(gòu)和分子克隆技術(shù)分解了強(qiáng)肌動(dòng)蛋白,獲取其蛋白結(jié)構(gòu)和序列組成,并將實(shí)驗(yàn)數(shù)據(jù)集提交至NCBI;②200年,只有%的數(shù)據(jù)集得到了復(fù)用,而在20年,這一比例達(dá)到了51%。

  ③近年來(lái),數(shù)據(jù)集的數(shù)量和論文數(shù)量都在迅速增長(zhǎng),得到復(fù)用的數(shù)據(jù)集增長(zhǎng)速度更快,說(shuō)明單篇文獻(xiàn)中數(shù)據(jù)集數(shù)量增加;④2006年以后,生物醫(yī)學(xué)領(lǐng)域科學(xué)數(shù)據(jù)集復(fù)用呈線性高速增長(zhǎng)趨勢(shì),這與近10余年來(lái)從知識(shí)范式到數(shù)據(jù)范式的數(shù)據(jù)科學(xué)發(fā)展時(shí)間歷程基本吻合,一定程度上反映出開(kāi)放科學(xué)環(huán)境下數(shù)據(jù)集復(fù)用的蓬勃發(fā)展之勢(shì)。具體如圖所示。

  2.2期刊的研究領(lǐng)域分析

  本文以中科院文獻(xiàn)情報(bào)中心2019年期刊分區(qū)表(簡(jiǎn)稱中科院分區(qū)表)為基準(zhǔn)了解期刊的研究領(lǐng)域并評(píng)估其影響力。中科院分區(qū)表是在各學(xué)科內(nèi)依據(jù)年平均影響因子對(duì)湯森路透每年度發(fā)布的SCI期刊劃分分區(qū)。它包括大類分區(qū)(及Top期刊)和小類分區(qū):大類是參考國(guó)內(nèi)高校依據(jù)國(guó)務(wù)院學(xué)位辦分類體系,結(jié)合SCI覆蓋內(nèi)容設(shè)計(jì)形成;小類則借用JCR學(xué)科分類體系,并對(duì)JCR中期刊刊名更名合并的情況進(jìn)行了規(guī)范處理。

  經(jīng)過(guò)統(tǒng)計(jì)發(fā)現(xiàn),存在數(shù)據(jù)集復(fù)用的文獻(xiàn)共發(fā)表在2314種期刊上。按期刊發(fā)文量降序排列,排名前100的期刊占論文總數(shù)的72%,其中包含89本SCI期刊。使用中科院分區(qū)表對(duì)89本SCI期刊的研究領(lǐng)域進(jìn)行統(tǒng)計(jì),期刊大類包含工程技術(shù)、化學(xué)、環(huán)境科學(xué)與生態(tài)學(xué)、農(nóng)林科學(xué)、生物、醫(yī)學(xué)和綜合性期刊。其中環(huán)境科學(xué)與生態(tài)學(xué)、生物、醫(yī)學(xué)、綜合性期刊都包含Top期刊。生物區(qū)的Top期刊數(shù)量最多,為數(shù)據(jù)集復(fù)用提供了較大的平臺(tái),而環(huán)境科學(xué)與生態(tài)學(xué)、綜合性Top期刊出現(xiàn)在統(tǒng)計(jì)結(jié)果中,說(shuō)明了生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)集復(fù)用的跨學(xué)科性。

  3結(jié)論

  本文首先通過(guò)規(guī)則自動(dòng)識(shí)別PMC開(kāi)放獲取子集文獻(xiàn)中帶有利用頻次的數(shù)據(jù)集,去除利用次數(shù)為的數(shù)據(jù)集,以余下311242條復(fù)用的數(shù)據(jù)集、7718篇文獻(xiàn)為研究樣本,運(yùn)用文獻(xiàn)計(jì)量方法從多個(gè)維度揭示科研人員數(shù)據(jù)集利用行為的特征規(guī)律,并對(duì)高頻復(fù)用的科學(xué)數(shù)據(jù)集和文獻(xiàn)被引情況進(jìn)行了解析,得出以下結(jié)論:

  1)生物醫(yī)學(xué)領(lǐng)域復(fù)用數(shù)據(jù)集的現(xiàn)象逐漸頻繁。數(shù)據(jù)集復(fù)用行為最早可追溯至1999年,數(shù)據(jù)集復(fù)用高度集中分布于2006—2019年,2017年以后PMC數(shù)據(jù)集復(fù)用數(shù)量高速增長(zhǎng)。相對(duì)于發(fā)表年限較長(zhǎng)的文獻(xiàn),在近期發(fā)表的文獻(xiàn)中科研人員更愿意公開(kāi)、清晰地展示相關(guān)數(shù)據(jù)集,以提供測(cè)試樣本的數(shù)據(jù)來(lái)源。

  2)存在數(shù)據(jù)集復(fù)用行為的文獻(xiàn)呈現(xiàn)出一定的學(xué)科特征,復(fù)用數(shù)據(jù)集的類別較為集中。遺傳學(xué)和腫瘤學(xué)研究受到的關(guān)注度更高,且研究?jī)?nèi)容和研究方法的學(xué)科交叉性較為明顯。得到復(fù)用的數(shù)據(jù)集大多是基因組、轉(zhuǎn)錄本和蛋白序列記錄的集合。

  3)數(shù)據(jù)復(fù)用有助于擴(kuò)大研究的影響力。科研人員利用復(fù)用頻率較高的科學(xué)數(shù)據(jù)集可能會(huì)增加文獻(xiàn)的被引頻次,從而在一定程度上擴(kuò)大文獻(xiàn)的影響力,同時(shí)也可以為數(shù)據(jù)集提供者帶來(lái)更高的數(shù)據(jù)集利用收益和引文收益。

  本文作為生物醫(yī)學(xué)領(lǐng)域數(shù)據(jù)復(fù)用探索性研究的一步,其結(jié)論不僅可以為數(shù)據(jù)管理和服務(wù)提供依據(jù),還可以為后續(xù)的研究提供素材,但難免存在一些不足:僅以生物醫(yī)學(xué)領(lǐng)域?yàn)槔褂梦墨I(xiàn)計(jì)量方法進(jìn)行研究,無(wú)法深入分析數(shù)據(jù)集的內(nèi)容信息,在以后的工作中將會(huì)從其他角度繼續(xù)挖掘科研人員復(fù)用數(shù)據(jù)集的行為規(guī)律。

  參考文獻(xiàn)

  [1]Thefourthparadigm:dataintensivescientificdiscovery[EB/OL][20200926]. http://research.Microsoft.com/enus/collaboration/fourthparadigm/4th_paradigm_book_complete_lr.pdf

  [2]涂志芳.科學(xué)數(shù)據(jù)出版的基礎(chǔ)問(wèn)題綜述與關(guān)鍵問(wèn)題識(shí)別[J].圖書(shū)館,2018,285(6):9096,104.

  [3]JOOYK,KIMY,BLOECHLEM.Engineeringresearchers’datareusebehaviours:astructuralequationmodellingapproach[J].ElectronicLibrary,2017,35(6):11411161.

  [4]YOONA,KIMY.Socialscientists’datareusebehaviors:Exploringtherolesofattitudinalbeliefs,attitudes,norms,anddatarepositories[J].Library&InformationScienceResearch,2017,39(3):224233.

  [5]FANIELIM,FRANKRD,YAKELE.Contextfromthedatareuser’spointofview[J].JournalofDocumentation,2019,75(6):12741297.

  作者:焦紅,楊波,周琪

主站蜘蛛池模板: 国产AV无码一二三区视频 | 99视频免费在线观看 | 欧美一区二区三区男同 | 国内一级一级毛片a免费 | 一二三四在线观看高清电视剧 | 秋秋影视午夜福利高清 | 午夜亚洲动漫精品AV网站 | 全肉高H短篇合集 | 国产麻豆剧果冻传媒免费网站 | 国产精品美女WWW爽爽爽视频 | 精品无码国产污污污免费网站2 | 久爱精品亚洲电影午夜 | 久久夜色精品国产亚州AV卜 | 中文字幕在线观看亚洲 | 果冻传媒视频在线播放 免费观看 | 校园女教师之禁区 | 真人做受120分钟免费看 | 99久久无码一区人妻A片竹菊 | 哇嘎在线精品视频在线观看 | 亚洲精品一本之道高清乱码 | 大屁股国产白浆一二区 | 吃春药后的女教师 | 快播h动漫网 | 双手绑在床头调教乳尖 | 亚洲免费视频在线 | 中文字幕无线观看不卡网站 | 久久精品人人做人人爽97 | 99久久国产极品蜜臀AV酒店 | 翁用力的抽插 | 亚洲 欧美 中文 日韩 视频 | 小莹的性荡生活40章 | 无码欧美XXXXX在线观看裸 | 国产精品视频第一区二区三区 | 好男人在线观看免费视频WWW | 国产高清免费视频免费观看 | 青青草AV国产精品 | 国产精品AV视频一二三区 | 一个人免费播放高清在线观看 | 中文字幕在线观看亚洲日韩 | 久久WWW免费人成一看片 | 风流少妇BBWBBW69视频 |