1. 大賽介紹
隨著大數(shù)據(jù)時代和數(shù)據(jù)密集型研究范式的到來,,基于數(shù)據(jù)進(jìn)行研究,,對數(shù)據(jù)進(jìn)行管理,、共享和再利用,,成為學(xué)術(shù)研究的新趨勢,。為了鼓勵各學(xué)科領(lǐng)域?qū)W子基于數(shù)據(jù)進(jìn)行創(chuàng)新研究,,促進(jìn)研究數(shù)據(jù)的保存和共享,,由國家信息中心大數(shù)據(jù)發(fā)展部,、北京市信息資源管理中心作為行業(yè)指導(dǎo)單位,北京大學(xué)圖書館,、北京大學(xué)信息管理系,、南海大數(shù)據(jù)應(yīng)用研究院,聯(lián)合北京大學(xué)中國社會科學(xué)調(diào)查中心,、北京大學(xué)計算語言學(xué)研究所,,面向全國高校在讀學(xué)生,開展首屆全國高校數(shù)據(jù)驅(qū)動創(chuàng)新研究大賽,。
本次大賽將于2017年12月至2018年3月期間舉行,,歡迎各學(xué)科領(lǐng)域優(yōu)秀學(xué)子提交論文參與競賽。
大賽最新信息請參見官網(wǎng)http://opendata.pku.edu.cn/competition-2018.xhtml,。
1.1. 參賽對象
全國高校本科,、碩士、博士在讀學(xué)生,。
1.2. 賽程賽制
大賽的時間安排與組織形式如下:
(1) 啟動與培訓(xùn),。時間:2017年11月30日和2017年12月1日。方式:現(xiàn)場培訓(xùn)與網(wǎng)絡(luò)直播,,詳情見REF _Ref499194054 r h附錄108D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F005200650066003400390039003100390034003000350034000000:
(2) 參賽報名,。時間:2017年12月1日至2018年1月15日。
(3) 成果提交,。時間:2018年1月16日至2018年2月28日,。
(4) 成果評審。時間:2018年3月1日至2018年3月16,。2018-03-16在大賽官網(wǎng)公布,。
(5) 現(xiàn)場答辯。時間:2018年3月19日至2018年3月23日期間,。地點:北京大學(xué)?,F(xiàn)場答辯,決出一等獎,、二等獎,、三等獎。
(6) 海南頒獎,。時間:2018-03-28,,一等獎、二等獎獲獎代表,,將受邀參加2018年3月26至28日在海南陵水舉辦的“第二屆京陵大數(shù)據(jù)峰會”,,進(jìn)行成果展示和頒獎。
2. 獎項設(shè)置
(1) 一等獎(1組),獎金10000元
(2) 二等獎(3組),,獎金5000元(至少包含1組本科生)
(3) 三等獎(8組),,獎金3000元(至少包含3組本科生)
(4) 優(yōu)秀獎(30組),獎金1000元(至少包含12組本科生)
3. 北京大學(xué)開放研究數(shù)據(jù)平臺
(1) 平臺簡介
北京大學(xué)開放研究數(shù)據(jù)平臺的由北京大學(xué)圖書館,、國家自然科學(xué)基金-北京大學(xué)管理科學(xué)數(shù)據(jù)中心,、北京大學(xué)科研部、北京大學(xué)社科部聯(lián)合主辦和推出,。平臺以“規(guī)范產(chǎn)權(quán)保護”為基礎(chǔ),,以“倡導(dǎo)開放科學(xué)”為宗旨,鼓勵研究數(shù)據(jù)的發(fā)布,、發(fā)現(xiàn),、再利用和再生產(chǎn),促進(jìn)研究數(shù)據(jù)引用的實踐和計量,,并探索數(shù)據(jù)長期保存,,培育和實現(xiàn)跨學(xué)科的協(xié)同創(chuàng)新。
(2) 平臺數(shù)據(jù)
北京大學(xué)開放研究數(shù)據(jù)平臺現(xiàn)有100多個數(shù)據(jù)集,,數(shù)據(jù)被WebofScience數(shù)據(jù)引用索引數(shù)據(jù)庫收錄。如下給出了一些典型的研究數(shù)據(jù)集:
中國家庭追蹤調(diào)查,,http://opendata.pku.edu.cn/dataverse/CFPS
中國健康與養(yǎng)老追蹤調(diào)查,,http://opendata.pku.edu.cn/dataverse/CHARLS
中國老年人健康長壽影響因素調(diào)查,http://opendata.pku.edu.cn/dataverse/CHADS
中國歷代人物傳記資料庫,,http://opendata.pku.edu.cn/dataverse/crach
北京社會經(jīng)濟發(fā)展年度調(diào)查,,http://opendata.pku.edu.cn/dataverse/BAS
國家信息中心大數(shù)據(jù)發(fā)展部提供的數(shù)據(jù),
http://opendata.pku.edu.cn/dataverse/contest_official
4. 組織單位
主辦單位:北京大學(xué)圖書館,、北京大學(xué)信息管理系,、南海大數(shù)據(jù)應(yīng)用研究院
協(xié)辦單位:北京大學(xué)中國社會科學(xué)調(diào)查中心、北京大學(xué)計算語言學(xué)研究所
支持單位:海南省陵水黎族自治縣人民政府
行業(yè)指導(dǎo)單位:國家信息中心大數(shù)據(jù)發(fā)展部,、北京市信息資源管理中心
贊助單位:圣智學(xué)習(xí)集團Gale公司
數(shù)據(jù)支持單位:北京國信宏數(shù)科技有限責(zé)任公司
北京清博大數(shù)據(jù)科技有限公司
北京麒麟心通網(wǎng)絡(luò)技術(shù)有限公司
大連瀚聞資訊有限公司
中國電信股份有限公司云計算分公司
百職科技(北京)有限公司
廣東和誠信息技術(shù)有限公司
5. 聯(lián)系方式
大賽最終解釋權(quán)歸主辦方所有,。如果您對大賽有任何問題,可以通過郵箱,、電話與我們聯(lián)系,。非常感謝您對大賽的關(guān)注與支持!
郵箱:[email protected]
電話:010-62751062-22
附錄1 培訓(xùn)計劃
(1) 第一次培訓(xùn)
時間:2017年11月30日下午3:00~4:30
現(xiàn)場培訓(xùn)地點:北京大學(xué)圖書館304教室
網(wǎng)絡(luò)直播地址:http://162.105.138.115/index.php?m=live&c=index&a=lists
表SEQ表* ARABIC1第一次培訓(xùn)內(nèi)容
主持人
| 主要內(nèi)容
| 培訓(xùn)老師
|
劉雅瓊
(北京大學(xué)圖書館)
| 大賽基本情況介紹(30分鐘):介紹大賽的基本情況,,包括大賽要求,、賽制賽程、注冊和成果提交流程,、北京大學(xué)開放數(shù)據(jù)平臺等,。
| 羅鵬程 館員(北京大學(xué)圖書館)
北京大學(xué)圖書館信息化與數(shù)據(jù)中心館員,負(fù)責(zé)北京大學(xué)開放研究數(shù)據(jù)平臺的建設(shè)工作,,曾參與國家自然科學(xué)基金委基礎(chǔ)研究知識庫,、北京大學(xué)科研管理系統(tǒng)等平臺的建設(shè),。參與負(fù)責(zé)本次大賽的相關(guān)組織工作。
|
數(shù)據(jù)挖掘方法介紹(30分鐘):簡要介紹數(shù)據(jù)挖掘的基本流程和方法,。
| 王繼民 教授(北京大學(xué)信息管理系)
教授,,博士生導(dǎo)師,北京大學(xué)信息管理系副主任,。研究領(lǐng)域包括:搜索引擎,、Web數(shù)據(jù)挖掘、科學(xué)評價學(xué),、信息可視化等,。近幾年主持國家社科基金、國家“核高基”重大科技專項子課題,、以及國家發(fā)改委,、教育部、北京市科委等科研課題30余項,。發(fā)表學(xué)術(shù)研究論文50余篇,;出版專著或合著《搜索引擎原理技術(shù)與系統(tǒng)》、《Web用戶查詢?nèi)罩就诰蚺c應(yīng)用》,、《中國人文社科類一級學(xué)科數(shù)據(jù)分析報告》,、《“一帶一路”沿線國家五通指數(shù)報告》、《國民海洋意識發(fā)展指數(shù)研究報告(2016)》等6部,。獲得發(fā)明專利2項,;獲得省部級科研獎勵2項。
|
現(xiàn)場答疑(30分鐘)
|
|
(2) 第二次培訓(xùn)
時間:2017年12月01日下午3:30~5:00
現(xiàn)場培訓(xùn)地點:北京大學(xué)圖書館304教室
網(wǎng)絡(luò)直播地址:http://162.105.138.115/index.php?m=live&c=index&a=lists
表SEQ表* ARABIC2第二次培訓(xùn)內(nèi)容
主持人
| 主要內(nèi)容
| 培訓(xùn)老師
|
趙飛
(北京大學(xué)圖書館)
| 中國家庭追蹤調(diào)查及分析方法(30分鐘):對中國家庭追蹤調(diào)查數(shù)據(jù)(CFPS)進(jìn)行介紹,,并簡要介紹相關(guān)的分析方法,。
| 吳瓊 副研究員(北京大學(xué)社會科學(xué)調(diào)查中心)
美國賓州州立大學(xué)教育與心理測量學(xué)博士、統(tǒng)計學(xué)碩士?,F(xiàn)任北京大學(xué)中國社會科學(xué)調(diào)查中心副研究員,,“中國家庭追蹤調(diào)查”(CFPS)項目辦公室主管,主要負(fù)責(zé)CFPS數(shù)據(jù)管理,、數(shù)據(jù)服務(wù),、與問卷設(shè)計和執(zhí)行相關(guān)的數(shù)據(jù)支持工作。加入調(diào)查中心之前,,她就職于哈佛大學(xué)人口與發(fā)展研究中心,,作為該中心的量化分析師,她的主要職能之一是分析大型調(diào)查數(shù)據(jù),。主要研究領(lǐng)域包括測量學(xué)方法,、認(rèn)知功能的影響因素、少兒發(fā)展等,已發(fā)表SSCI,、SCI論文20余篇,。
|
中國健康與養(yǎng)老追蹤調(diào)查及分析方法(30分鐘):對中國健康與養(yǎng)老追蹤調(diào)查數(shù)據(jù)(CHARLS)進(jìn)行介紹,并簡要介紹相關(guān)的分析方法,。
| 陳欣欣 副研究員(北京大學(xué)社會科學(xué)調(diào)查中心)
浙江大學(xué)管理學(xué)博士,,現(xiàn)任北京大學(xué)中國社會科學(xué)調(diào)查中心副研究員,中國健康與養(yǎng)老追蹤調(diào)查(CHARLS)項目主管,,曾在斯坦福大學(xué)師從Scott Rozelle教授從事博士后研究,。2008年以來參與了CHARLS的實地執(zhí)行工作,并組織實施了中國中老年人生命歷程調(diào)查,、CHARLS第三輪追蹤調(diào)查和共和國初期基層經(jīng)濟史調(diào)查,。研究興趣集中在微觀發(fā)展經(jīng)濟學(xué)和老年經(jīng)濟學(xué)。
|
國家信息中心大數(shù)據(jù)發(fā)展部數(shù)據(jù)介紹(30分鐘):介紹國家信息中心大數(shù)據(jù)發(fā)展部的開放數(shù)據(jù),。
| 廖尚圍 項目經(jīng)理(國信宏數(shù)公司)
國信宏數(shù)公司數(shù)據(jù)采集項目經(jīng)理,。曾任蓬天公司CTO,負(fù)責(zé)陜西省,、江西省地稅征管系統(tǒng)技術(shù)架構(gòu),,具有豐富的J2EE項目開發(fā)實施經(jīng)驗。目前主要負(fù)責(zé)國信宏數(shù)公司數(shù)據(jù)采集工作,,通過設(shè)計分布式采集平臺,,實施互聯(lián)網(wǎng)結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的采集,、清洗、存儲,。
|