定量古生物学以计算机技术为手段,应用数理统计理论和方法,对古生物学数据进行清洗、处理和分析,研究化石的形态、分类、分布及演化过程[1]。定量古生物学是古生物学原理与统计学、计算机技术交叉的学科,计算机技术和数据科学的飞速发展为定量古生物学提供了有效的技术支撑。2015年9月,国务院《促进大数据发展行动纲要》指出,要推动大数据发展与科研创新有机结合[2]。数据挖掘、机器学习、可视化等大数据技术的引入促进了定量古生物学的发展。
R语言是一种高级编程语言,也是一套集成了数据处理、统计分析和图形显示的软件系统。第一个R语言版本由新西兰奥克兰大学统计系Ross Ihaka和Robert Gentleman教授在1995年基于S语言共同开发完成。目前,R语言在GNU协议“General Public License”下免费发行,由R开发核心小组(R Development Core Team)负责维护与更新,并将全球优秀的统计应用程序包免费开放共享。R语言具有强大的数据处理与可视化功能,相比MatLab,SPSS,SAS等商业软件,还具有免费开源、敏捷高效、跨平台的特点,非常适用于高校的大数据教学与科研工作。
随着大数据技术的兴起,具有上述诸多优势的R语言迅猛发展,在生态学、遗传学、计算生物学及地球科学等不同领域的数据处理与分析中发挥了日益重要的作用[3-7]。在定量古生物学的教学科研中,R语言也得到国内外学者的日益重视[3,8-10]。将R语言融入定量古生物学实践教学中,建设针对古生物学定量分析的实践平台,有利于提高学生数据处理分析的实践能力,培养具有综合素质的古生物学人才,为后续研究生阶段的科研工作打下坚实基础。本文将介绍基于R语言的古生物学定量分析实践平台(简称平台)建设中的方法与实践。
1 国内外R语言应用于古生物学教学科研的现状
2 平台建设思路
3 平台架构
4 平台内容与特色
5 结语
平台以古生物学数据处理方法为核心,以R语言为数据分析编程语言,建设了古生物学数据集,提供了丰富的数据处理教程库、分析模板及实践案例,为学生开展古生物学定量分析的自主学习和探索实践提供了良好的实验支撑,改善了实验教学效果,推动了数据实践教学的改革与创新。
参考文献
[1] 樊隽轩,黄冰,泮燕红,等.定量古生物学及重要名词释义[J].古生物学报,2016(2):220-243.
[2] 国务院关于印发促进大数据发展行动纲要的通知[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[3] 黄冰.志留纪华夏正形贝动物群丰度模型研究及其意义—兼浅介R语言的古生态学应用[J].古生物学报,2015(4):472-480.
[4] 任鹏,王廷伟,Christos Grecos.基于Shiny框架的海洋浮标大数据处理实验平台[J].实验室研究与探索,2018(8):46-49.
[5] 杨尚梅,陈颖,吉守祥.基于红外光谱和随机森林的蕨麻产地鉴别[J].实验室研究与探索,2017(3):13-15,19.
[6] 吕书龙,刘文丽,梁飞豹,等.数理统计直观教学的实验设计与R程序实现[J].实验技术与管理,2016(10):142-146.
[7] 肖寅东,刘科.R在实验教学中的应用[J].实验科学与技术,2013(2):27-30.
[8] HUNT G. Fitting and comparing models of phyletic evolution: random walks and beyond[J]. Paleobiology, 2006.
[9] NOVACK-GOTTSHALL P M. Using a thoretical ecospace to quantify the ecological diversity of Paleozoic and modern marine biotas[J]. Paleobiology, 2007.
[10] XUE J Z, HUANG P, RUTA M, et al. Stepwise evolution of paleozoic tracheophytes from South China: Contrasting leaf disparity and taxic diversity[J]. Earth-Science Reviews, 2015(148): 77-93.
熊文涛1,2,3 薛进庄1,2,3 张进江1,2,3 郭艳军1,2,3 崔 莹1,2,3
1.北京大学地球与空间科学学院 2.北京大学地球科学国家级实验教学示范中心 3.北京大学地球科学国家级虚拟仿真实验教学中心 |