第一次产业革命是蒸汽机的发明带来的工业革命,第二次产业革命以内燃机和电力的发明为标志,第三次产业革命以核能和互联网为标志,第四次产业革命将由四个领域引领:大数据、新材料、新能源和生物科技
当我们还沉浸在计算机时代机器可读、数据可算的喜悦时,互联网时代的信息传递和信息服务已遍地开花、硕果累累,当我们还思考“互联网+”是什么时,大数据时代已悄然而至。今天,我们头顶上有云,脚底下有网,周围弥漫着难以计量的数据。气势磅礴的大数据如同飓风,正从世界深渊向我们呼啸奔腾而来。
大数据的数据超大,变化飞快,构成很复杂。但是,大数据里面蕴含着大知识、大智慧、大价值和大发展。对于大数据,我们不仅要搜集它,更重要的是挖掘它,即大数据挖掘。目的是从海量数据中寻找关系、重点、规律、从而洞察其发展趋势,促进其进步。
生物信息学是由生物学、数学和计算机科学交叉形成的前沿学科,通过研发并应用计算机技术及数学和统计方法,对生物数据进行管理、整合、分析和建模,从而解决生物学问题,阐明生物学规律,获得传统生物学手段无法获得的创新发展。大数据时代的到来,使如何对生物大数据进行处理、分析和挖掘从而实现生物大数据的高效利用成为生物信息学的新挑战。
大数据挖掘与生物信息学研究组关注大数据、数据挖掘和生物信息学等领域的前沿交叉热点问题,主要研究方向包括:

  • 全基因组互作模式识别研究
  • 组学数据整合及特征识别研究
  • 群体智能算法研究
  • 稀疏表示方法研究
  • 信息熵理论研究
  • 图挖掘方法研究
  • 无线传感器网络节点定位方法研究
  • ……