大数据与云计算实验室
 

大数据与云计算实验室

以大数据和云计算应用引领前沿创新研究

崔晓晖教授为武汉大学文科科研人员详解“大数据”    2015-04-04

      4月3日下午,国际软件学院崔晓晖院长在行政楼报告厅作题为“大数据背景下的人文社会科学研究”的专题报告。讲座由武汉大学人文社会科学研究院主办,旨在提高文科教师对大数据重要性的认识,营造学习运用大数据相关技术和方法的学术氛围。各文科院系、研究机构的科研工作者百余人踊跃听取了报告。
      崔晓辉教授在报告中介绍了大数据大数据的力量及其特点,并重点阐述了大数据与人文社会科学研究的关系,列举了系列的应用范例。他表示,在数据为王的大数据时代,战略需求正在发生重大转变:关注的重点落在数据(信息)上。他强调,大数据的作用在于体现价值, 而不仅是发现知识。大数据的4V特点是:Volume(大量)、Variety(多样)、Value(价值)、Velocity(高速)。大数据的数据特点在于:多元异构高噪、高噪声、开放易获得、交互性、时效性。
      崔晓辉教授认为大数据研究的难点在于:传统的存储结构需要升级为扩展性的存储架构,否则无法适应现有的大数据存储,同时,对于分布式的文件系统的支撑之后,需要进行实时的流处理。没有速度,再有价值的大数据也只能是一堆无法流通的钞票。由于分析手段的限制,取样时的样本数不够大,不能充分利用所有的数据,无形中破坏了信息的完整性;又比如,受限于分析能力而无法获取复杂问题的答案,受限于时间而不得不采用某项简单的建模技术,同样,也是由于没有足够的时间来执行多次迭代,不得不对模型净度进行妥协。崔晓辉教授介绍了大数据的示范应用,讲述了”基于社交媒体大数据的疾病预测”、“基于大数据与高性能计算的人口迁移预测分析”、“基于大数据的重大群体性事件综合预警技术研发”这三个案例。


崔晓晖教授开始作报告


崔晓晖教授报告提纲