本书理论结合实践,综合应用大数据、数据挖掘、自然语言处理、人工智能等技术,就地质大数据中非结构化数据的存储、挖掘两大关键问题展开论述,形成了非结构化地质数据内容提取、组织存储、分析挖掘及应用服务等较为完善的技术方法体系。
本书可供地质调查、地质信息化等专业的技术人员和高校相关专业的师生参考。
序言大数据是信息技术发展的必然产物,更是信息化进程的新阶段。大数据的合理开发与利用,为人类开辟了新的认知空间。大数据为地质工作的发展和变革带来新技术、新模式与新动力,支撑引领地质工作的数字化、网络化和智能化。地质工作,已经迈入大数据时代。
《地质大数据:非结构化数据的存储与挖掘》一书,综合应用大数据、自然语言处理、数据挖掘等技术,就地质大数据中非结构化数据的存储与挖掘两大关键问题展开论述,构建了非结构化地质数据内容提取、组织存储、分析挖掘、应用服务的较为完善的技术方法体系,建立了一条数据—信息—知识—服务—再数据的大数据链,为信息技术与地质调查领域的融合、技术落地及应用奠定了基础。书中提出的非结构化地质数据的大数据模型具有较强的理论创新性和实用性,以此为基础实现的内容存储库,面向典型的数据密集型问题实际,从底层的数据访问模式开始,遵循靠近数据计算的理念,构建大数据技术与非结构化地质数据信息分析挖掘的桥梁,为地质大数据的深度分析和知识发现奠定了基础。全书注重理论与实践相结合,在充分研究经典数据挖掘和深度学习技术方法的基础上,针对非结构化地质数据的特点及地质领域应用问题,在向读者阐述相关数据挖掘算法的基础理论知识的同时,从地质调查领域的实际问题出发,选取多个方向的具体应用范例,直观地展示各种数据挖掘技术在哪用、如何用,便于读者根据具体问题,采用相应的数据挖掘方法,从而达到有效运用各类数据挖掘方法的目的。本书介绍的地质大数据内容服务系统是一个实际运行中的系统,通过它可以直观了解地质大数据内容存储与挖掘系列技术是如何相互集成、如何提供实用化的服务,使该书的操作性、实用性更强。
本书作者具有地质信息化、数据挖掘等科研工作的多年从业经历,本书是他们相关成果的总结、凝练,可供从事地质调查信息化、地质大数据研究应用的专业技术人员和相关专业高校师生阅读。
前言地质学是研究地球的科学,地质数据是对各种地质问题及结论的多样性记录。我国地质调查近百年的工作积累了丰富的数据资源,这些数据具有显著的大数据特征,其中蕴藏的潜在价值不可估量。随着大数据浪潮的到来,地质调查行业也迎来了从小数据时代向大数据时代的变迁,数据密集型科学研究模式应运而生。在地球科学领域,数据密集型的特点就是直接从地质大数据中发现科学规律,以地质数据为起点,通过深入数据内部的内容分析和大数据挖掘发现规律、发现知识。地球是一个已经存在了近45.5亿年、半径约千米的岩石星球,迄今人类对它的了解连千分之一都不到。正是因为地球这个研究对象巨大的时空跨度和当前研究手段相对缺乏,造成了地球科学问题的复杂性,使得地质数据中描述性数据较多而量化数据较少。从数据类型上看,地质数据由非结构化数据与结构化数据共同组成,而非结构化数据占地近80%。如果这些海量的非结构化数据能够被有效地利用,则相关的地球科学研究就更可能获得突破,而解决地质问题的技术方法也将变得更具适应性和专属性。因此,非结构化地质数据是大数据时代地质数据的新内涵。
大数据时代的到来,为挖掘地质数据内在信息,充分发挥数据自身的价值带来了良好契机。但是,数据的组织存储和数据分析、挖掘面临一系列挑战。这些挑战贯穿于数据获取、存储、使用等各个环节当中。本书就地质大数据(非结构化地质数据)的组织存储和挖掘两项关键技术展开论述。
数据的组织存储,需要数据模型。本书讨论的“大数据”概念不仅指当前数据集的规模,还包括更为重要的对数据个体更为细粒度的内容拆解和重构。但这个目标概念不能和现有的“模式优先”的关系数据模型匹配,超出了传统数据库系统的存储、索引、查询的范畴。数据模型需要
次:年12月北京第1版
印
次:年12月北京第1次印刷
定
价:.00元
书
号:ISBN-7---5
如需购买,可以识别下方