★导读★
上周五,氪信CEO朱明杰博士应邀出席首届上海市大数据社会应用研究会年会,在由复旦大学大数据研究院承办的“大数据智能与金融创新”分论坛上,朱明杰博士发表了题为“AI攻克大数据难题”的主题演讲。朱明杰博士表示,目前在大数据的应用中,应当注意“小数据思维”,即用个体或局部数据及自上而下验证假设的思维,去处理海量非结构化数据,并试图从中得到结论。他以氪信在“AI+金融”领域的实践为案例,分享了人工智能是如何助力金融机构攻克大数据难题的经验。
首先,面对金融领域PB级别日处理数据量,氪信将世界顶级互联网AI引擎搭建经验及ZB级别的日处理数据量能力“降维”使用在金融领域,为其赋能;区别于传统的评分卡模型,氪信通过集成模型架构帮助金融机构处理非结构化数据,这也是氪信最初能够和金融机构产生合作共鸣的关键因素。
其次,传统金融领域,风控专家历经数年形成风控经验,在互联网金融到来之际遇到了挑战,面对移动互联网层出不穷的“新状况”,已超出人脑能够总结的规则范畴,氪信基于深度学习的特征工程,可为智能风控提供行之有效的创造性解决方案,相应的成果也被收录于知识发现与数据挖掘国际顶级学术会议——KDD,数据挖掘和机器学习应用国际顶级会议——WSDM等世界顶级学术会议中。
第三,通过全域金融知识图谱构建精准用户画像,实现海量非结构数据价值的最大化。“大家经常提知识图谱,在金融领域,知识图谱更深层次的意义在于,它体现的是机器学习模型使用数据,而不是人去理解的规则,凡是人为表达的规则,就存在着安全隐患,相反,利用机器学习模型,信息泄露的风险相应会小很多。”朱明杰博士表示。
与此对应,受金融监管合规要求,金融场景强调模型的可解释性与可追溯性,互联网“黑盒进,黑盒出”的方法不适用金融场景,因为该方法导致人的经验无法介入;同时,金融行业的样本非常稀缺,每笔坏账都意味着一笔巨大的损失,因此机器学习结合专家经验必不可少。氪信的做法是用专家经验“教会”AI模型和算法,增加模型解释器,让风控专家可对模型结果进行解释,并能回溯倒具体特征进行调整,在模型自迭代的基础上进一步优化模型;另一方面是采用半监督学习方法,结合专家经验进行样本输出。
据悉,这是上海大数据社会应用研究会成立以来的首次年会。其中,“大数据智能与金融创新”平行论坛由上海市大数据社会应用研究会副会长,复旦大学大数据研究院副院长、教授吴立波主持,与会嘉宾还包括上海交通大学中国普惠金融创新中心主任、英凡研究院院长费方域,上海财经大学信息管理与工程学院常务副院长,讲席教授、博导*海量,交通银行总行风险部副总经理孙荣俊,中国电信上海理想信息产业(集团)有限公司副总经理胡忠顺,复旦大学大数据学院青年副研究员魏忠钰,国泰君安证券信息技术部规划主管梅继雄等。
与会嘉宾们结合各自研究领域均作了深入浅出的分享,如胡忠顺总经理主要分享了基于数据沙箱的金融科技与监管科技联合创新平台,魏忠钰副研究员主要介绍了研究团队使用深度学习模型进行金融事件预测和对金融实体网络进行表示学习的研究工作,梅继雄主管则主要介绍了国泰君安数字化战略工作,并分享了一些大数据和人工智能在金融中的应用场景。
预览时标签不可点收录于话题#个上一篇下一篇