《科学之光-数据的逻辑》课程第五讲,由政务数据资源研究所所长、南京大学信息管理学院教授、博导胡广伟教授主讲。本次课程以《数据挖掘》为主题,详细讲述了大数据时代数据挖掘的强大力量和当前人工智能领域的发展困境,帮助同学们了解和掌握从宏观、中观和微观等不同角度如何合理、有效的挖掘和利用数据的价值。课程内容主要由四个部分构成:数据要素、大数据挖掘、实例和互动,各部分内容相互呼应,且在每个部分胡教授都十分重视与同学们的互动。
首先,在课程开始的部分,胡教授通过举了几个简单的例子来证实数据挖掘的力量。在政治领域,胡教授以特朗普选举过程中,基于大数据“读心”来了解选和破解民心理,从而实现有针对性的竞选宣传为例来阐述在政治领域数据挖掘的力量。同时,胡教授也强调,数据应该被正当的使用,而不应被用于引导精选结果;在商业领域,胡教授通过引入行业中的“杀熟”行为来证实数据挖掘的力量。例如,当你想要购买机票时,查询机票价格的次数越多,价格就会越高。再比如,销售的利润主要来源于回头客,因为往往新用户所享受的价格优惠更高。但同样,这也体现了人工智能并不智能的一面,即忽略了对客户情感因素的考量,从而更容易造成老客户的流失。这两个例子都从正反两面证实了数据挖掘的力量,引导同学们展开深入的思考。
图1 胡教授向同学们授课
此外,胡教授又以头条、美团点评、滴滴出行这互联网新小三巨头的横空出世为例,证实了在互联网领域激烈的市场竞争中,以数据挖掘为基础,满足客户精准需求是企业生存和发展的关键。以头条为例,相比于搜狐、新浪等网站“千人一面”的板式,头条的优势主要在于不仅可以做到“千人前面”还能够实现“主动推送”,从而基于用户数据深入挖掘其价值,精准满足用户需求。
图2 胡教授与同学们互动
基于上述例子,胡教授引出了本节课所要讲述的四部分内容:数据要素、大数据挖掘、实例和互动。其中,在数据要素部分,胡教授从从国家战略、国家法律两个方面证实我国对加快培养数据要素市场的重视程度;并从经济学、战略、企业运营和管理学四个角度挖掘生产要素的概念,从而从理论基础方面找出了数据属于生产要素的证据;最后从宏观、中观和微观等角度阐述大数据作为生产要素的重要作用。这一部分帮助同学们了解到数据已经成为一种新的生产要素,而这一过程,无论在国家政策或是理论基础中都已有迹可循。
在证实数据是一种新的生产要素后,如何挖掘数据中的价值就成为了同学们最想要了解的内容。胡教授通过介绍大数据的4v特征、大数据的应用与发展阶段以及大数据的开发流程来强调,只有对数据进行全面性和全方位的整合,才能够实现数据作为资产和要素的数据化时代。在实例部分,胡教授以政治领域的棱镜计划和民用领域电力用户用电信息采集系统为例,阐述了对数据价值深入挖掘的重要性。例如,通过对电力用户用电数据的采集,不仅能够分析城市中住房空置情、不同产业用电情况以综合分析gdp发展情况,还能够以家庭用电情况为分析对象实现精准扶贫等。
图3 同学们积极发言
在课程的结尾,胡教授提出开放讨论题并与同学们进行互动,引导同学们进行深度思考,并鼓励同学们动手实践。胡教授还推荐了三本书以供同学们系统学习数据挖掘的相关知识。这三本书分别为《数据之美》、《数文明》和《深度学习》,胡教授希望通过阅读这三本书,能够帮助同学们培养数据思维,基于数据挖掘这一有效工具,服务于自身的学习和科研活动。