你好,欢迎来到中国科学技术大学国际金融研究院!
2022-11-17
讲座回顾 | 第七期数字决策高端系列讲座

中国科大国际金融研究院举办第七期数字决策高端系列讲座


2022年11月11日,“中国科学技术大学国际金融研究院-中国科学院大学经济与管理学院数字决策联合研究中心”邀请了康涅狄格大学统计系的王海鹰副教授,以Subsampling for Rare EventsData and Maximum Sampled Conditional Likelihood为题作学术讲座。讲座由中国科学技术大学管理学院双聘教授、中科院数学与系统科学研究院/预测中心研究员张新雨教授主持。

讲座中,王海鹰教授首先通过严格的理论展示了在非平衡数据下,关于未知参数的可用信息只与相对较少的正实例有关,这说明了使用负抽样是合理的,然而,如果负实例被负采样到与正实例相同的水平,则会导致信息损失。接着,阐述了如何通过改进算法来保留更多信息,以及最优抽样算法的推导过程,并提出了一种基于似然的估计量来进一步提升估计效率,相较于其他很多估计量来说,改进的估计量有最小的渐近方差。最后,王海鹰教授在模拟数据、MNIST数据、以及拥有超过0.3万亿实例的真实点击率数据集上,验证了上述方法的有效性。

讲座的最后,是约半小时的答疑和交流环节。大家踊跃发言,提出了有关最优抽样能否运用于实验的设计阶段、最优抽样对过采样的意义、改进算法的推导细节,以及能否在预测方向上进一步研究等问题,王海鹰教授一一解惑。第七期数据决策高端系列讲座圆满落下帷幕。


主讲人简介:

王海鹰,康涅狄格大学统计系副教授,中国科学院硕士,美国密苏里大学博士。他的主要研究方向包括大数据的有信息子数据选择、模型选择、模型平均、半参数回归等。近年来有多篇论文发表在Journal of the AmericanStatistical Association, Biometrika, Journal ofMachine Learning Research等国际统计学和机器学习顶尖学术期刊。