发布时间:2016-11-11
报告题目:大规模非高斯数据的聚合分析主讲人:吕萌
时间:2016年11月17日10:30-12:00
地点:25楼A区三层C教室
报告人简介:
美国德州农工大学博士毕业,2016年9月入职学部,大数据研究院讲师,主要致力于大数据建模及分析,机器学习,及其在电子商务中的应用。至今有数篇论文在模式识别和机器学习相关领域的高水平期刊和会议发表,包括Pattern recognition, BMC Genomics等。
主要内容:
现代大数据的高纬度特性及其复杂的数据类型使得对此类数据进行降维和关联分析面临着巨大挑战。我们提出了一类有效并在高纬度可行的方法:sparse exponential family pca,用于大规模非高斯数据的降维和聚合关联分析。此类方法首次被提出用来对多种类型的现代大数据进行稀疏降维,比如二值型,类别型以及计数型的大数据。该算法计算效率较高,分别对其性能和效率通过仿真及现实数据进行分析。此类方法可以被广泛应用在计算机视觉中的图像分类以及电子商务中的用户画像和产品推荐等。