东南大学 张静副教授--面向众包标注数据的机器学习研究进展
发布人: | 发布日期:2022年10月13日 10:43 | 点击数:
讲座时间:2022年10月14日13时30分
讲座地点:线上,腾讯会议号:319-530-832
讲座对象:beat365官方网站师生
讲座摘要:
大数据时代,数据标注昂贵耗时,无法满足智能系统中机器学习模型不断演进更新的现实需求。众包系统的出现为此问题提供了一种可行的解决方案。需求方可以将未标注数据发布在众包平台上,由网络大众进行标注,并提供合理的报酬,从而极大地提高了数据标注的效率。然而网络大众并非专家,其提供的标注中不乏“噪声”。如何利用这些“噪声”标注数据进行机器学习成为当前机器学习研究中的热点之一。本报告围绕众包环境下如何提升标签质量和如何构建高质量的学习模型展开,内容涵盖众包真值推断算法,基于模型纠错的质量提升方法,监督学习模型构建方法,众包环境主动学习等内容。在介绍领域经典模型和算法的同时也展示了演讲者课题组最新的研究工作。