大语言模型幻觉现象的研究和防御方法

发布者:曹玲玲发布时间:2024-09-18浏览次数:10

报告人:胡旭明 副研究员 助理教授 香港科技大学(广州)

报告时间:2024年9月25日(周三)14:00

报告地点:东南大学九龙湖校区计算机楼513室

报告摘要:报告将深入分析大语言模型生成幻觉现象的成因,并评估这些现象对模型可靠性的影响。报告将介绍不确定性感知的模型对齐(U2Align)和检索增强生成(RAG)的方法,这些方法旨在提升模型输出的准确性和可信度。此外,报告还将探讨针对外部攻击的水印防御技术,包括鲁棒的语义水印和公开可验证的水印,以增强模型在面对恶意攻击时的防御能力。通过对这些防御方法的介绍和分析,本报告将为大语言模型的可靠性和安全性提供新的见解。

报告人简介:胡旭明,香港科技大学(广州)人工智能学域副研究员、助理教授、博士生导师,羊城学者。胡旭明博士于清华大学获得博士学位,导师是 Philip S. Yu教授(ACM/IEEE Fellow)。胡旭明博士主要研究方向为自然语言处理、大模型及相关领域应用,致力于探索可信大模型,并且整合多模态数据到大模型以获得更全面的通用人工智能。胡旭明博士主持了广东省青年人才项目,广州市高层次人才项目以及一系列企业横向项目;参与了国家自然科学基金委重大项目和重点项目,国家科技部重点研发计划项目,相关研究成果落地阿里巴巴和AWS Glue的包括智能问答、智能搜索等多个应用场景。近五年,胡旭明博士在ICLR、ACL、EMNLP、NAACL、TKDE、SIGIR等大模型领域国际顶级期刊和会议上发表了10余篇第一作者文章,被引1000余次。担任ACL、EMNLP、NAACL、EACL等顶级国际会议的领域主席以及ACL Rolling Review的执行编辑,并且组织了2023年国际大数据竞赛、2022年重庆市人工智能竞赛,吸引了全球超过3000多支队伍参赛。胡旭明博士曾获得的部分荣誉包括KDD Cup全赛道全球季军,北京市优秀毕业生、清华大学优秀毕业生、清华大学优秀博士学位论文等。

  • 联系方式
  • 通信地址:南京市江宁区东南大学路2号东南大学九龙湖校区计算机学院
  • 邮政编码:211189
  • ​办公地点:东南大学九龙湖校区计算机楼
  • 学院微信公众号