聂再清,清华大学国强教授、智能产业研究院首席研究员。2004年获得美国亚利桑那州立大学博士学位,师从美国人工智能学会前主席Subbarao Kambhampati教授,本科和硕士毕业于清华大学计算机科学与技术系。2017年加入阿里巴巴,任阿里巴巴人工智能实验室北京负责人和阿里巴巴天猫精灵首席科学家。此前就职于微软亚洲研究院,任首席研究员。聂再清博士发表学术论文50余篇,申请了近30项专利,已经授权的有5项全球专利、18项美国专利、和1项中国专利。聂再清博士是微软学术搜索和人立方的发起人和负责人,也是微软自然语言理解平台LUIS的技术负责人。发明的知识图谱相关技术(包括实体信息挖掘、关系抽取技术、和实体名消歧技术)、对象级别的信息搜索技术、语音语义一体化理解技术等,被广泛应用于互联网搜索引擎、聊天机器人、以及智能助手等领域。引领了业内大数据驱动的知识图谱(knowledge graph)挖掘和应用相关技术的创新,在微软期间被授予Microsoft Golden Star奖。在阿里巴巴集团达摩院期间,聂再清博士作为天猫精灵首席科学家,带领团队从无到有实现天猫精灵的所有相关算法研发和创新工作,把人工智能最前沿技术真正落地到千家万户,为千万家庭带来欢乐和陪伴。2019年他所带领的团队获得吴文俊人工智能科技进步奖。
研究领域:
大数据,知识图谱相关技术(包括实体信息挖掘、关系抽取技术、和实体名消歧技术)、对象级别的信息搜索技术、语音语义一体化理解。
教育经历:
1999-2004美国亚利桑那州立大学计算机科学博士
1996-1998清华大学计算机应用硕士
1991-1996清华大学计算机科学与技术学士
工作经历:
2020-至今清华大学智能产业研究院 首席研究员
2017-2020阿里巴巴集团 天猫精灵首席科学家、达摩院AI Labs北京研发中心负责人
2004-2017微软亚洲研究院 从副研究员起历任主管/高级研究员、首席研究员
研究成果:
聂再清是互联网信息集成和知识挖掘的知名专家。聂再清和他的团队提出一种全新的基于对象的互联网搜索技术。这个听起来有点学术化的技术其实并不难理解。当你使用这种搜索引擎时,它列出的结果将是最终对象的集合,而不是杂乱的网页列表。一切的一切都围绕着你所搜索的那个对象。 比如,当你搜索“多普达”时,系统列出的不是包含此信息的各种页面标题、内容检索,而是一个个多普达手机—除型号、图片等直观信息外,每个产品下还列出介绍、价格、用户评价等相关信息,就像我们在购物网站中看到的陈列页面一样,但内容要远比某个网站所陈列的丰富,因为是来自整个互联网。搜索引擎所列出的对象内容并不是通过人工来整理的,而是计算机通过自动抓取、自动分类而形成的“虚拟”页面。微软学术搜索和人立方是对象级别搜索技术的两个成功应用实例
微软学术搜索
微软学术搜索是微软亚洲研究院开发的免费学术搜索引擎,它为研究员、学生、图书馆馆员和其他用户查找学术论文、国际会议、期刊、作者和研究领域等提供了一个更加智能、新颖的搜索平台,同时也是一个对象级别垂直搜索、命名实体的提取和消歧、数据可视化等许多研究思路的试验平台。
人立方关系搜索
微软人立方关系搜索,是由微软亚洲研究院研发的对象级别互联网搜索引擎,是一款新型的社会化搜索引擎,它能从超过十亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并通过算法自动的计算出它们之间存在关系的可能性。人立方搜索的创建理念来自于“六度空间”,只要随便输入一个人物,人立方搜索将给出该人物的关系、网页、资讯、简介等众多内容。最新推出的人立方2.0加入交互式知识挖掘功能包括人立方关系百科和人立方读心机器人,希望聚集大众的力量,实现互联网知识的整理。
著作摘选:
1. Pengwei Wang &, Liangchen Wei, Yong Cao, Jinghui Xie, Zaiqing Nie*. Large-Scale Unsupervised Pre-Training for End-to-End Spoken Language Understanding. ICASSP 2020.
2. Liangchen Luo, Wenhao Huang, Qi Zeng, Zaiqing Nie*, Xu Sun. Learning Personalized End-to-End Goal-Oriented Dialog. AAAI 2019.
3. Xufang Luo &, Zijia Lin, Yunhong Wang, Zaiqing Nie*. CoChat: Enabling Bot and Human Collaboration for Task Completion. AAAI 2018.
4. Zexuan Zhong, Yong Cao, Mu Guo, Zaiqing Nie*. CoLink: An Unsupervised Framework for User Identity Linkage.
5. Jingwei Zhuo, Yong Cao, Jun Zhu, Bo Zhang, Zaiqing Nie*. Segment-Level Sequence Modeling using Gated Recursive Semi-Markov Conditional Random Fields. In the Proceedings of ACL 2016.
6. Zhiting Hu &Gang Luo, Mrinmaya Sachan, Eric P. Xing, Zaiqing Nie*. Grounding Topic Models with Knowledge Bases. In the Proceedings of IJCAI 2016.
7. Gang Luo, Xiaojiang Huang, Chin-Yew Lin, Zaiqing Nie*. Joint Entity Recognition and Disambiguation. In the Proceedings of EMNLP 2015.
8. Lin Qiu, Yong Cao, Zaiqing Nie*, Yong Yu, Yong Rui. Learning Word Representation Considering Proximity and Ambiguity. In the proceedings of AAAI2014.
9. Zaiqing Nie*, Ji-Rong Wen, Wei-Ying Ma. Statistical Entity Extraction from Web. In the Proceedings of the IEEE, Septemeber, 2012.
10. Xiaojiang Liu &, Zaiqing Nie*, Nenghai Yu, Ji-Rong Wen. BioSnowball: Automated Population of Wikis. In the Proceedings of SIGKDD 2010.
11. Chunyu Yang &, Yong Cao, Zaiqing Nie*, Jie Zhou, Ji-Rong Wen. Closing the Loop in Webpage Understanding. In IEEE Transactions on Knowledge and Data Engineering (TKDE). 2010.
12. Jun Zhu, Zaiqing Nie, Xiaojiang Liu, Bo Zhang, Ji-Rong Wen. StatSnowball: a Statistical Approach to Extracting Entity Relationships. In the Proceedings of the 18th international World Wide Web conference (WWW 2009).
13. Jongwuk Lee &, Seung-won Hwang, Zaiqing Nie*, Ji-Rong Wen. Query Result Clustering for Object-level Search. In the Proceedings of SIGKDD 2009.
14. Zaiqing Nie*, Ji-Rong Wen, and Wei-Ying Ma. WebPage Understanding: Beyond Page-Level Search. SIGMOD Record, December 2008 (Vol. 37, No. 4). Special Issue on Managing Information Extraction.
15. Huajing Li &, Zaiqing Nie*, Wang-Chien Lee, C. Lee Giles, and Ji-Rong Wen. Scalable Community Discovery on Textual Data with Relations. CIKM 2008 (1203-1212).
16. Jun Zhu, Zaiqing Nie*, Bo Zhang, Ji-Rong Wen. Dynamic Hierarchical Markov Random Fields for Integrated Web Data Extraction. In the Journal of Machine Learning Research (JMLR), 9(Jul):1583--1614, 2008.
17. Zaiqing Nie*, Yunxiao Ma, Shuming Shi, Ji-Rong Wen, Wei-Ying Ma. Web Object Retrieval.To appear in the Proceedings of the 16th international World Wide Web conference (WWW 2007).
18. Zaiqing Nie*, Ji-Rong Wen, Wei-Ying Ma. Object-Level Vertical Search. In the Third Biennial Conference on Innovative Data Systems Research (CIDR 2007).
19. Jun Zhu, Zaiqing Nie*, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma. Simultaneous Record Detection and Attribute Labeling in Web Data Extraction. In Proceedings of SIGKDD 2006.
20. Jun Zhu, Zaiqing Nie*, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma. 2D Conditional Random Fields forWeb Information Extraction. In the 22nd International Conference on Machine Learning (ICML 2005).
21. Zaiqing Nie*, Yuanzhi Zhang, Ji-Rong Wen, and Wei-Ying Ma. Object-Level Ranking: Bringing Order to Web Objects. In Proceedings of WWW 2005, May 10-14, 2005, in Chiba, Japan.