数智工作坊第23期——基于大模型的结构化数据处理技术

发布时间:2024-12-27

时间:11月21日(周四)下午16:00-17:30

地点:国家治理大数据和人工智能创新平台(教一1301)大研讨室

主讲人简介


微信图片_20241227151846.png

张静,中国人民大学信息学院计算机系教授。主要研究方向是知识工程与大模型。发表论文90余篇,包括Neurips、KDD、ACL、SIGMOD、WWW、SIGIR等领域内国际顶级会议以及国际顶级期刊TKDE、TOIS论文,Google引用次数9000余次。荣获2020年数据挖掘领域全球顶级学术会议SIGKDD(CCF A)十年最佳论文奖、2017年北京市科技进步一等奖,2021年北京市高等教育教学成果奖一等奖,入选百度2023年AI华人女性青年学者榜。主持国家优秀青年基金,科技部重点研发项目课题。任IEEE Transactions on Big Data、AI Open期刊编委 (Associate Editor)。

内容概要

GPT-4等大规模预训练语言模型在通用自然语言任务上表现卓越,但在领域应用中仍需进一步适配。领域应用中绝大部分数据为结构化形式,而已有通用大模型主要关注非结构化文本数据,在结构化数据相关任务上的表现有待提升。

在关系型数据库场景中,研究目标是基于大模型实现自然语言指令到SQL查询的转换。此外,很多结构化数据存储在电子表格中,期望大模型能支持数据更新、合并、绘图等操作,而不仅限于查询功能。更进一步,我们希望能实现数据存储形式的透明化,充分利用已有的领域应用数据访问工具(例如数据检索工具),探索大模型对这些工具的有效调用方式。总之,将通用大模型适配到具体领域应用,处理结构化数据,是当前亟需解决的重要问题。


邮箱:brain@ruc.edu.cn
官网:http://brain.ruc.edu.cn

地址:中国人民大学公共教学一楼三层1301

扫码关注