通知公告

DeepSeek AI技术研讨会成功举办:聚焦技术创新与跨学科应用

发布时间:2025-02-16


 2025年春节DeepSeek风靡全球,引发各界的广泛关注。为积极应对人工智能技术浪潮,把握时代发展机遇,中国人民大学快速响应,于2月11日下午举办“DeepSeek技术研讨会”。本次研讨会由国家治理大数据和人工智能平台(简称创新平台)、新时代智慧治理学科交叉中心、交叉科学研究院主办,吸引了来自校内外的专家学者以及人工智能爱好者齐聚一堂,共同探讨DeepSeek技术前沿,进而探索DeepSeek在人大的应用方案。郑新业副校长出席活动并致辞。高瓴人工智能学院、信息学院、苏州人工智能学院、创新平台等多位教授及工程师进行报告,创新平台主任龚新奇主持会议。

会议内容回顾

 郑新业副校长首先向全体在场师生致以节日问候,并提出几点要求:第一,“先把人民大学武装起来”完成DeepSeek的本地部署,一方面服务于教师的科研工作,助力项目申报,让老师们有获得感;一方面帮助校办、教务处等,帮助全校老师和同学从人工智能中获益。第二,探索如何利用人工智能支撑和发展人民大学的优势,例如红色基因、人文社科领域的专业模型等,并且要做可信的人工智能。第三,始终坚守培养人才的基本使命,鼓励本硕博学生积极参与,推出服务社会、服务国家、让人民过上美好生活、让国家进一步发展、让中国有更有能力的人工智能产品。

 高瓴人工智能学院卢志武教授详细介绍了DeepSeek的技术创新及其在复杂推理模型上的突破。他首先阐述了R1模型的核心技术——在V3模型的基础上,通过改进多头注意力机制和采用MoE(混合专家模型)架构,结合GRPO强化学习算法,自动生成复杂的推理能力,避免了人工标注推理过程的需求,凭借这些创新,DeepSeek以较低的成本训练出了接近或超越GPT-4的效果。在训练过程中,DeepSeek模型展现了自我净化和涌现能力,能够自动识别并纠正推理错误,体现出反思和回溯的特性。

 卢教授总结道,DeepSeek的成功不仅源于技术创新,更在于团队的坚定信念,特别是在人工智能领域取得世界领先成果的决心。他强调,DeepSeek的经验为多模态大模型的研发提供了宝贵的启示,在有限资源下,创新与探索依然能够突破技术瓶颈,为行业带来新的发展方向。

 高瓴人工智能学院赵鑫教授指出,DeepSeek的最大亮点之一是其开源策略,与OpenAI采用封闭式API不同,DeepSeek公开了完整的模型权重和技术报告,为学术界和产业界提供了自由微调和本地部署的机会。当前国内大模型技术已处于全球第二梯队,仅次于OpenAI,尤其是DeepSeek V3 和千问 2.5 Max的性能已接近国际顶尖水平。在全球芯片供应受限的背景下,国内AI产业能够迅速追赶,实属不易。他同时指出,大模型的发展不应盲目追求规模扩大,而应根据不同应用场景合理选择轻量化模型,以提高计算效率。

 在大模型的落地应用方面,人大正在探索R1模型在法律推理领域的应用,并积极调研如何在学校内部科学部署大模型,以平衡算力成本和应用需求。未来应通过精细化资源调度,确保R1主要服务于科研和学术任务,避免不必要的算力浪费。他进一步强调,人大将持续推动大模型研究和交叉应用,积极探索人工智能技术的创新发展,为高校和社会提供更优质的智能化解决方案。 

 信息学院张静教授围绕DeepSeek R1 的核心技术贡献以及其对学科发展的启示进行了深入探讨。DeepSeek R1颠覆了传统大模型训练范式,实现了从预训练(Pre-train)直接到强化学习(RL),跳过了传统依赖大量监督数据微调(SFT)的步骤。这一创新证明了,即便不依赖人工标注的监督学习,仅凭强化学习,模型依然能够激发“长思考能力”(COT),显著提升推理性能,尤其在数学等复杂推理任务上的表现。

 在技术层面,DeepSeek R1 采用的 GRPO算法相较于OpenAI的PPO进行了大幅简化,去除了Value Function和 Reward Model,有效减少计算资源的消耗,并规避了奖励欺骗(Reward Hacking)问题,其奖励机制回归到最基础的规则设定,例如通过答案准确度(Accuracy)作为反馈标准。

 从学科发展的角度来看,张教授认为,DeepSeek的创新为计算机科学、理工科及人文社科研究提供了重要启示。科研范式正加速迈向AI驱动的智能化科研时代(AI for Research),AI在数学、物理、化学、材料科学及生物学等领域的应用日益深化,同时在人文社科研究中,AI 有望推动从定性研究向定量分析的转变,并加速开放文献数据库、可视化工具及同行评议机制的构建,以提升研究的科学性和可信度。

 信息学院李锡荣教授从用户视角分析了DeepSeek对大模型发展趋势的影响、技术与数据“有效积累”的重要性及大模型幻觉问题。他指出,DeepSeek的成功为我们提供了现实案例——通过更高效的架构和技术创新,在不依赖极端算力的情况下,依然能够训练出具有竞争力的大模型。这一模式突破了传统大模型“赢者通吃”的认知,为更加开放、多元的大模型生态开辟了新的发展路径。

 DeepSeek的成功不仅源于算法创新,还依赖长期的技术与数据“有效积累”。其训练过程充分利用了开源资源,并通过严格的数据清洗确保高质量输入。DeepSeek证明了开源路线的优势,并印证了Meta首席科学家杨立昆的观点:DeepSeek的成功是开源生态的胜利,而非单纯的技术竞赛,呼吁更多学术和产业界推动技术开放与共享。

 最后,李教授提醒,大模型幻觉问题将直接影响AI的可靠性和安全性。幻觉的成因包括视觉编码器能力不足、文本与视觉信息冲突以及世界知识偏差,这可能导致模型在推理时忽视实际内容,给出错误答案。随着大模型成为主要信息入口,减少幻觉、提高可信度和可解释性将成为AI发展的关键方向。

 苏州人工智能学院于秀宾工程师首先通过之前项目经历论述了DeepSeek早年在小众代码生成领域的出色表现,对项目成功交付起到了关键作用。

 于秀宾从产业及生态角度分享了自己的几点思考:第一,DeepSeek的成功改变了人们对人工智能发展路径的看法,大型模型也可以在能耗较低的硬件上运行,为AI技术的普及与应用开辟了全新的可能性;第二,开源模型的发展对闭源模型构成了挑战,可能影响相关企业的商业模式,同时因开源与低成本的优势引发股价与市值的变化;第三、开源模式推动全员参与和机会平等,促成“All in AI现象”。第四,AI落地应用将加速,短期垂类模型会加速涌现,长期通用模型的能力更强,可能占主导地位。第五,AI推理往端侧迁移会加速,端侧设备的计算能力加强,将会在技术层面、端侧产业、社会经济及生活方式产生深远影响。

 苏州人工智能学院冯媛工程师从DeepSeek模型发展历史角度介绍其发展过程、里程碑能力,包括从第一代LLM、到MoE、Math、V2、V3,再到R1,每个版本都有能力跃升。

 冯媛总结了DeepSeek通过核心几项软实力突破了硬件的约束,对我们的技术及工程工作有很大启发:第一,优化技术架构以降低训练推理成本;第二,通过算法创新以提升训练效果;第三,通过工程优化以降低训练成本;第四,通过新路线探索以提高推理能力。

 DeepSeek的成功,数据仍是核心要素。数据的重要性包括:数据质量决定模型的质量,数据量影响模型泛化能力,通过挖掘数据中的逻辑链提升模型的推理能力,通过专有领域的知识增强来减少幻觉等。

 最后,冯媛提出“AI+智慧治理”发展展望。通过利用DeepSeek对现有知识、案例进行梳理,利用优质的治理长思维链数据冷启动,基于DeepSeek合成更多的数据来强化学习,从而打造智慧治理垂域模型。

 创新平台尹珺工程师从实际项目案例出发,论述DeepSeek-R1模型在法学领域的能力与局限。

 首先,尹珺通过一个法学经典任务来对比DeepSeek-R1和ChatGPT o3的表现,发现DeepSeek-R1更为擅长推理分析,而Chatgpt缺少部分知识及相关的推理能力。

但同时DeepSeek距离“可信”仍有提升空间。尹珺结合相关研究指出,如何得到高质量的、跟自己领域相关的COT数据,是正确推理的关键步骤。

 尹珺总结DeepSeek在法学领域的应用。在法学研究方面,通过部署DeepSeek模型,可以提升法律文献与案例分析的效率,也可用于跨国法律的对比,为学术研究提供支持。在法律实务方面,大模型可用于合同审查与风险评估、诉讼策略模拟、法律意见书、法律咨询等场景。未来可能通过不同Agent串联的模式来完成更为复杂的法律任务。

 最后,尹珺提出法学方向未来模型优化思路:一方面结合法学领域知识,进一步提升模型的专业性和稳定性;一方面结合更多法律大数据,进一步优化链式推理能力,解决法律上的幻觉问题。

 创新平台龚新奇教授分享了近三年大模型在健康计算领域的丰硕成果。他通过一系列典型案例,展示了人工智能技术在生物医学领域的广泛应用,如蛋白质结构预测、疫苗设计、靶标基因筛选以及核酸药物研究等。龚新奇指出人工智能技术在计算生物医学、计算健康领域发挥了重要作用,通过整合大数据,打破传统科学细分领域壁垒,解决传统学科问题。

 首先,龚教授从2024年诺贝尔化学奖谈起,详细介绍AlphaFold模型如何将生物医学数据进行整合,以计算不同类分子(如蛋白、基因、糖、金属离子等)之间的相互作用。他指出,人工智能作为一种新一代技术手段,有效整合了原本分散于不同领域的人力与工具资源,在极短时间内攻克了预测蛋白质复杂结构这一困扰科学界数十年的难题。

 随后,龚教授列举了多个在Nature、Science、PNAS等顶刊上发表的人工智能与计算生物医学结合的成功案例,其中不乏人大的杰出成果。

 最后,龚教授提出倡导,应充分发挥人大在健康计算领域的实力与潜力,同时结合学校在人文社科领域的优势,整合跨学科资源共同推动大型科研项目的研究与发展。

 圆桌讨论环节由创新平台执行主任陈跃国教授主持,专家们围绕AI技术与人文社会科学的深度融合进行了深入探讨。与会者一致认为,人大应充分利用现有的大模型基础,结合学校特色学科,尤其是人文社科领域,推动学科研究与教学模式的创新。在AI赋能学术研究的过程中,高质量数据集的建设至关重要,应充分发挥人文社科专家的专业优势,推动跨学科合作,探索科学高效的数据集构建方法,并结合 DeepSeek等模型进行强化学习和智能化训练,以提升 AI 在专业研究领域的应用价值。

 本次讨论不仅聚焦技术与学科结合的实践路径,还深入探索了未来跨学科合作的新模式。与会者期待,人工智能的创新应用能够为学术研究提供更加精准、高效的研究工具,进一步推动人大各学科的持续发展。


邮箱:brain@ruc.edu.cn
官网:http://brain.ruc.edu.cn

地址:中国人民大学公共教学一楼三层1301

扫码关注