返回列表 發布時間:2025-03-13

學術活動預告:電智學術論壇之智能自動化學科(2025年3月13日)

【時間】2025年3月13日(周四)下午14:30 開始

【地點】線下講座,9A103會議室

【主題】deepseek-r1模型介紹及其訓練方法研究

【主講人】蘇航博士

【内容簡介】

     近年來,大語言模型在文本生成、對話等任務中展現了強大能力,但在需要嚴格邏輯推理的場景(如數學證明、代碼生成)中仍存在顯著缺陷。如何提升大語言模型的複雜推理能力并保證推理過程的可解釋性,成為亟待解決的關鍵問題。為解決此問題,推理語言模型應運而生,然而大規模的推理語言模型需要更大規模的監督學習數據和計算資源。DeepSeek-R1通過更加存粹的強化學習方法重塑了大語言模型推理能力的訓練方法基準。使模型能夠自主學習和發展推理行為,其第一代模型DeepSeek-R1在性能上已達到甚至超越 OpenAI 等前沿專用系統的水平,樹立了新的行業基準。并且DeepSeek通過新的知識蒸餾技術,将先進的推理能力遷移到更小、更高效的模型中,使強大的人工智能變得更加易得且經濟高效。這種對可擴展性和效率的雙重關注,使得 DeepSeek 成為了推動國内大模型AI發展的重要力量。本次講座将基于DeepSeek-R1的原論文内容探讨其訓練方法。

   



誠摯歡迎廣大師生參加。