【時間】2025年3月13日(周四)下午14:30 開始
【地點】線下講座,9B406會議室
【主題】面向視覺大模型的多任務混合推理優化技術
【主講人及介紹】
吳加其博士,2019年在廣西大學數學與信息科學學院獲得碩士學位,2020年入學哈爾濱工業大學(深圳)電子與信息工程學院。主要從事網絡通信、人工智能、博弈論和經濟學交叉學科研究工作。研究成果發表國際期刊和會議論文多篇。
【内容簡介】
随着通用人工智能的飛速發展,視覺大模型因其能夠根據用戶指令生成高質量的視覺内容,正逐漸成為研究熱點。然而,在資源受限的邊緣計算網絡中,如何高效地進行視覺大模型任務的推理成為亟待解決的問題。本報告首先介紹了視覺大模型的現實應用與底層模型架構,分析了其面臨的主要挑戰。其次,研究了如何選擇合理的推理步數,并在質量、時延與能耗之間實現有效的權衡,從而設計出獨立推理優化方案。最後,報告探讨了如何利用不同用戶之間的意圖相似性進一步優化推理流程,減少資源消耗,提出了混合推理優化方案,以實現更高效的資源調度與推理處理。
誠摯歡迎廣大師生參加。