博物館典藏與研究資料蘊含高度知識密度,具有做為生成式AI 語料開發之潛力。本文參考上下文學習方法,提出一套基於文物詮釋資料之語料生成架構雛形。第一階段以故宮文物詮釋資料中的「說明文」與「出版紀錄」欄位為語意擴展基礎,推導並補全「質材」、「紋飾」、「色澤」等欄位內容,建立初步的語意對應關係。第二階段則進一步結合《故宮文物月刊》等研究資源,自其中擷取具代表性的詮釋語句與描述語料,建構具國立故宮博物院(以下簡稱故宮)特色的語料訓練資料集。經由格式轉換與語義調整,該資料集可投入大型語言模型之微調或檢索增強生成應用,除可支援多語系展件/展覽導覽服務外,亦能語意、圖形化等技術優化跨文物、跨時期與跨類型的語意理解與互動應用。