商業大數據教育聯盟文字分析平台實體操作—進階文字探勘工作坊(II)

由國立中山大學管理學院召集的「商業大數據教育聯盟」於111年4月15日開辦今年度第二場培訓活動,本次主題為《文字分析平台實體操作—進階文字探勘工作坊》,現場有來自屏東大學的師生與《文字探勘與數位轉型與服務產學聯盟》計畫企業代表、及來自高雄師範大學及正修科技大學的教授及採用該平台進行實務演練的企業代表同步於線上共同參與學習與交流。

本次的工作坊為文字分析平台實體操作的第二階段,同樣在黃三益教授團隊的蔡易航博士生授課和兩位助教的協助下,帶領所有參與人員先就〈進階情緒分析〉進行學習,讓大家瞭解透過Lexicon Based 與 Corpus based兩種方式產出的結果進行練習與說明,也跟學員介紹了關於情緒文句的句法結構。接著說明如何透過平台進行〈主題模型〉的訓練,包括參數設定與模型評估,讓學員有基本的認識與了解如何進行一份文件包括多個主題時的操作,該部分並提到,若在實務上資料量相對龐大時,可透過其他深度學習的工具輔助,在維持同樣精準度下讓處理速度加快;透過分析結果所呈現的圖表,可以清楚的看出在相同文件資源下就不同主題參數設定的分析結果進行判讀與解析。最後講解〈文件分類〉和操作相關的流程,讓學員們動手訓練一個文字資料的分類模型並實際部署。

透過兩次共6小時的學習其實只是一個基礎的認識,原本在正式課程中有完整18小時的內容安排,黃三益老師期許學員老師可以多練習增加孰悉度,並且在後續練習中可以利用該平台產出研究成果,也歡迎提出來與大家分享,並一同創造出具有商業價值的研究與實作。