CBT-LLM 心理大模型微調，用 LLaMA Factory 微調框架就夠啦！| 附一鍵復現指南詳情 - 人工智能,llm Lab4AI 博客

圖片1.png

01 | 引入

在人工智能快速發展的今天，通用大語言模型雖然具備強大的語言理解和生成能力，但在專業領域服務時往往顯得力不從心。以心理健康支持為例，普通預訓練模型無法理解"共情"深層含義，難以給出符合認知行為療法(CBT)原則的專業建議，導致回答要麼過於機械，要麼缺乏針對性。

僅靠通用模型無法實現"懂情感、會共情"的高質量心理支持，必須通過高質量數據集微調才能實現專業場景的精準適配，將通用語言能力轉化為專業領域知識。而LLaMA Factory作為當前最高效的微調框架之一，為這一過程提供了重要支持。

02 | LLaMA-Factory 微調在論文中的體現

論文： CBT-LLM: A Chinese Large Language Model for Cognitive Behavioral Therapy-based Mental Health Question Answering
會議： COLING 2024
鏈接： [2403.16008] CBT-LLM: A Chinese Large Language Model for Cognitive Behavioral Therapy-based Mental Health Question Answering
Hugging Face 鏈接： Hongbin37/CBT-LLM · Hugging Face
Lab4AI 論文一鍵復現：** Lab4AI 項目頁

這篇發表於2024年計算機語言學頂會LREC-COLING的論文CBT-LLM: A Chinese Large Language Model for Cognitive Behavioral Therapy-based Mental Health Question Answering，通過心理問答數據集PsyQA和CBT提示模板，引導ChatGPT生成CBT嚮導的回答，構建為CBT QA數據集，並用於微調CBT-LLM。核心目標是結合PsyQA數據集的知識與CBT模板，通過ChatGPT的橋樑作用，構建擅長CBT問答的語言模型。

圖片2.png

此研究使用了LLaMA-Factory高效模型訓練微調框架，使用了添加系統指令的 CBT QA 數據集，選取了LLaMA-Chinese-7B、Alpaca-Chinese-7B、Qwen-7B、Baichuan-7B 作為基線模型，並使用 BLEU、METEOR、CHRF、BLEURT 評估微調模型的效果。

從數據可見，經 LLaMA-Factory 微調後，各基線模型在心理健康問答任務中均展現出良好性能，其中 Baichuan-7B 在 BLEU、METEOR、CHRF、BLEURT 等指標上表現最優，體現出模型在回答結構完整性上的優勢，證明 LLaMA-Factory 的微調能力可有效提升模型對 CBT 框架的貼合度。

圖片3.png