南京農業大學正式發佈司農大語言模型(Sinong)。該模型是國內首個面向通用農業領域的開源垂直大語言模型,同時也是南京農業大學主導研發的首個農業領域大語言模型。
據介紹,“司農”的命名取自中國古代財政與農業管理官職體系,卓越性能源於南京農業大學深厚的農業學科底藴與大規模、高質量的農業領域數據基礎。研究團隊依託學校農業領域頂尖學科優勢,收集了包括動物科學、農業經濟管理、農業資源與環境、園藝學、智慧農業、動物醫學、植物保護、作物育種等細分學科數據,總量超過40億token的農業領域專業數據,涵蓋了近9,000冊書籍、24萬餘篇學術論文和近2萬份政策、標準以及海量網絡知識,構建了體系相對完整、質量過硬的農業基礎數據集。
| 數據類型 | 數據樣例 |
|---|---|
| QA | "instruction": "在人多地少、耕地後備資源不足的背景下,如何借鑑中國古代‘精耕細作’傳統提升單位面積糧食產量,且避免過度投入導致的生態退化?","output": "應採取‘三才’統籌的精耕細作模式:一是因地制宜優化耕作制度,..." |
| COT-QA | "instruction": "宋代南方水田農業中出現了哪些新型農具?這些農具如何促進了水稻種植效率的提升?",“output”: \n好的,我現在需要回答用户的問題:“宋代南方水田農業中出現了哪些新型農具?這些農具如何促進了水稻種植效率的提升?”……\n宋代南方水田農業中出現的新型農具包括:……" |
| Incontext-QA | "instruction": ""小麥紋枯病的發生與温濕度、栽培措施及品種抗性如何交互影響,導致其在不同生育階段呈現動態發展規律?\n\n小麥和大麥種子萌發後……",“output”:小麥紋枯病的發生與温濕度、栽培措施及品種抗性三者交互影響,共同決定其在不同生育階段的動態發展規律,具體表現為:\n\n1. 温濕度主導病害發展節律: \n 病菌侵染和擴展受温度顯著調控。冬前(10℃以下)病害發展緩慢,僅零星發生;翌春氣温回升至15℃以上時,病害加速擴展,20~25℃為最適發展温度,此時病株率與嚴重度急劇上升,尤其在拔節至孕穗期達高峯;30℃以上病害基本停滯。同時,春季低温多雨…… |
| Incontext-COT-QA | “instruction”: “中國百強農業對外投資企業在投資規模、區域分佈與行業結構上呈現出哪些顯著特徵,反映了我國農業“走出去”戰略的何種優先導向?\n\n2015年,中國對外農業投資100強企業(以下簡稱百強企業”)對外投資30.61億美元,佔投資流量總額的84% ;截至2015年底,累計投資達111.96億美元,佔比86.6% ;在58個國家和地區共設立農業企業194家,佔境外農業企業總數的25.4% ;營業收入達418.38億美元,佔所有企業營業收入的 94.6%。可見,儘管百強企業數量佔比不高,但在投資規模、經營效益等方面……",“output”:"\n好的,我現在需要回答用户的問題,關於中國百強農業對外投資企業在投資規模、區域分佈與行業結構上的顯著特徵,以及這些特徵反映的農業“走出去”戰略的優先導向。首先,我需要仔細閲讀用户提供的參考材料,從中提取關鍵數據,並進行歸納總結。\n\n首先看投資規模部分。2015年百強企業對外……\n中國百強農業對外投資企業在投資規模、區域分佈與行業結構上的顯著特徵及其反映的農業“走出去”戰略優先導向如下:\n\n---\n\n### 一、顯著特徵\n1. **投資規模集中化……" |
模型開源及使用
魔塔社區開源地址:https://modelscope.cn/organization/NAULLM
GitHub社區開源地址: https://github.com/njauzzx/Sinong