近日,由香港寬頻集團成員HKBN JOS主辦的“HKBN JOS Solution Day 2025”在澳門隆重舉行。本次大會以“智創先行、成果共創”為主題,匯聚了全球科技領域的領軍企業、行業專家及資深從業者,共同探討人工智能技術在企業數字化轉型中的創新應用與實踐成果。

合合信息亮相澳門HKBN JOS Solution Day,分享企業知識庫建設新路徑_數據

大會上,合合信息智能解決方案事業部總經理李明發表了《如何利用AI為企業建立內部知識庫》主題演講,深度解析非結構化數據激活路徑,分享了合合信息在企業知識庫建設領域的全套AI解決方案。

合合信息亮相澳門HKBN JOS Solution Day,分享企業知識庫建設新路徑_數據_02

他首先指出了當前企業在知識庫建設中面臨的核心痛點。“企業每天生成的大量數據中,有很大一部分被鎖定在PDF、Word、圖像等非結構化文檔中,這些‘沉睡的數據’無法被高效利用,成為制約企業數字化轉型的關鍵瓶頸。”傳統知識庫建設存在文檔格式繁雜、信息抽取困難、檢索效率低下、維護成本高昂等問題,而AI技術的發展為解決這些痛點提供了全新可能。

基於合合信息在人工智能領域的多年技術積累,李明詳細闡述了AI驅動企業知識庫建設的實現路徑。合合信息旗下TextIn平台提供文檔智能處理能力矩陣,突破了傳統文檔處理的版式限制,無論是多語言文檔、水印文檔、混合表格還是長文檔,都能實現高效精準的解析,針對企業知識庫建設的核心需求,可完成目錄層級識別、頁眉頁腳處理、段落合併、表格識別、印章檢測、公式提取、水印去除等多項關鍵操作,將複雜格式的文檔轉化為結構化數據,為 LLM 應用提供高質量的語料支撐。

為了讓現場嘉賓更直觀地瞭解方案應用價值,本次演講還分享了多個典型場景案例。在企業級知識庫構建場景中,很多企業想要將科研文檔、合同文檔、生產文檔、質量標準文檔、售後文檔等各類知識資產轉化為內部知識庫,面臨着多源數據、文檔格式多樣、生產環境中的準確性問題、大模型幻覺、數據同步等各種問題。TextIn文檔解析支持多格式、多元素、多語言解析,能很好地解決開源工具無法處理的跨頁表格、行列密集表格還原等難點,幫助企業構建結構化、可複用的專業知識庫。

合合信息亮相澳門HKBN JOS Solution Day,分享企業知識庫建設新路徑_數據_03

另外,在數據治理場景中,TextIn平台可實現金融報告、國家標準、學術論文、招投標文件等各類文檔的語料清洗與信息抽取,大幅提升數據治理效率;在財務審核場景中,可解析抽取發票、合同等各類財務文檔的關鍵字段,實現費用報銷、採購應付等多場景的智能審核。產品還可應用於文檔翻譯、招投標文件結構化處理、物流單據智能錄入、生產製造文檔管理等多個端到端場景。

作為多模態大模型文本智能技術的領先者,合合信息在本次大會上不僅展現了其在智能文檔處理領域的技術實力,也為企業知識庫建設提供了切實可行的解決方案。未來,合合信息將持續深耕AI技術研發,不斷豐富解決方案的應用場景與功能體驗,助力更多企業激活非結構化數據價值,加速數字化轉型進程。

合合信息亮相澳門HKBN JOS Solution Day,分享企業知識庫建設新路徑_結構化_04