tag 文檔

標籤
貢獻19
126
07:48 AM · Nov 04 ,2025

@文檔 / 博客 RSS 訂閱

合合技術團隊 - 文檔解析技術發展回顧與路徑思考

隨着全球數字化進程的加速,非結構化數據量呈現爆炸式增長,從紙質文檔到電子文件的轉變不僅意味着信息存儲方式的革新,更標誌着舊數據被賦予了新的生命力。文檔智能技術的發展使得大量以傳統形式保存的信息資源能夠“活化”再利用,這些技術將圖像、手寫筆記等非結構化數據轉化為計算機可處理和理解的結構化格式,從而極大地拓展了數據的應用場景。得益於深度學習算法的進步,文檔解析技術在文檔數字化、票據自動化處理、筆跡錄入

ocr , aigc , 人工智能 , 文檔

收藏 評論

合合技術團隊 - 開源Embedding模型,有效提升中文語義理解與召回

此前,我們已經簡單介紹了TextIn團隊開發的開源acge_text_embedding模型及其下載和使用方法。本篇將展開討論Embedding模型中使用的技術框架。 Huggingface地址:https://huggingface.co/aspire/acge_text_embedding 模型API調用:https://www.textin.com/market/detail/ac

開源 , 文檔 , 大模型

收藏 評論

大丸子 - 用Python創建、讀取和修改Word文檔

自動化文檔處理是提升工作效率的關鍵路徑之一,而Python憑藉其簡潔語法和豐富的生態工具鏈,是實現文檔自動化處理的理想工具。通過編程手段批量生成結構規範的合同模板、動態注入數據分析結果生成可視化報告,或是快速提取海量文檔中的關鍵信息,這種代碼驅動的工作流不僅消除了人工重複操作帶來的誤差風險,更將文檔處理從機械勞動升級為可擴展的智能系統。本文將介紹如何使用Python實現Word文檔的創建、讀取及修

word , 文本處理 , 文檔生成 , 文檔 , Python

收藏 評論

合合技術團隊 - 文檔數字化採集與智能處理:圖像彎曲矯正技術概述

由於電子文檔更容易存檔、編輯、簽名和共享的特點,文檔電子化的趨勢逐年顯著,而隨着高質量攝像頭在手機等移動設備上的普及,利用移動設備對文檔進行數字化採集已經非常普遍。 移動設備讓每一位使用者能夠便捷採集文檔圖像,不過,這也使原始文檔圖像的情況變得複雜多變:頁面彎曲、陰影遮擋、摩爾紋、圖片模糊、字跡不清晰等問題都是文本圖像處理中常見的干擾狀況,阻礙了文檔的智能化處理,導致OCR識別、信息提取、版

圖像識別 , 圖像處理 , 算法 , 文檔

收藏 評論

合合技術團隊 - 用AI“讀懂”專業文檔資料,合合信息助力出海企業規避侵權“陷阱”

近年來,在“走出去”政策支持下,企業出海持續升温。根據中國上市公司協會數據,2024上半年我國上市公司實現海外業務收入3.83萬億元,同比增長12.84%。隨着出海規模不斷擴大,企業跨國間的交流也變得日益頻繁。為了應對提交出口產品註冊資料、製作海外項目競標標書等場景,合合信息智能文檔處理技術助力企業解析、翻譯電子文檔,推進出海項目進程。 中企出海,應對合規審查是第一關。企業需要處理的文檔不僅

ai開發 , 人工智能 , 文檔

收藏 評論

xinxingli - 樹莓派中文文檔網站上線了

樹莓派作為一個單片機電腦,從第一款發佈到現在的樹莓派4,已經走過了8年的時間。8年裏,樹莓派不斷更新升級,逐漸得到了全世界的認可。現在可以在互聯網上搜到很多的樹莓派文章,但都比較散,沒有系統。官方的文檔又是英文,並且訪問速度比較慢。 為了方便學習樹莓派,更加快捷的上手樹莓派,查找樹莓派的資料,科技愛好者博客基於 Vuepress 開發了樹莓派中文文檔,系統的對樹莓派進行介紹。 名稱:樹莓派中文文檔

raspberry-pi , 開源硬件 , vuepress , 文檔

收藏 評論

謙虛好學的山寨機_bS4sGd - 基於oracle linux的 DBI/DBD 標準化安裝文檔.

一、安裝DBI DBI(Database Interface)是perl連接數據庫的接口。其是perl連接數據庫的最優 方法,他支持包括Orcale,Sybase,mysql,db2等絕大多數的數據庫,下面將簡要 介紹其安裝方法。 1.1解壓 tar -zxvf DBI-1.616_901.tar.gz 1.2安裝依賴 yum install perl-ExtUtil

文檔

收藏 評論

陌上 - Salesforce原生PDF編輯的重要性:效率、合規性與用户體驗

PDF文件在企業運營中扮演着核心角色,尤其是在需要正式文檔、合同和報告的場景中。對於依賴Salesforce作為其核心客户關係管理(CRM)平台的企業來説,處理PDF文檔是日常工作的重要組成部分。然而,Salesforce原生的PDF編輯能力缺失,給企業帶來了效率低下、合規風險和用户體驗不佳等一系列挑戰。 本文將探討Salesforce中原生PDF編輯為何至關重要,並重點闡述它在效率提升、確保合規

pdf , salesforce , 文檔 , salesforce-lightning

收藏 評論

sanri1993 - 自託管的高效團隊協作平台:zyplayer-doc

一、zyplayer-doc是什麼 zyplayer-doc是一款適合企業和個人使用的WIKI知識庫管理工具,專為私有化部署而設計,最大程度上保證企業或個人的數據安全,支持以內網的方式來部署使用。 支持將編寫的文檔一鍵發佈為企業產品的幫助文檔,支持以單文檔、目錄、空間、文集的方式開放至互聯網,可用於獨立的幫助中心站點,嵌入自有產品、APP、小程序或微信公眾號菜單中用作幫助文檔,或者用於展廳、大屏中

文檔

收藏 評論

mb689bf7a82caf3 - 程序化生成PDF:C#開發者實用指南

在現代軟件應用中,PDF文檔因其跨平台、內容固定性強以及易於分享的特性,扮演着不可或缺的角色。從生成報告、發票到電子合同,程序化地創建和管理PDF文檔已成為許多C#開發者的日常需求。但是,如何高效、靈活地使用C#編程語言,將動態數據轉化為高質量的PDF文檔,同時實現複雜的內容佈局(如文本、圖片、形狀和表格)呢? 本文將深入探討如何利用C#強大的能力,結合一款功能豐富

插入圖片 , yyds乾貨盤點 , 數據 , pdf , 後端開發 , .net , 文檔 , c

收藏 評論

落花流水人家 - docx格式的文件直接修改為doc格式 使用java解析失敗

在以前的項目裏為了寫作方便,總是以word文檔的方式提供架構和設計文檔,帶來的好處僅僅是自己寫作起來較為方便,但帶來的麻煩卻有很多,比如: 更新文檔較為麻煩。 他人瀏覽較為麻煩,特別當需要從docx轉換到doc的時候。 很難形成與其他文檔的聯繫。 難以協同合作 以上的缺點導致很不好的後果:設計有了更新

語言 , 測試 , 後端開發 , 開發人員 , JAVA , 文檔 , 寫文檔

收藏 評論