博客 RSS 訂閱

合合技術團隊 - 文檔解析技術發展回顧與路徑思考

隨着全球數字化進程的加速,非結構化數據量呈現爆炸式增長,從紙質文檔到電子文件的轉變不僅意味着信息存儲方式的革新,更標誌着舊數據被賦予了新的生命力。文檔智能技術的發展使得大量以傳統形式保存的信息資源能夠“活化”再利用,這些技術將圖像、手寫筆記等非結構化數據轉化為計算機可處理和理解的結構化格式,從而極大地拓展了數據的應用場景。得益於深度學習算法的進步,文檔解析技術在文檔數字化、票據自動化處理、筆跡錄入

ocr , aigc , 人工智能 , 文檔

收藏 評論

LaughingZhu - DevNow x Notion

前言 Notion 應該是目前用户量比較大的一個在線筆記軟件,它的文檔系統也非常完善,支持多種文檔格式,如 Markdown、富文本、表格、公式等。 早期我也用過一段時間,後來有點不習慣,就換到了 Obsidian ,但是身邊人用的還是很多的,隨着 Astro 5.0 的發佈,在內容集成上也提供了更多的方向,這期就來聊聊 DevNow 對 Notion 的支持。 1.Notion 設置 1.1 創

astro , 博客 , 前端

收藏 評論

vistart - pytest如何在執行功能測試時排除壓力測試

如果要在pytest執行功能測試時排除壓力測試,併為未來可能添加的其他壓力測試文件提供擴展性,可以採取以下幾種方式,分別討論它們的優缺點: 一、 在壓力測試代碼中添加標記 使用 pytest.mark 給壓力測試文件或測試用例添加自定義標記,比如 @pytest.mark.stress。 實現步驟 在壓力測試文件中添加標記: import pytest @pytest.mark.stres

持續集成 , 配置 , 測試 , 壓力測試 , pytest

收藏 評論

百度Geek説 - 百度垂搜一站式研發平台演進實踐

導讀 百度垂搜架構歷經多年發展,內部沉澱了多個開發者平台\工具,涉及覆蓋了搜索系統的多個階段模塊,如何高效地串聯繫統全流程,為業務提效提質,可靠的工程化基建和更上層的抽象設計是關鍵。本文闡述了百度垂搜一站式研發平台(經天)的思考和探索過程,以及如何通過FaaS機制和SaaS服務產品化來為業務提效提質。 01背景 百度垂搜架構團隊為數十個業務線的上百個搜索場景提供全鏈路的技術支持,經過多年的發展,內

saas , 搜索 , 架構 , 百度

收藏 評論

Yujiaao - 大量向量之間的漢明距離常見的索引辦法

當需要求大量向量之間的漢明距離時,以下是一些常見的索引辦法: 基於哈希的方法 局部敏感哈希(LSH):它是一種常用的近似最近鄰搜索方法,通過將高維向量映射到低維空間中的哈希桶中,使得相似的向量以較高的概率落入相同或相近的哈希桶中。在計算漢明距離時,可以先通過 LSH 快速篩選出可能相似的向量對,然後再精確計算它們的漢明距離,從而大大減少了需要進行精確距離計算的向量對數量,提高了計算效率。 多表哈希

hash

收藏 評論

用户bPbhIAe - Java 中的這個絕對值有點不絕對啊!

現象 假如有如下代碼定義了一個方法 test(),它入參可以任何一個 int 類型的整數,那麼它輸出結果可能是什麼? public class Test { public static void test(int a) { System.out.println("The result of absolute value compare to zero is:" +

補碼 , 二進制 , 溢出 , 後端

收藏 評論

極限實驗室 - Easysearch Java SDK 2.0.x 使用指南(二)

在 上一篇文章 中,我們介紹了 Easysearch Java SDK 2.0.x 的基本使用和批量操作。本文將深入探討索引管理相關的功能,包括索引的創建、刪除、開關、刷新、滾動等操作,以及新版 SDK 提供的同步和異步兩種調用方式。 SDK 的對象構建有兩種方式 1. 傳統的 Builder 方式 最基礎的方式,像這樣: CreateIndexResponse createResponse =

client , sdk , 數據庫

收藏 評論

LaughingZhu - Doc for DevNow

前言 DevNow 是一個精簡的開源技術博客項目模版,支持 Vercel 一鍵部署,支持評論、搜索等功能,歡迎大家體驗。 🎉🎉 首先慶祝下 DevNow star 在不久前過百,對我來説還是蠻有成就感的,感謝大家的支持。 文檔 之前收到一些朋友私信問關於 DevNow 部署和一些配置的問題,陸陸續續發了幾個相關的文章,但是當文章多了的時候就會不容易查找,所有這兩天就整理了下相關的內容,輸出了

astro , 博客

收藏 評論

HelpLook - ⏰最後7️⃣天!HelpLook 【年終大促】收官在即

🥳訂閲 HelpLook 套餐,年付打折,還送使用期! -買360天套餐,打8.5折,再送30天額外時長 -買720天套餐,打8️⃣折,再送90天額外時長 👉 聯繫人工客服兑換專屬福利!🎁 👤 活動對象:新老用户均享優惠 ⏰ 活動時間:2024.12.02 - 2024.12.31 🔗活動詳情:HelpLook感恩回饋 | 年末訂閲,最高再送90天額外時長!

企業網站 , 知識庫管理 , 知識庫軟件 , 人工智能 , 博客搭建

收藏 評論

TANKING - Mac抓包軟件Charles抓包安卓CA證書安裝(Android 7以上需ROOT權限)小米8青春版刷開發版獲得ROOT權限

摘要 最近在研究Android的抓包,需要使用Charles打斷點,因此需要配置本地代理去抓取Android的Https流量,那麼需要在Android手機上安裝CA證書,並且Android 7以上的系統是隻信任系統證書,因此得想辦法將抓包軟件的CA證書搞到Android系統證書列表內才可以正常使用,那麼這就需要ROOT權限去將證書文件搬到系統目錄內才可以實現。 準備 小米8青春版 miui開

ssl證書 , Android , root , 抓包過濾 , charles

收藏 評論

極限實驗室 - INFINI Labs 產品更新 | Console/Gateway/Agent 等產品開源發佈首個版本

INFINI Labs 產品又更新啦~,包括 Easysearch v1.9.0、Gateway、Console、Agent、Loadgen v1.27.0。本次各產品更新了很多亮點功能,如 Easysearch 優化了多版本兼容配置;Console/Gateway/Agent/Loadgen 及 Framework 開源後,發佈首個重大更新版本,支持過期元數據刪除,指標圖表懶加載,指標採集協程

console , agent , gateway

收藏 評論

jueqiangdeguantangbao_pxo4q - 升級AMH7.1後,無法升級其他組件和軟件的解決

在升級AMH7.1後無法升級其他組件和軟件,可能是由於系統或依賴問題導致的。你可以按照以下步驟進行排查和操作: 1. 檢查依賴和衝突 確認在升級AMH7.1之後,是否有其他組件或軟件與其發生衝突,尤其是與PHP、MySQL、Nginx/Apache等相關的版本問題。查看錯誤信息,查找可能的依賴問題。 執行以下命令查看已安裝的組件版本: amh -v 這將顯示AMH的當前版本,確保它和你的其他組件兼

webkit

收藏 評論

阿爾的代碼屋 - [開發技巧] 如何獲取漢字筆畫數?

[開發技巧] 如何獲取漢字筆畫數? 背景 在開發一個簡單的卜筮小腳本的過程中,遇見了這個有趣的問題。如果只是特定個別漢字,我們大可以硬編碼一個字典在腳本中,但是如果想獲取任意一個漢字的筆畫數呢? pypinyin庫 from pypinyin import pinyin, Style def get_strokes_count(chinese_character): pinyin_lis

技巧 , Python

收藏 評論

阿落ovo - 華為ensp--BGP路徑選擇Community

學習新思想,爭做新青年,今天學習的是BGP路徑選擇Community 實驗目的 ·理解團體屬性的概念與作用 ·熟悉運用團體屬性來控制路由傳遞的方法 ·理解 No-Export、No-Advertise、No-Export-Subconfed 屬性的區別 實驗內容 本實驗網絡中,R1 屬於 AS 100,R2、R3 和 R4 屬於 AS 編號為 200 的一個聯盟,R5

華為 , bgp , 路由

收藏 評論

卷福同學 - 分佈式系統架構5:限流設計模式

分佈式系統架構5:限流設計模式 這是小卷對分佈式系統架構學習的第5篇文章,今天來學習限流器和限流設計模式 1.為什麼要限流? 任何一個系統的運算、存儲、網絡資源都不是無限的,當系統資源不足以支撐外部超過預期的突發流量時,就應該要有取捨,建立面對超額流量自我保護的機制,而這個機制就是微服務中常説的“限流” 2.四種限流設計模式 説到限流,大家直接的想法就是Sentinel,但是Sentinel限流的

限流 , 設計模式 , 分佈式系統 , JAVA , 分佈式

收藏 評論

codists - 《計算機組成及彙編語言原理》閲讀筆記:p9-p27

《計算機組成及彙編語言原理》學習第 2 天,p9-p27 總結,總計 19 頁。 一、技術總結 1.quantum physics(量子物理學) (1)quantum(量子) quantum的本意是:c. the smallest amount of sth(量子)。 In physics, a quantum is the minimum amount of any physical entit

計算機

收藏 評論

藍易雲 - MySQL查詢語句大全

常用的 MySQL 查詢語句示例 MySQL 是常見的關係型數據庫管理系統,廣泛應用於數據存儲、查詢和管理。為了更高效地操作數據庫,掌握常用的查詢語句非常重要。本文將介紹一些基本的 MySQL 查詢語句,涵蓋了常用的查詢、更新、刪除操作,以及如何使用聚合函數和連接查詢。 1. 基本查詢 查詢所有記錄 SELECT * FROM table_name; 説明:* 表示選擇表中的所有列。此語句將

redis , nosql , mongodb , yaml , xml

收藏 評論

clklog - ClkLog埋點分析系統集成指南

為了讓大家能更順利地完成ClkLog的各項數據集成,我們總結了幾項常見問題並做了詳細的説明。 包括有:會話、瀏覽頁面事件、用户集成、自定義事件等。 希望大家通過以下説明能快速定位並處理問題。 一、基礎事件集成 在使用ClkLog作為神策SDK(如WEB JS、AndroidiOS、React-Native等客户端)的數據接收端時,需注意以下幾點 1.1.會話集成 ClkLo

sdk , 埋點 , 自定義 , 開源

收藏 評論

大丸子 - 用Python設置Excel工作表的頁眉和頁腳

在處理和分析數據時,Excel作為一款功能強大的工具,被廣泛應用於各個領域。當涉及到打印或分享工作表時,為文檔添加專業的頁眉和頁腳不僅能提升文件的視覺效果,還能提供必要的信息,例如公司標識、日期、文件名或是頁碼等,使得文檔更加正式且易於跟蹤管理。用Python來設置Excel工作表的頁眉和頁腳,可以實現自動化這一過程,節省時間並保每次生成的文檔格式一致。本文將介紹如何使用Python設置Excel

xlsx , 頁面佈局 , xls , excel , Python

收藏 評論

大甜甜 - webrtc 音視頻,瀏覽器支持的攝像頭的最大分辨率

web端設置的分辨率是19201080,實際採集到的只有1280720. 注:macOS系統的intel系列電腦,雖然檢測到的是19201080,但是intel芯片限制了採集最高到1280720(720P) 可通過下面的方法檢測瀏覽器支持的最大分辨是多少: async function getMaxResolution() { try { // 枚舉所有媒體設備 c

音視頻 , webrtc

收藏 評論

SaaS知識庫 - 技術型企業搭建企業博客的戰略佈局:如何通過博客驅動業務增長與品牌塑造

在當今數字化時代,技術型企業面臨着激烈的市場競爭和快速變化的技術環境。為了在眾多競爭對手中脱穎而出,實現業務的持續增長和品牌的有效塑造,搭建企業博客已成為一種重要的戰略手段。 一、明確博客目標與定位 技術型企業在搭建博客之前,首先需要明確其目標和定位。目標應緊密圍繞業務增長和品牌塑造,例如增加產品曝光度、吸引潛在客户、樹立行業權威形象等。定位則需結合企業的核心技術優勢和目標受眾的需求。如果企業專注

企業管理工具 , 博客搭建 , 博客

收藏 評論

效率時空 - 從庫存管理到團隊協作:去中心化電商的管理秘訣

先來看一個故事: 一家電商創業公司在擴大業務的過程中,訂單處理和庫存管理變得極其複雜。比如,有客户下單後卻被告知商品缺貨,而另一邊的倉庫卻堆滿了滯銷的同款產品。傳統的中心化管理模式下,每個倉庫和代理都依賴總部的庫存數據,數據更新一旦出現延遲,就可能出現上面的情況。 於是,公司選擇開始採用分佈式庫存管理模式。通過引入一個區塊鏈系統,每個倉庫和代理節點都能實時共享庫存信息,無需依賴總部數據同步。庫存不

項目管理 , 區塊鏈 , 電商

收藏 評論

華健課堂 - Selenium 操作已打開的瀏覽器

偶爾要用到,start writing 實現步驟 先啓動 Chrome,打開任務管理器,找到 chrome.exe,地址欄輸入 cmd,然後執行 chrome.exe --remote-debugging-port=12345 看 !!! 12345 端口開了沒 netstat -aon | findstr "12345" 開了,你就連唄 ~ 開始指揮你的瀏覽器 ~~~ 往左

自動化測試 , selenium , Python

收藏 評論