博客 RSS 訂閱

代碼匠心 - 從零開始學Flink:流批一體的執行模式

在大數據處理領域,批處理和流處理曾經被視為兩種截然不同的範式。然而,隨着Apache Flink的出現,這種界限正在逐漸模糊。Flink的一個核心特性是其批流一體的架構設計,允許用户使用統一的API和執行引擎處理有界數據(批處理)和無界數據(流處理)。本文將深入探討Flink的執行模式(Execution Mode),特別是在Flink 1.20.1版本中對批處理和流處理模式的支持和優化。 一、F

大數據處理 , 大數據 , JAVA , flink

收藏 評論

宇文成都 - Java文檔格式轉換:PDF轉OFD與OFD轉PDF

在數字化辦公日益普及的今天,文檔格式的標準化與跨平台兼容性成為企業和開發者面臨的重要挑戰。其中, PDF (Portable Document Format)作為全球通用的文檔格式,與我國自主研發的 OFD (Open Fixed-layout Document)版式文檔標準,在各自領域扮演着舉足輕重的角色。OFD作為國家標準,在政務、金融等領域具有不可替代的地位,而PDF則以其廣泛的兼容性成為日

pdf , JAVA

收藏 評論

迅易科技 - 破解多域賬號管理難題,構建高效AD/郵箱同步體系

在數字化浪潮中,企業規模不斷擴大、業務多地分佈已成為常態。隨之而來的是IT基礎設施的複雜化,尤其是Active Directory(AD)和郵箱賬號的管理,往往面臨多域隔離、賬號信息不同步、安全合規難保障等挑戰。 近期,迅易科技成功為某大型企業實施了AD/郵箱賬號管理優化(UAR)項目,幫助企業構建起一套安全、高效、自動化的賬號同步體系。 本文邀請了迅易科技Data數據業務總監鄧利才,他將結合該項

賬號安全 , microsoft , 後端

收藏 評論

鳩摩智首席音效師 - 如何清除 Yarn 緩存 ?

Yarn 是一個流行的 JavaScript 項目包管理器。有時,您可能需要清除 Yarn 的緩存來解決問題或釋放空間。本指南將向您展示如何在 Yarn 中輕鬆清除緩存。 What is Yarn Cache? 當您使用 Yarn 安裝包時,它會在緩存目錄中存儲包文件的副本,這使得以後的安裝更快。然而,隨着時間的推移,這個緩存可能變得很大或過時,這就是為什麼要清理它的原因。 Why Clear

yarn

收藏 評論

華明視訊科技 - 智能卡口系統解決方案:構築現代化海關監管的智慧防線

隨着全球貿易的飛速發展,海關卡口作為貨物進出口的關鍵節點,其監管效率與準確性直接關係到國門安全與通關流速。傳統依賴人工查驗的模式已難以應對日益增長的流量與複雜的監管需求。為此,我們推出全新的智能卡口系統解決方案,通過深度融合物聯網、自動識別與數據智能技術,實現卡口監管的無人化、自動化與智能化,為構建智慧海關提供堅實的技術底座。 智能卡口系統解決方案核心:全流程無人化智能監管 本方案旨在

機器學習 , 圖像識別 , 神經網絡 , 人工智能 , 深度學習

收藏 評論

Tomy - 近年中國嵌入軟件單元測試發展報告及專業工具應用分析

一、中國嵌入軟件單元測試發展現狀與趨勢(2023-2025) 市場發展概況 近年來,中國嵌入式軟件行業呈現快速發展態勢。根據中研普華產業研究院數據,2023年中國嵌入式系統市場規模已達10310億元,其中嵌入式軟件佔據重要份額。預計到2025年,全球嵌入式軟件市場規模有望達到3053億美元,中國作為全球最大的嵌入式系統市場之一,將持續保持強勁增長勢頭。 嵌入式軟件廣泛應用於

測試開發 , 測試工具

收藏 評論

下一個絕世 - Python 小遊戲實戰:打造視覺精美的數獨小遊戲

環境準備 首先安裝依賴庫,打開終端執行以下命令: pip install pygame numpy 核心模塊實現(分步講解) 項目將分為3個核心模塊:數獨謎題生成器、Pygame可視化界面、交互邏輯處理。我們逐一實現,最後整合為完整代碼。 模塊1:數獨謎題生成器 生成合法的數獨謎題是基礎,核心思路是:先生成一個完整的合法數獨矩陣,再通過“挖空”的方式生成不同難度的謎題(挖空越多,難度越高)。 1.

遊戲 , 遊戲開發 , 數獨

收藏 評論

喝醉的筷子 - RipTree:使用 Rust 重寫 linux 經典 tree 命令

介紹 這個命令有什麼作用:打印當前目錄下的內容 原版 tree 源碼一坨屎山,直接重寫 倉庫地址:https://github.com/TC999/riptree 基本遵循原版用法,支持跨平台,目前只實現了部分功能,支持中文 安裝 Windows:前往GitHub 發行版下載rt-windows.zip,全部解壓到一個目錄並添加到%PATH%,如要默認調中文請添加環境變量,名

跨平台 , rust , tree命令 , 教程 , 終端

收藏 評論

deephub - 氛圍編程陷阱:為什麼AI生成代碼正在製造大量"偽開發者"

這是一篇再國外討論非常火的帖子,我覺得不錯所以把它翻譯成了中文。 大語言模型和ai只能提的發展衍生出了一個東西叫"vibe coding"(氛圍編程)——用自然語言描述需求,讓AI生成代碼,看起來不用寫代碼就能做出產品。 但這玩意兒本質上是個陷阱。它培養的不是開發者,而是一羣只會生成代碼、卻看不懂也改不了代碼的"中間商"。 對新手來説,這不是什麼職業捷徑。這是條斷頭路,而且很多人正往裏衝。 氛圍編

觀點 , llm , 神經網絡 , 人工智能 , 深度學習

收藏 評論

JeeLowCode - 低代碼的系統化演進:從工具邏輯到平台架構的技術解讀

低代碼最初被看作是開發效率工具,用於快速搭建審批流程、表單收集等輕量化應用。隨着企業級需求的增長,這種工具化定位逐漸顯得不足。 越來越多的企業開始關注低代碼在複雜系統、跨部門協同以及高併發場景中的適用性。由此,低代碼的角色正在發生轉變——從滿足局部需求的工具,向支撐業務架構和長期治理的平台演進。 這種轉變不僅是功能上的擴展,更是架構、性能、安全和生態上的系統性升級。 可視化工作流 流程功能 流程

低代碼 , 低代碼開發平台 , JAVA , 工作流

收藏 評論

思否編輯部 - 做好這件事,vivo 應用生態得以欣欣向榮

10 月 10 日,vivo 開發者大會(VDC)在深圳開幕。和其他廠商的類似會議一樣,vivo 這場活動主要是面對廣大開發者,希望通過更好地服務開發者來構建一個更加繁榮、體驗更好的應用生態。 作為全球頭部智能設備廠商,vivo 在硬件側的實力有目共睹。但在軟件側,vivo 應用生態則像是一個幕後英雄,往往容易被低估。對於很多開發者來説,上架到 vivo 只是一項例行公事,vivo 的應用

開發者

收藏 評論

正點原子 - 《ESP32-S3使用指南—IDF版 V1.6》第四十一章音樂播放器實驗

第四十一章音樂播放器實驗 1)實驗平台:正點原子DNESP32S3開發板 2)章節摘自【正點原子】ESP32-S3使用指南—IDF版 V1.6 3)購買鏈接:https://detail.tmall.com/item.htm?id=768499342659 4)全套實驗源碼+手冊+視頻下載地址:http://www.openedv.com/docs/boards/esp32/ATK-DNESP32

嵌入式 , 單片機 , 程序員 , 產品 , 硬件

收藏 評論

大丸子 - 使用 Python 在 PDF 中添加、導入、複製、移動與刪除頁面

在日常辦公和自動化任務中,我們經常需要對 PDF 文件進行頁面級的編輯,例如插入空白頁、複製現有頁、導入其他文件的頁面或刪除不需要的頁面。使用 Python,你可以輕鬆實現這些操作,而無需依賴 Adobe Acrobat。 本文將通過幾個常見場景,演示如何使用 Python 操作 PDF 頁面,包括: 添加空白頁 導入其他 PDF 的頁面 刪除特定頁面 在文檔內部複製頁面 移動頁面到新

pdf導出 , 文檔管理工具 , pdf , pdf-generation , Python

收藏 評論

煩惱的沙發 - Rust 1.89更新,有哪些值得關注的新功能

Rust 更新還挺頻繁的,連1.90都出來了,但作為新版本,1.90有啥坑還不知道,先讓子彈飛一會。那還是1.89更穩更值得關注。 寫代碼之前,別讓環境配置勸退你 在聊 1.89 的新特性之前,咱先聊個搭建環境的問題。 官方推薦的 rustup 是挺方便,但做項目光有它可不夠。電腦上是不是還得裝個 Nginx、PostgreSQL、Redis 之類的?這一套東西在自己電腦上攢起來,説實話挺折騰人

資訊 , rust , 後端

收藏 評論

中昊芯英 - DeepSeek-V3.2的DSA稀疏注意力技術:在TPU平台上的效能革命與適配實踐

9 月 29 日,DeepSeek 最新發布的DeepSeek-V3.2-Exp模型引入了自主研發的DeepSeek Sparse Attention(DSA)稀疏注意力機制,在幾乎不影響模型性能的前提下,實現了長文本訓練和推理效率的大幅提升。本文旨在深入解析 DSA 的技術原理,並重點探討中昊芯英「剎那®」TPU 平台如何憑藉其片上緩存與高度並行矩陣計算單元,在 Lightning Indexe

機器學習 , tensorflow , 神經網絡 , 自然語言處理 , 人工智能

收藏 評論

deephub - mmBERT:307M參數覆蓋1800+語言,3萬億tokens訓練

mmBERT是一個純編碼器架構的語言模型,在1800多種語言、3萬億tokens的文本上完成了預訓練。它的架構設計借鑑了ModernBERT,但又加入了不少創新點,比如逆掩碼比率調度和逆温度採樣。而且研究團隊還把1700多種低資源語言放在了衰減階段加入訓練,這個策略帶來了相當不錯的效果提升,充分利用了那些數據量本身就不大的語言資源。 模型架構 整體架構和ModernBERT保持一致,但換成

bert-language-model , 神經網絡 , 人工智能 , 深度學習

收藏 評論

K哥爬蟲 - 【JS逆向百例】某坤行 1101,雪球 1038,新 acw_sc__v2 逆向分析

聲明 本文章中所有內容僅供學習交流使用,不用於其他任何目的,不提供完整代碼,抓包內容、敏感網址、數據接口等均已做脱敏處理,嚴禁用於商業用途和非法用途,否則由此產生的一切後果均與作者無關! 本文章未經許可禁止轉載,禁止任何修改後二次傳播,擅自使用本文講解的技術而導致的任何意外,作者均不負責,若有侵權,請在公眾號【K哥爬蟲】聯繫作者立即刪除! 前言 最近有小夥伴博客留言,詢問關於雪球 1038 長串

爬蟲

收藏 評論

商湯萬象開發者 - 技術拆解 | 表格解析(上):企業數字化與AI應用流程中的重要基礎支撐

上一期我們向大家介紹了商湯自研的智能文檔解析 UniParse,歡迎大家試用!本期開始,我們將對 UniParse 中涉及的技術點進行逐一拆解,希望能幫助大家更好地理解和使用我們的產品~ 本期和下期的分享主題都將圍繞“表格解析”展開,技術細節,一探究竟! 什麼是表格解析 表格解析是將非結構化的表格圖像(如掃描文檔、照片或PDF中的表格)轉為機器可讀、可理解的結構化數據的過程。具體而言,它旨在將圖像

表格 , 人工智能 , 檢索系統 , 文檔

收藏 評論

程序員一諾python - 【爬蟲開發】爬蟲開發從0到1全知識教程第14篇:scrapy爬蟲框架【附代碼文檔】

🏆🏆🏆教程全知識點簡介:1.Mongodb數據庫包括介紹、mongodb簡單使用(mongodb服務端啓動、啓動mongodb客户端進入mongo shell)。2. scrapy爬蟲框架涵蓋 ip使用、啓動爬蟲、停止爬蟲、scrapyd webapi。3. Gerapy包含通過Gerapy配置管理scrapy項目。4. appium移動端抓取涉及appium自動控制移動設備、appium

數據庫 , 爬蟲 , 後端 , Python

收藏 評論

美團技術團隊 - 可驗證過程獎勵在提升大模型推理效率中的探索與實踐

美團業務研發搜推平台部算法團隊創新提出可驗證過程獎勵機制(VSRM),針對大模型推理中的冗餘回覆與過度思考問題,精準獎勵有效推理步驟,顯著縮減輸出長度並提升推理效率。VSRM通過步驟級正確率增益評估,有效抑制無效步驟,兼容主流強化學習算法,助力高效、可靠的複雜推理任務。 1 背景 以 DeepSeek-R1 為代表的大規模推理模型,通過簡單有效的強化學習後訓練方法,培養了強大的推理能力,但卻導致模

大模型 , 美團

收藏 評論

一點人工一點智能 - 《基於Python的數學方法》

書籍:Mathematical Methods using Python 作者:Vasilis Pagonis,Christopher Kulp 出版:CRC Press​ 編輯:陳萍萍的公主@一點人工一點智能 下載:書籍下載-《基於Python的數學方法》 01 書籍介紹 這本高年級本科教材開創性地將“數學方法”課程與Python編程深度融合,面向理工科學生。全書

數學 , 人工智能 , Python

收藏 評論

軟件部長 - 低代碼實戰:如何在JVS低代碼平台配置條件化流程分發,解決多維度審批難題?

在企業日常運營中經常會遇到不同金額的採購申請需要走不同的審批流程,但是系統內只能機械的套用單一流程,還有重要客户訂單需要特殊通道,傳統OA審批太繁瑣,只能手動選擇審批流程,效率低下,還容易因為選擇錯誤導致流程卡殼。 低代碼的出現,解決了這些痛點問題,通過配置化就可以根據業務數據自動判別並跳轉至合適的審批流程,實現真正意義上的智能業務分流。 在JVS低代碼中使用流程,可以在新增數

工作流程管理系統 , 低代碼 , 低代碼開發平台 , 工作流

收藏 評論

jump__jump - 妙用 localeCompare 獲取漢字拼音首字母

在前端開發中,開發者通常會使用 localeCompare 來進行中文字符的排序比較。但 localeCompare 還有一種較為少見的應用場景 —— 通過獲取中文字符的拼音首字母來實現檢索功能。本文將詳細介紹這一實用技巧及其應用。 原理 localeCompare 方法允許字符串按特定語言環境的排序規則進行比較。在中文環境下,它會默認按照漢字的拼音順序進行排序。基於這一特性: 準備一組具有代

搜索 , 漢字轉拼音 , 工具類 , 前端 , Javascript

收藏 評論

產品汪日記 - 深入解析:AI 玩具(智能兒童玩具)用户旅程地圖

一、產品與用户背景(快速定位) 產品形態:帶麥克風與揚聲器的互動玩具 + 手機/平板 App(家長端)+ 雲端下發內容包。 目標用户:3–10 歲兒童(直接使用者)與監護人/家長(決策者與管理者)。 核心價值:陪伴、啓蒙教育、親子互動、可持續內容更新。 關鍵約束:安全與隱私合規、簡單上手、內容易更新、家長可控。 二、旅程階段劃分(8 個階段) 1.認知(家長被短視頻/口碑吸引) 2.

用户體驗

收藏 評論