tag 數據倉庫

標籤
貢獻167
295
01:08 PM · Nov 03 ,2025

@數據倉庫 / 博客 RSS 訂閱

laojean - DB25交叉線

RS-232、RS-422與RS-485都是串行數據接口標準,RS-232是PC機與通信中應用最廣泛的一種串行接口。RS-232被定義為一種在低速率串行通訊中增加通訊距離的單端標準。RS-232採取不平衡傳輸方式,即所謂單端通訊,而RJ45接口通常用於數據傳輸,最常見的應用為網卡接口。 RS-232是為點對點(即只用一對收、發設備)

大數據 , DB25交叉線 , 數據倉庫 , 422器件與lvds接收器的區別 , rs232接口 , rj45接口線序 , rs232 距離

收藏 評論

事辯天下 - 星期零升級版雞蛋豆腐上架山姆

近日,星期零煥新升級的雞蛋豆腐在山姆會員商店全國門店正式上架。相較此前版本,新品在原料、營養與包裝等多方面實現迭代,同時保留了開盒即食和多樣化烹飪的便利性,為日常餐桌提供更豐富的蛋白選擇。 在此次產品升級中,星期零在原有非轉基因黃豆的基礎上,新增來自東北的一 級黑豆原料,形成“黃豆+黑豆”的雙豆配方。黑豆富含優質植物蛋白及膳食纖維,近年來在豆製品創新中獲得了

大數據 , 數據 , 數據倉庫 , 應用場景 , 迭代

收藏 評論

北京辰輝創聚生物 - 重組蛋白常見標籤(Tag)科普:設計邏輯與功能作用

在重組蛋白研究中,蛋白標籤(Tag)是一種關鍵的工程化設計元素。標籤並不是蛋白本身的功能組成部分,而是通過表達構建引入的分子附加序列,用於提升目標蛋白在實驗體系中的可識別性和可操作性。無論是分離、檢測,還是改善蛋白溶解性和穩定性,標籤都提供了明確的技術支撐。 融合標籤的基本原理是

標籤設計 , 大數據 , 蛋白檢測 , 數據倉庫 , 表達構建 , 融合蛋白 , 親和純化

收藏 評論

lu952450497 - 數據建模中不同模型的區別與適用場景的討論

數據建模是數據開發體系中的核心環節,它直接決定數據資產質量、可維護性、複用能力,以及最終對業務價值的支撐能力。建模不是單純字段命名與表結構設計,而是一套體系化的抽象方法論。此文將從模型體系説明開始,逐一拆解建模方式區別、典型適配場景與落地難點。 1. 為什麼需要數據建模 數據建模目標並非“定義表結構”,而是實現: 指標口徑統一 跨主題數據複用

大數據 , 建模 , 數據 , 數據倉庫 , 複用

收藏 評論

事辯天下 - 奧哲2025未來企業大會|智現新生12月5日開啓!

彷彿AI早已觸手可及,為何企業佈局AI仍如履薄冰? 當AI浪潮奔涌而至,企業佈局AI卻深陷迷局:投資與回報難以衡量、人才與組織出現斷層、技術與業務割裂、藍圖難以落地兑現價值。企業AI究竟從何做起,由誰來做,如何落地?企業亟需一場破土新生的變革。 在這關鍵轉折點,奧哲在12月5日隆重舉辦「智現新生 | 2025未

it , 大數據 , 數據 , 數據倉庫 , 企業級

收藏 評論

TDengine濤思數據 - 時序數據庫 TDengine 獲 IT168 創新產品獎、入選 OSCHINA 共創社區、上榜思否技術品牌影響力企業

歲末將至,各大媒體與開發者社區陸續發佈年度評選榜單。TDengine 在近期的三項評選中連續入選:來自 IT168 的“2025 技術卓越獎 · 創新產品獎”、OSCHINA 的“年度共創社區”、以及 SegmentFault 思否的“2024 中國技術品牌影響力企業”。這既是對 2025 年技術路線與落地成果的一次階段性確認,也為這一年畫下了一個穩健且清晰的收尾節點——基礎軟件的競爭,

大數據 , 基礎軟件 , 數據倉庫 , 開源中國 , 開發者

收藏 評論

u_14767244 - SelectDB 在 AWS Graviton ARM 架構下相比 x86 實現 36% 性價比提升

在海量數據分析中,追求高性價比已成為各大企業的主流趨勢。ARM 架構憑藉其高能效和低成本的特點,逐漸在數據中心崛起,成為理想的高性價比選擇。基於 ARM 架構的 AWS Graviton 系列處理器,正是這一趨勢的典型代表。Graviton 處理器不僅在計算性能上表現優異,同時顯著降低了運行成本,尤其在數據密集型任務中展現出明顯優勢。與傳統的 x86 架構處理器相比,Graviton 提

AWS , 大數據 , 數據倉庫 , 性能比較 , 數據處理

收藏 評論

技術極客傳奇 - 搜索引擎爬蟲導致網站流量飆升如何解決

教程一:Python爬蟲學習系列教程 這個博主的這個爬蟲學習系列教程,很詳細啊,從入門到實戰、進階等都有詳細的文檔介紹,對爬蟲感興趣的小夥伴推薦一看。 教程二:學習網站上的爬蟲教程 實驗樓的爬蟲教程不是太多,但是都有詳細的講解和代碼,而且有在線開發環境,對於學習者是非常不錯的。其中最喜歡的就是那個 爬豆瓣熱門電影的教程 ,因為我自己超喜

知乎 , 大數據 , 數據倉庫 , 反爬蟲 , 搜索引擎爬蟲導致網站流量飆升如何解決 , Python

收藏 評論

vivo互聯網 - vivo Celeborn PB級Shuffle優化處理實踐

作者: vivo 互聯網大數據團隊-Wang Zhiwen、Cai Zuguang vivo大數據平台通過引入RSS服務來滿足混部集羣中間結果(shuffle 數據)臨時落盤需求,在綜合對比後選擇了Celeborn組件,並在後續的應用實踐過程中不斷優化完善,本文將分享vivo在Celeborn實際應用過程中對遇到問題的分析和解決方案,用於幫助讀者對相似問題進行參

大數據 , 私藏項目實操分享 , shuffle , RSS , 數據倉庫 , Celeborn

收藏 評論

温柔一刀 - goland索引建立

gocolly是用go實現的網絡爬蟲框架,目前在github上具有3400+星,名列go版爬蟲程序榜首。gocolly快速優雅,在單核上每秒可以發起1K以上請求;以回調函數的形式提供了一組接口,可以實現任意類型的爬蟲;依賴goquery庫可以像jquery一樣選擇web元素。 gocolly的官方網站是http://go-colly.org/,提供

github , 大數據 , 數據倉庫 , text , 示例代碼 , goland索引建立

收藏 評論

u_14767244 - Apache Doris 在小米統一 OLAP 和湖倉一體的實踐

小米早在 2019 年便引入 Apache Doris 作為 OLAP 分析型數據庫之一,經過五年的技術沉澱,已形成以 Doris 為核心的分析體系,並基於 2.1 版本異步物化視圖、3.0 版本湖倉一體與存算分離等核心能力優化數據架構。本文將詳細介紹小米數據中台基於 Apache Doris 3.0 的查詢鏈路優化、性能提升、資源管理、自動化運維、可觀測等一系列應用實踐。

大數據 , 數據 , 運維 , 數據倉庫 , 物化視圖

收藏 評論

colddawn - DB where 字段 is null 會走索引嘛

1.對查詢進行優化,要儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num is null 最好不要給數據庫留NULL,儘可能的使用NO

字段 , 大數據 , 存儲過程 , 數據倉庫 , bc

收藏 評論

u_15444077 - 從random隨機數看驗證碼重複數字

本文分享自天翼雲開發者社區《從random隨機數看驗證碼重複數字》.作者:王****淋 ## 推導: 1. 有6個不同數字 - (0個重複數字: 1+1+1+1+1+1): $$p(6) = C_{10}^6 * 6! \div 10^6$$ 2. 有5個不同數字 - (某個數字重複了2次: 1+1+1+1+2): $$p(5) = (\

大數據 , 數據倉庫

收藏 評論

Aloudata - 企業級 VS 個人級:智能問數的“集團軍”與“單兵作戰”的差異解析

智能問數正迅速成為企業數據消費的新入口。從初創公司到世界 500 強,眾多組織嘗試通過“一句話問數”的方式,降低數據分析門檻、提升決策效率。理想很豐滿,但現實很骨感,“問不準”、“不靈全”、“問不深”成為大量嚐鮮用户的普遍感受。 表面上看,這類失敗常被歸因於技術瓶頸——例如模型準確性不足、SQL 生成錯誤、響應延遲等。但深入剖析後不難發現,問題的根

大數據 , 數據倉庫 , 智能歸因 , 智能報告 , 數據分析 , 智能問數 , chatbi

收藏 評論

u_14767244 - 深入理解 Doris Variant:如何讓 JSON 查詢性能追平列存,還能承載萬列索引字段?|Deep Dive

摘要:在如 Snowflake、ElasticSearch、ClickHouse.... 等傳統系統中,對於 JSON 的處理往往面臨靈活性及性能無法兼得的困境,而 Apache Doris 的 VARIANT 類型,通過動態子列、稀疏列存儲、延遲物化和路徑索引等能力,實現了靈活結構 + 列存性能的平衡。本文將對該能力的實現一一講解,全面展示其優勢。 在大數據時代,JSON 已

大數據 , 數據 , 數據倉庫 , 結構化 , Json

收藏 評論

u_14767244 - 從 Flink 到 Doris 的實時數據寫入實踐——基於 Flink CDC 構建更實時高效的數據集成鏈路

Flink-Doris-Connector 作為 Apache Flink 與 Doris 之間的橋樑,打通了實時數據同步、維表關聯與高效寫入的關鍵鏈路。本文將深入解析 Flink-Doris-Connector 三大典型場景中的設計與實現,並結合 Flink CDC 詳細介紹了整庫同步的解決方案,助力構建更加高效、穩定的實時數據處理體系。 一、Apache Doris 簡介 A

數據同步 , 大數據 , 數據 , 數據倉庫 , apache

收藏 評論

wx59290cd7bb11a - 告別 WHERE id=1!大數據工程師的 AI 覺醒:手把手帶你拆解向量數據庫 (RAG 核心)

💡 本文價值提示: 歡迎回到我們的 “大數據工程師轉型 AI 架構師” 系列專題! 在搞定了 Python 高級工程化 和 大模型基礎理論 之後,今天我們正式開啓第三個重磅專題——RAG 架構與數據工程之向量數據庫。 對於大數據老兵來説,數據庫是我們的“後花園”。但 AI 時代的數據庫(Vector DB)徹底顛覆了我們熟悉的 SQL 邏輯。本文將帶你從底層思維上完成從“

大數據 , 數據 , 數據倉庫 , 數據庫

收藏 評論

阿里雲大數據AI技術 - EMR Serverless Stella 1.0 技術分享:StarRocks企業級版本內核重大突破

在今年雲棲大會上,EMRServerlessStella1.0正式發佈,這是一款面向企業級場景深度優化的高性能數據分析引擎。阿里雲開源大數據平台OLAP引擎負責人周康系統性地分享了Stella在存算分離架構、Lakehouse場景以及全文檢索等三大核心場景下的深度優化經驗,為業界提供了大規模OLAP系統工程化實踐的寶貴參考。Stella引擎的發佈將為企業級用户提供更加專業、高效的

大數據 , 數據倉庫 , 阿里雲 , Lakehouse , starrocks , Stella , olap

收藏 評論

編程小達人之心 - 302狀態碼搜索引擎

官方解釋: 301 redirect: 301 代表永久性轉移(Permanently Moved) 302 redirect: 302 代表暫時性轉移(Temporarily Moved ) 共同點: 301和302狀態碼都表示重定向,就是説瀏覽器在拿到服務器返回的這個狀態碼後會自動跳轉到一個新的URL地址,這個地址可以從響應的Loc

搜索引擎 , 302狀態碼搜索引擎 , 大數據 , google , 數據倉庫 , 重定向

收藏 評論

事辯天下 - 沃飛長空完成數億元C輪融資,加速商業化進程

近日,沃飛長空宣佈完成數億元人民幣C輪融資。 本輪融資由杭州市實業投資集團有限公司 (簡稱杭實集團)、Prosperity7 Ventures (簡稱P7)、鬆禾資本共同投資,藴盛資本、翱翔天行等老股東追加投資。 此次融資匯聚了國內外頂尖產業資源,其背後是市場對沃飛長空硬實力的高度認可和對eVTOL全球化前景的共識。依託杭實集團深耕本土的產業根基,能助力企業更精

商業模式 , it , 大數據 , 數據倉庫 , 人工智能

收藏 評論

mob64ca13f9e726 - ai搜索引擎 構建

AI導航 | AI工具 | AI之旅導航是隻收錄最新最實用AI工具的人工智能導航網站 最近半年使用了大量的AI人工智能工具,收藏夾已經收藏不過來了。 所以搭建這個導航網站,管理所有收藏的熱門AI網站,同時像大家分享, 網站沒有任何廣告,歡迎大家一起使用! 如果你有比較好的AI工具,也歡迎在線提交哦 AI導航 | AI之旅導航

大數據 , ai搜索引擎 構建 , 數據倉庫 , 編程工具 , 工具集 , 人工智能

收藏 評論

北京辰輝創聚生物 - 【辰輝創聚生物】重組蛋白 His 標籤(His-tag)原理與應用詳解:親和純化與檢測技術全解析

在生命科學研究領域,重組蛋白的表達、分離與分析是分子生物學、細胞生物學和蛋白質化學實驗中的基礎技術環節。為了提高目標蛋白的可控性與可重複性,融合標籤技術被廣泛引入實驗體系。其中,His標籤(Histidine tag, His-tag) 因其結構簡單、適用範圍廣、配套科研試劑成熟,成為科研實驗中使用頻率最高的蛋白標

Western Blot , 大數據 , 重組蛋白 , 數據倉庫 , His標籤 , ELISA , 親和純化

收藏 評論

向量檢索 - 如何通過HTTP API分組檢索Doc

本文介紹如何通過HTTP API在Collection中進行分組相似性檢索。 前提條件 已創建Cluster:創建Cluster。 已獲得API-KEY:API-KEY管理。 Method與URL HTTP POST https://{Endpoint}/v1/collection

向量檢索 , 大數據 , yyds乾貨盤點 , 數據倉庫 , AI , 數據庫 , 人工智能 , 大模型

收藏 評論

北京辰輝創聚生物 - 重組蛋白表達|活性細胞因子|技術應用詳解

在生命科學研究的精密世界裏,重組蛋白技術,特別是細胞因子與生長因子的製備,已成為探索細胞生命活動的基石。作為通過蛋白表達與蛋白純化技術獲得的活性蛋白,它們為科研提供了高純度、高一致性的關鍵工具。 定義與分類:精準的信號分子 細胞因子是一類由細胞分泌的多肽或蛋

蛋白純化 , 幹細胞分化 , 免疫調節 , 大數據 , 信號轉導 , 數據倉庫 , 生長因子

收藏 評論