tag 數據

標籤
貢獻758
564
05:56 PM · Oct 25 ,2025

@數據 / 博客 RSS 訂閱

畢設大神 - 基於大數據對B站熱門視頻的數據分析與數據研究系統-計算機畢業設計源碼+LW文檔分享

摘要 在互聯網飛速發展的當下,視頻平台競爭激烈,B站作為深受年輕人喜愛的視頻社區,擁有龐大的用户羣體和海量視頻資源。對B站熱門視頻進行數據分析與研究,能為平台運營、內容創作提供有價值的參考,具有重要的現實意義。系統採用B/S開發模式,以Python為開發語言,利用Flask框架搭建Web應用,結合Hadoop實現對大規模數據的存儲和處理。系統賦予管理員強大的管理功能,可對用

數據 , 後端開發 , 數據分析 , JAVA , ide

收藏 評論

u_14767244 - 5 倍性能提升,Apache Doris TopN 全局優化詳解|Deep Dive

在日常的數據分析和業務報表中,TopN 查詢幾乎無處不在:無論是尋找銷量最高的前十件商品,還是篩選訪問量最多的前幾條日誌,開發者和數據分析師都在頻繁處理“前 N 條數據”。然而,當表的列數達到百餘或更多時,一個看似簡單的 SELECT \* … ORDER BY … LIMIT N 查詢,背後可能隱藏着巨大的性能瓶頸。儘管我們只關心某一列的前 N 條結果,數據庫依然可能掃描整張表的所有列

大數據 , Doris , 數據 , 數據倉庫 , 數據訪問 , SQL , apache

收藏 評論

mob64ca14005461 - 大數據分析有什麼含義

大數據分析概述 目錄 大數據的定義與核心特徵 大數據的定義 大數據的4V特徵 大量化(Volume) 快速化(Velocity) 多樣化(Variety) 價值化(Value) 大數據分析的基本流程 準備階段 目標:構建高質量的數據基礎 核心任務: 發現階段 目標:挖掘數

數據挖掘 , 大數據 , 數據 , 後端開發 , 數據分析 , Python

收藏 評論

上海拔俗網絡 - AI大模型研發與管理平台:讓模型開發“少走彎路”的技術利器

AI大模型研發曾是“少數人的遊戲”:數據雜亂難整理、訓練耗時長、版本混亂難追溯,還得靠資深工程師“憑經驗試錯”。而AI大模型研發與管理平台的出現,用標準化技術工具鏈打通研發全流程,把複雜的模型開發變成“按流程操作、靠數據説話”的高效工作,讓更多團隊能輕鬆搞研發。 這個平台的核心是“技術閉環+智能協同”,就像給大模型研發裝了一套“全流程管家”,每個環節都藏着實打實的技術硬活: 首先

服務器 , 數據 , NLP , 人工智能 , 迭代

收藏 評論

合合信息解決方案 - 保險理賠如何防止假髮票

醫療票據造假正在成為保險理賠領域的"灰色地帶"。2020年至2021年間,某醫藥代表陸某使用WPS軟件將三名患者的EGFR T790M基因突變檢測報告從"陰性"篡改為"陽性",導致醫保基金損失。2024年,內蒙古烏蘭浩特市更是破獲兩起醫療領域虛開發票案,涉案金額合計高達110億元,涉及1.6萬張虛假髮票。面對日益專業化的造假手段,保險公司如何防止假髮票成為行業亟需解決的難題。合合

機器學習 , 數據 , 神經網絡模型 , 複製粘貼 , 人工智能

收藏 評論

mb61c46a7ab1eee - 深入解析:MySQL一篇速通

前置任務:MySQL的安裝與卸載 推薦使用壓縮版:https://dev.mysql.com/downloads/ 1.解壓文件(解壓路徑不能出現中文) 2.在解壓目錄(安裝目錄)下: 3.修改配置文件my.ini 4. 配置環境變量將bin路徑填入系統變量Path 5. 初始化mysql 以管理員身份運行cmd

數據 , MySQL , 數據庫

收藏 評論

上海拔俗網絡 - AI大數據營銷實訓系統:用技術搭建實戰橋樑

傳統營銷實訓總逃不開“紙上談兵”的尷尬——沒有真實數據練手、沒法模擬市場實時變化、花了精力還説不清營銷效果到底好不好。AI大數據智能營銷實訓系統,就是用技術把真實營銷場景“搬”進課堂,讓學習者在零風險模擬中吃透數據驅動營銷的邏輯。其核心技術圍繞“數據模擬、智能推演、效果閉環”三大板塊落地,既貼合企業實戰標準,又適配教學場景的易用性需求。 多源數據模擬與清洗技術,是整個實訓系統的“數據

大數據 , 數據 , NLP , 用户畫像 , 人工智能

收藏 評論

mob64ca1419e0cc - Python爬蟲入門 | 4 爬取豆瓣TOP250圖書

目錄 一、開門見山,探究網頁結構 二、確定思路 1.拿到頁面源代碼/響應 2.編寫正則,提取頁面數據 3.保存數據 三、步驟詳解 1.初步爬取 2.繞過反爬 3.編寫正則表達式與正則匹配 4.翻頁爬取 5.注意點 Hello,我是蔣星熠Jaxonic! 在浩瀚無垠的技

正則匹配 , 大數據 , 數據 , hadoop , 正則表達式

收藏 評論

高粱seo工作室 - 分享GEO部署與AI批量生成內容的結合

一、核心概念分解介紹 要理解GEO部署與AI批量生成內容的結合,首先需分別拆解兩個核心概念的內涵、核心價值,再明確二者結合的本質邏輯。 GEO部署,全稱為“地理分佈式部署”(Geographical Deployment),是指將應用程序、服務器節點、數據存儲設施等資源,根據業務需求分散部署在不同地理區域(如不同國家、城市)的服務器集羣中,而非集中於單一數據中心。其核

軟件研發 , 數據 , 雲服務 , 自媒體

收藏 評論

爛漫樹林 - MMoE論文筆記

moe(混合專家模型) 作為一種基於 Transformer 架構的模型,混合專家模型主要由兩個關鍵部分組成: 稀疏 MoE 層: 這些層代替了傳統 Transformer 模型中的前饋網絡 (FFN) 層。MoE 層包含若干“專家”(例如 8 個),每個專家本身是一個獨立的神經網絡。在實際應用中,這些專家通常是前饋網絡 (FFN),但它們也可以是更復雜的網

數據 , Soft , 加載 , 後端開發 , Python

收藏 評論

碼海舵手 - 極智AI | 變形金剛大家族 Transformer ViT CLIP BLIP BERT 模型結構_51CTO博客

文章目錄 轉載 以下是博客原文 以合理的規模訓練 ViT 自蒸餾 DeiT 模型概覽 Pyramid 視覺 Transformer(PVT)的總體架構 視覺 Transformer 的自監督訓練:DINO DINO 多注意力頭可視化 MLP-Mixer 架構 多尺度視

卷積 , 數據 , MySQL , 數據庫 , 人工智能 , transformer , 深度學習

收藏 評論

wx676be6175e246 - Android開發中數據打印截斷問題及解決方案探析

在Android開發過程中,開發者常常需要藉助日誌輸出來調試程序或跟蹤數據流程。然而,當遇到JSON數據、長字符串等大規模數據輸出時,經常會出現打印內容被截斷的現象,這給開發調試帶來了不小的困擾。 造成日誌打印不全的主要原因在於Android系統對單條日誌長度的硬性限制。根據Android系統底層實現,Log類的輸出長度被限定在約4KB(4096字

移動開發 , 數據 , Android , 開發者

收藏 評論

mob64ca13fdd43c - c++ - 消息隊列新實現:Workflow msgqueue代碼詳解 - 個人文章

第一章:C++高性能消息隊列的演進與挑戰 在現代高併發系統中,C++ 高性能消息隊列作為核心組件,承擔着解耦、異步處理和流量削峯的關鍵職責。隨着業務規模的擴大和實時性要求的提升,傳統阻塞式隊列已難以滿足低延遲、高吞吐的需求,推動了無鎖隊列、環形緩衝區等技術的廣泛應用。 無鎖隊列的設計原理 無鎖(lock-free)消息隊列利用

數據 , 上下文切換 , 緩存 , Css , 前端開發 , HTML

收藏 評論

風輕雲淡的開發 - 範圍查找導致索引失效

在搜索程序較為棘手一部分就是搜索範圍。 絕大數搜索程序都不能在單台計算機上完成足夠數量的數據搜索或併發搜索。 有時候為了避免由於單硬件問題出現導致無法服務,可以運行在多台機器上。 這種設計能夠不影響當前搜索程序運行的情況下臨時推出一台計算機來進行維護和升級。 搜索範圍有兩種界定方式: 淨處理內容和淨查詢吞吐量。 如果處理的數據量較大的話必須將這些數

大數據 , 數據 , 搜索 , 數據倉庫 , 加載 , 範圍查找導致索引失效

收藏 評論

u_14767244 - 上海證券 SelectDB 升級實踐:湖倉流批一體落地與 Elasticsearch 全面替換

導讀 上海證券引入 SelectDB 作為核心實時分析引擎,有效彌補了實時數據處理與分析的能力短板,實現湖倉一體與流批一體,同時替換了原架構中的 Elasticsearch 組件。達成了寫入性能提升 4 倍,支撐 1000+ QPS 高併發訪問,關鍵決策響應速度 200 ms,開發效率提升 50%,運維成本大幅降低的關鍵收益。 業務背景 上海證券成立於 200

大數據 , 數據 , elastic , 運維 , 數據倉庫

收藏 評論

Chikaoya - R語言21天學習計劃 - 第二天:數據導入導出與數據清洗

📚 今日目標 學習多種數據格式的導入導出 掌握數據清洗的基本操作 處理缺失值和異常值 實踐數據轉換和整理 📁 第一部分:數據導入 1.1 內置數據集 # 查看所有內置數據集 data() # 加載內置數據集 data(mtcars) # 汽車數據集 data(iris) #

數據集 , 缺失值 , 數據 , AI寫作 , aigc

收藏 評論

IT狼人9號 - Golang channel 用法簡介 - Go語言中文網

瞭解channel 概念:傳送帶 / 管道 你可以把Channel(通道)想象成一條在協程(Goroutine)之間傳送數據的傳送帶或者管道。 協程(Goroutine):就像工廠裏的工人。 Channel(通道):就像連接兩個工人工作台的傳送帶。 Channel 的主要作用 通信

golang , Exchange , 服務器 , 數據 , i++ , 主線程

收藏 評論

架構設計師之光 - python製作以太網刷寫工具

以太網PHY和MAC對應OSI模型的兩個層——物理層和數據鏈路層。 物理層定義了數據傳送與接收所需要的電與光信號、線路狀態、時鐘基準、數據編碼和電路等,並向數據鏈路層設備提供標準接口(RGMII / GMII / MII)。 數據鏈路層則提供尋址機構、數據幀的構建、數據差錯檢查、傳送控制、向網絡層提供標準的數據接口等功能。

數據鏈路層 , 數據 , 後端開發 , 數據結構與算法 , 信號線 , python製作以太網刷寫工具 , Python

收藏 評論

數據工坊 - 2025 年數據治理主流方案對比:從技術深耕到價值釋放

在數字化轉型進入深水區的今天,數據已成為企業與政府機構的核心資產。然而,多源數據孤島、質量參差不齊、安全合規壓力等問題,讓數據治理從 “選擇題” 變成 “必修課”。一款高效的數據治理方案,不僅需要打通數據全生命週期管理,更要在智能化、兼容性、場景適配性上形成差異化優勢。 本文選取 6 款國內外主流數據治理方案,從核心能力、技術特性、適用場景三個維度展開對比,為不同規模、不同行業的用户提供選型參考。

數據

收藏 評論

mb6923acc0735dc - 分佈式硬件池化:跨設備攝像頭、傳感器能力協同

引言:超級終端時代的硬件資源共享 在鴻蒙生態中,"超級終端"不僅是一個概念,更是通過分佈式硬件池化技術實現的革命性體驗。想象一下這樣的場景:用手機的攝像頭進行視頻會議,同時調用平板的麥克風陣列獲得更好的收音效果,再利用智慧屏的傳感器檢測環境光線自動調節畫面亮度。這種跨設備的硬件能力協同,正是鴻蒙分佈式硬件池化的核心價值。 分佈式硬件池化打破了單一設備的物理限制,將多個

自適應 , 移動開發 , 數據 , Android , Harmony , 流媒體

收藏 評論

WangMing_X - C#上位機軟件:23.1 多條件動態查詢條件的編寫技巧和完整查詢方法編寫

筆記摘要: 本視頻講述了課程管理系統中多條件動態查詢功能的實現原理與編碼步驟,包括SQL語句拼接、條件組合邏輯處理、數據封裝及UI事件聯動,並強調了整型檢索效率、空值處理細節和可擴展性設計。/n --- - **效果演示:多條件組合查詢功能 - 系統支持根據課程分類和課程名稱進行自由組合查詢。 - 可單獨按課程名稱模糊匹配(如輸入“dnet”返

業務邏輯 , 軟件研發 , yyds乾貨盤點 , 數據 , SQL

收藏 評論

青雲交技術圈 - Java 大視界 -- 基於 Java 的大數據實時流處理在能源行業設備狀態監測與故障預測中的應用

(centerJava 大視界 -- 基於 Java 的大數據實時流處理在能源行業設備狀態監測與故障預測中的應用/center) 引言: 嘿,親愛的 Java 和 大數據愛好者們,大家好!我是CSDN(全區域)四榜榜首青雲交!在《大數據新視界》和《 Java 大視界》系列的探索之旅中,我們已一同領略 Java 大數據在多個領域的非凡魅力。從智能教育領域用數據重塑教學模式,到智能安

spark , 大數據 , yyds乾貨盤點 , 數據 , JAVA

收藏 評論

雲端小悟空 - 我的Hadoop學習之路 - sunt99的個人頁面 -

在信息爆炸的時代,我們被海量數據所包圍。如何從這些看似混沌的數據中提取價值,曾是一個巨大的難題。直到我遇見了Hadoop,它像一位智慧的引路人,為我打開了分佈式計算世界的大門。這段學習旅程不僅是掌握一門技術,更是一場思維模式的革命。在此,我將從編程思想、技巧運用和心路歷程三個方面,分享我的學習心得。 #### **一、 編程思想的轉變:從“單體”到

大數據 , 數據 , 學習 , hadoop

收藏 評論

mob64ca140caeb2 - Java整合EasyExcel

前言 在在線教育平台中,學習時長是衡量學生學習投入、評估課程效果、優化教學策略的核心數據指標。精準統計學生視頻學習時長並生成可視化報表,能幫助教師掌握學生學習動態、學校進行教學質量評估、學生了解自身學習進度。 作為一名深耕 Java 領域多年的技術開發者,我將通過這篇實戰博客,帶大家從零構建一套 “視頻學習時長統計 + 多維度報表生成” 的完

數據 , easyexcel , JAVA , Css , 報表 , 前端開發 , ide , HTML

收藏 評論