tag 數據挖掘

標籤
貢獻55
172
03:33 PM · Oct 26 ,2025

@數據挖掘 / 博客 RSS 訂閱

趙琛 - 全國企業統一社會信用代碼(爬蟲)工商

什麼是統一社會信用代? 法人和其他組織統一社會信用代碼相當於讓法人和其他組織擁有了一個全國統一的“身份證號”,也就是説公司名可能變,統一社會信用代碼卻永遠不變。 我已經收錄了1.4億條統一社會信用代碼。 官網全國估算收錄近1.5億條左右。 統一社會信用代有什麼用? 統一社會信用代既然是企業的“身份證”,那麼通過統一社會信用代就可以在任何平台搜到該企業信息,例如企查查,天眼查,統一社會信用代永遠不

數據挖掘 , 網頁爬蟲 , JAVA , Python

收藏 評論

TuGraph - GeaFlow圖計算快速上手之K-hop算法

引言 隨着年輕人的社交需求不斷增長,各種社交軟件應運而生,這些社交軟件通常都會有好友推薦功能,根據六度分離理論,理想情況下,每個人通過6個人就可以跟所有人產生關聯,因此K-hop算法(K跳算法)被用於實現好友推薦,現在讓我們來嘗試使用GeaFlow在5分鐘內實現K-hop算法吧! K-hop(K跳)算法介紹 K-hop算法是一種基於圖論的算法,用於尋找一個起點通過K次以內跳躍能夠到達的節點,也就是

數據挖掘 , graphql , 數據庫 , 後端

收藏 評論

Alluxio - Alluxio 聯手 Solidigm 推出針對 AI 工作負載的高級緩存解決方案

作者:Wayne Gao, Yi Wang, Jie Chen, Sarika Mehta Alluxio 作為全球領先的 AI 緩存解決方案供應商, 提供針對 GPU 驅動 AI 負載的高速緩存。其可擴展架構支持數萬個節點,能顯著降低存儲帶寬的消耗。Alluxio 在解決 AI 存儲挑戰方面的前沿技術在很大程度上推動了大語言模型( LLM )在全球範圍內的成功。 “Solidigm 和 Allu

數據挖掘 , 算法 , 緩存 , 存儲 , 人工智能

收藏 評論

瘦瘦的企鵝 - 《傳統教培機構的痛點:數字化轉型如何破局?》

數字化浪潮下的困境 在當今時代,數字化浪潮正以前所未有的速度席捲全球,深刻地改變着人們的生活、工作和學習方式。這是一個數據爆炸的時代,數據成為了驅動社會發展的核心要素之一 。據統計,全球每天產生的數據量高達數萬億字節,這些數據涵蓋了人們生活的方方面面,從購物習慣到社交行為,從健康狀況到學習偏好,都被數字化記錄下來。 []() 數字化時代的技術創新日新月異,人工智能、大數據、雲計算、物聯網等新興技術

數據挖掘 , 人工智能 , android-studio

收藏 評論

Alluxio - Alluxio Enterprise AI 3.5 發佈,全面提升AI模型訓練性能

近日,Alluxio 發佈 Alluxio Enterprise AI 3.5 版本。該版本憑藉僅緩存寫入模式 ( Cache Only Write Mode )、高級緩存管理策略以及 Python 的深度集成等創新功能,大幅加速 AI 模型訓練並簡化基礎設施運維,助力企業高效處理海量數據集、優化 AI 工作負載性能。 AI 驅動的工作負載常因海量的數據管理複雜度高導致效率瓶頸以及訓練週期延長。

緩存命中率 , 機器學習 , 數據挖掘 , 緩存 , 人工智能

收藏 評論

階段性debugger - 幾款免費德國股票報價API對比|實時股票數據API

一、德國股票市場數據需求的核心挑戰 在量化交易領域,股票數據 API 的選擇直接決定策略的成敗。作為歐洲最大經濟體,德國股票市場(尤其是法蘭克福交易所)的股票報價 API 與股票實時 API 需求呈現三大核心挑戰: 時效性要求:高頻交易策略對股票實時 API 的延遲敏感度極高,需毫秒級響應支持 數據完整性:從 DAX30 藍籌股到 XETRA 小盤股,全市場覆蓋的股票數據 API 是策略有效

數據挖掘 , websocket , 人工智能 , Javascript

收藏 評論

階段性debugger - 印度股票實時數據API接口選型指南:iTick如何成為開發者優選

在全球金融數字化浪潮中,印度股票市場因其高速增長潛力備受關注。對於量化交易開發者、金融科技公司而言,穩定可靠的股票報價API接口是獲取市場數據的核心基礎設施。本文將深度對比主流印度股票API,並揭示iTick在數據服務領域的獨特優勢。 一、主流印度股票 API 接口全景掃描 1. 國際巨頭的商業方案 以彭博社為代表的傳統金融數據服務商,憑藉覆蓋全球的數據源和極高的品牌公信力,成為機構投資者的首選

數據挖掘 , websocket , 區塊鏈

收藏 評論

拓端tecdat - Python電動汽車充電網絡優化研究—泊松過程、排隊、貪心算法、模擬退火、聚類、差分演化DE、動態規劃、滾動時域預測控制

全文鏈接:https://tecdat.cn/?p=44226 原文出處:拓端數據部落公眾號 分析師:Zhichao Tong 在“雙碳”戰略推進下,電動汽車保有量激增已成為必然趨勢,而充電網絡的資源閒置、佈局失衡、負荷波動三大問題,正成為制約行業發展的關鍵瓶頸。作為長期服務能源與交通領域的數據分析團隊,我們曾為某省會城市完成充電網絡優化諮詢項目,通過數據建模與算法設計,幫助當地緩解

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

此星光明 - Google Earth Engine(GEE)——全球電力系統預測分佈

關於全球電力基礎設施的有限數據使得我們難以應對電力供應和氣候變化方面的挑戰。雖然經常有關於輸電網絡的高壓數據,但中壓和低壓數據往往不存在或無法獲得。這給從事電力接入議程、電力部門復原力或氣候變化適應工作的從業人員帶來了挑戰。利用地理空間數據分析的最先進的算法,我們創建了第一個具有開放許可證的全球電力系統綜合地圖。我們發現,全球97%的人口生活在中壓線10

預測 , 數據挖掘 , 電力 , 開發語言 , 後端開發 , GEE , harmonyos

收藏 評論

拓端tecdat - 專題:2025AI產業全景洞察報告:企業應用、技術突破與市場機遇|附920+份報告PDF、數據、可視化模板彙總下載

原文鏈接:https://tecdat.cn/?p=44391 原文出處:拓端抖音號@拓端tecdat 2025年,AI產業已邁入“上游算力支撐-中游技術突破-下游應用落地”的全鏈路爆發期。生成式AI重構企業運營效率,對話式AI優化人機交互體驗,AI視頻生成開闢內容創作新賽道,而算力芯片與生態建設則成為支撐產業前行的核心底座。但繁榮背後,產業鏈各環節仍面臨結構性矛盾:中小企業落地遭遇“技能

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

藍色憂鬱花 - 數據倉庫數據傳輸模式 數據倉庫的三種模式

1、數據倉庫 數倉分層:ODS(Operational Data Store)直接存放原始數據,DWD(Data Warehouse Detail)對數據進行清洗 ,DWS(Data Warehouse Service)輕度彙總(存儲每天數據的彙總),DWT(Data Warehouse Topic)重度彙總(存儲一段時間數據的彙總),DIM維度層(事實表的描述信息,何人、

數據倉庫數據傳輸模式 , 數據挖掘 , 大數據 , 數據倉庫 , 數據庫

收藏 評論

是Dream呀 - AI驅動開發新範式:基於 CodeWave 的考勤系統落地實踐

在快節奏的企業軟件開發環境中,如何快速將想法轉化為可執行的代碼應用,成為了每個開發團隊追求的目標。網易CodeWave智能生成應用的出現,為我們提供了一個全新的解決方案——通過自然語言描述快速構建全棧應用,讓開發效率實現質的飛躍。 一、智能生成應用:重新定義開發流程 1.核心功能與價值 網易CodeWave的智能生成應用功能,其核心創新

數據挖掘 , 數據 , 自然語言 , 人工智能 , 主鍵

收藏 評論

拓端tecdat - 2025人形機器人產業鏈全景分析報告:核心技術與市場趨勢|附130+份報告PDF、數據、可視化模板彙總下載

原文鏈接:https://tecdat.cn/?p=44288 原文出處:拓端抖音號 @拓端 tecdat 2023年特斯拉Optimus初代機帶着73公斤的“體重”亮相時,行業還在焦慮“它的續航能否撐過1小時”;僅僅兩年後,宇樹科技G1就以35公斤的輕量化設計,實現2.5-7.5mph的速度突破——這場“瘦身革命”的背後,藏着人形機器人量產的兩大關鍵:減速器精密傳動技術的國產突圍,以及鎂合金、

機器學習 , 數據挖掘 , 算法 , 深度學習

收藏 評論

拓端tecdat - 專題:2025中國醫療器械出海現狀與趨勢創新發展研究報告|附160+份報告PDF、數據、可視化模板彙總下載

原文鏈接:https://tecdat.cn/?p=44279 原文出處:拓端抖音號@拓端tecdat 2024年,中國醫療器械行業正站在“從本土領先到全球突圍”的關鍵節點——一邊是邁瑞醫療把監護儀賣到190多個國家,海外營收佔比超48%;一邊是不少企業卡在歐盟MDR認證環節,臨牀數據補了3次仍未通過。這種“一邊風光一邊難”的反差,本質是全球醫療需求擴張與國內競爭加劇的必然結果。 引言

數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

拓端tecdat - Python梯度提升樹、XGBoost、LASSO迴歸、SVM預測中國A股上市公司數據研發融合CEO與公司特徵及SHAP可解釋性

全文鏈接:https://tecdat.cn/?p=44265 原文出處:拓端數據部落公眾號 分析師:Liu Qing 引言 在創新驅動發展戰略深入推進的當下,企業研發投入成為經濟高質量發展的核心動力,而研發費用加計扣除、高新技術企業税收優惠等政策,既激發了企業創新活力,也催生了部分企業的研發操縱行為。這類通過虛增研發支出、調整會計處理方式套取政策紅利的行為,不僅導致創新資源錯配,還

機器學習 , 數據挖掘 , 人工智能 , 深度學習

收藏 評論

憂鬱的吐司 - 數字人直播屢遭封禁?揭秘背後核心原因給出解決方案!

在AI浪潮下,數字人直播成為電商直播新風口。不少用户的數字人直播間卻遭遇平台封禁,甚至被永久封號。這讓人疑惑:數字人直播合規嗎?平台允許嗎? 實際上,數字人直播本身不違規。抖音、快手、淘寶等主流及新興平台均未禁止或限制。多數數字人直播間違規,主要是觸犯以下幾類平台規定:(青否數字人源頭v:zhibo175) 1、直播內容違法違規,這是最嚴重的違規類型: 涉及色情、暴力、恐怖等違背公序良俗的內容 詐

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

憂鬱的吐司 - 青否雙AI數字人開啓“主播+助播”新時代,打造超硬核直播體驗!zhibo 175

一場直播,兩位主播,一個講解專業細緻,一個捧場互動熱烈——這不是傳統直播團隊的標配,而是青否數字人帶來的AI直播新範式。 在數字人技術蓬勃發展的今天,青否突破了單數字人直播的侷限,創新性地實現了雙AI數字人協同直播,讓“主播+助播”的精準分工在虛擬世界完美重現。(青否數字人源頭v:zhibo175) 從“一人説”到“兩人搭”,AI協作邏輯重塑直播體驗(青否數字人源頭v:zhibo175) 青否數

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

拓端tecdat - 專題:2025AI時代的醫療保健業:應用與行業趨勢研究報告|附130+份報告PDF、數據、可視化模板彙總下載

原文鏈接:https://tecdat.cn/?p=44257 原文出處:拓端抖音號@拓端tecdat 2025年的醫療保健行業,正站在“壓力”與“機遇”的十字路口:一邊是中國65歲及以上人口占比將從15.6%飆升至2070年的42%,慢性病護理需求快壓垮現有體系;一邊是AI技術從“概念熱”走到“落地實”,醫療AI投資佔比4年翻倍至40%,成了破局的關鍵。 引言 本報告洞察基於《Ro

機器學習 , 數據挖掘 , 人工智能 , 深度學習

收藏 評論

拓端tecdat - 2025全球生成式人工智能AIGC產業全景與行業應用研究報告|附900+份報告PDF、數據、可視化模板彙總下載

**原文鏈接:https://tecdat.cn/?p=44249 原文出處:拓端抖音號@拓端tecdat** 2024年3月,彭博一句“2032年AIGC市場規模將達1.3萬億美元(約合9.2萬億元人民幣)”,徹底點燃全球產業熱情——這並非空談,而是生成式AI從“技術突破”邁向“規模化落地”的必然結果。當前AIGC產業已呈現“算力硬件先行、垂直應用爆發、風險防控補位”的鮮明特徵:硬件投資

數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

拓端tecdat - Python實現社交網絡分析SNA公司董事數據與跨行業網絡橋接識別|附代碼數據

全文鏈接:https://tecdat.cn/?p=44242 原文出處:拓端數據部落公眾號 分析師:Song Yang 引言 在數字化時代,企業間的關聯早已超越股權與業務合作,董事作為核心決策參與者,其跨企業任職形成的社交網絡逐漸成為資源流動、信息傳遞與治理效能的關鍵載體。從數據科學視角來看,董事網絡本質是複雜社會網絡的商業映射,其結構特徵直接影響企業戰略選擇、風險傳導與資源整合效率。這一現象

機器學習 , 數據挖掘 , 人工智能 , 深度學習

收藏 評論

青否Ai - 視頻號平台數字人直播帶貨已經跑通,分享全套數字人直播間搭建解決方案!

自去年下半年起,我們合作的很多直播團隊藉助青否數字人系統,在視頻號實現業績突破,驗證了這一賽道的巨大潛力。 作為深耕AI直播的技術團隊,青否數字人正式推出全網首套AI直播全鏈路解決方案! 一站式解決運營痛點,讓直播更智能、更專業、更高效! 視頻號AI話術 一鍵掃碼授權視頻號商品,AI基於產品信息自動生成高匹配話術。 直播過程中實時動態改寫內容,確保每場講解絕不重複,徹底告別文案焦慮。 其中【AI

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

愛聽歌的金針菇 - 為什麼企業數字化轉型都是從CRM開始的?

在數字化浪潮席捲各行各業的今天,企業轉型早已不是“選擇題”而是“生存題”。但多數企業在轉型中陷入“重技術、輕價值”的誤區,投入大量資源卻難見實效。 究其根本,數字化轉型的核心是“以客户為中心”的價值重構,而CRM(客户關係管理系統)恰好成為串聯這一核心的關鍵樞紐。它不僅是管理客户信息的工具,更是打通數據、流程、決策的“操作系統”,成為企業數字化轉型不可或缺的核心支撐。 其中,珍客CRM

數字化轉型 , 數據挖掘 , 知識 , crm系統 , 人工智能

收藏 評論

得物技術 - 得物管理類目配置線上化:從業務痛點到技術實現

一、引言 在電商交易領域,管理類目作為業務責權劃分、統籌、管理核心載體,隨着業務複雜性的提高,其規則調整頻率從最初的 1 次 / 季度到多次 / 季度,三級類目的規則複雜度也呈指數級上升。傳統依賴數倉底層更新的方式暴露出三大痛點: 行業無法自主、快速調管理類目; 業務管理類目規則調整,不支持校驗類目覆蓋範圍是否有重複/遺漏,延長交付週期; 規則變更成功後、下游系統響應滯後,無法及時應用最新

數據挖掘 , 效率 , 數據分析 , 效率工具 , 後端

收藏 評論

deephub - 如何生成逼真的合成表格數據:獨立採樣與關聯建模方法對比

在數據科學的實際工作中,我們經常會遇到這樣的情況:手頭的真實數據要麼不夠用,要麼因為隱私合規問題無法直接使用,但這些數據往往包含重要的統計規律,但直接拿來做實驗或測試卻十分的麻煩。 這時候合成數據就派上用場了,簡單説就是根據現有數據集的分佈特徵,人工創造出任意數量的新數據行,讓這些"假數據"在統計意義上跟真實數據無法區分。聽起來像是是在"造假",但實際上這是一項真正的技術活——既要保證數據的真實性

機器學習 , 數據挖掘 , 人工智能 , Python

收藏 評論