動態

詳情 返回 返回

Python實現社交網絡分析SNA公司董事數據與跨行業網絡橋接識別|附代碼數據 - 動態 詳情

全文鏈接:https://tecdat.cn/?p=44242

原文出處:拓端數據部落公眾號

分析師:Song Yang

封面

引言

在數字化時代,企業間的關聯早已超越股權與業務合作,董事作為核心決策參與者,其跨企業任職形成的社交網絡逐漸成為資源流動、信息傳遞與治理效能的關鍵載體。從數據科學視角來看,董事網絡本質是複雜社會網絡的商業映射,其結構特徵直接影響企業戰略選擇、風險傳導與資源整合效率。這一現象並非偶然,隨着市場競爭加劇與跨界合作增多,董事憑藉多元任職經歷搭建的“隱形橋樑”,既可能成為企業發展的助推器,也可能暗藏系統性風險傳導的隱患。

本文改編自我們為某金融機構完成的企業治理諮詢項目,核心目標是通過數據挖掘技術拆解董事網絡的內在邏輯,為投資者、監管機構與企業管理層提供決策支撐。作為長期深耕商業數據分析的團隊,我們具備從數據採集、模型構建到落地應用的全流程服務能力,已助力數十家企業解決網絡分析類實際問題。

研究以專業董事數據庫的真實任職數據為基礎,通過Python生態工具構建網絡模型,融合四種核心中心性指標實現關鍵董事識別,同時創新引入跨行業網絡對比與橋接節點分析,完整呈現董事網絡的“核心-邊緣”結構與行業差異特徵。

本文內容源自過往項目技術沉澱與已通過實際業務校驗,該項目完整代碼與數據已分享至交流社羣。閲讀原文進羣,可與600+行業人士交流成長;還提供人工答疑,拆解核心原理、代碼邏輯與業務適配思路,幫大家既懂怎麼做,也懂為什麼這麼做;遇代碼運行問題,更能享24小時調試支持。

 

1. 核心理論與方法簡化

1.1 社交網絡分析核心概念

社交網絡分析(SNA)是通過數學模型描述節點(個體/組織)與邊(關聯關係),並量化網絡結構與節點重要性的分析方法。本文聚焦四個核心中心性指標,用通俗語言解釋其商業意義:

  • 度中心性:衡量董事直接關聯的同行數量,反映“朋友圈廣度”;
  • 接近中心性:衡量董事到達其他節點的平均距離,反映“信息獲取速度”;
  • 中介中心性:衡量董事作為不同羣體連接橋樑的頻率,反映“資源調配能力”;
  • 特徵向量中心性:不僅關注連接數量,更重視連接對象的重要性,反映“行業話語權”。

1.2 技術工具與國內適配性

本文使用的Python生態工具(NetworkX、Matplotlib、Seaborn)均為開源免費軟件,國內可直接訪問使用,無需特殊配置;數據來源為BoardEx數據庫,國內用户可通過合規數據服務商獲取,替代方案包括Wind、同花順iFinD等平台的董事任職數據,功能與數據完整性基本一致。

2. 數據概況

2.1 數據基礎信息

研究採用的董事數據覆蓋2023-2024年任職記錄,經清洗後保留有效記錄20210條,涉及15071名獨立董事與2853家企業,包含60個核心字段(如董事ID、企業ID、任職時間、行業分類等)。

2.2 數據分佈特徵

數據呈現出鮮明的商業屬性特徵:行業分佈分散且均衡,非執行董事與獨立董事佔比超七成,企業董事會規模集中在5-15人區間,董事的網絡連接數量呈現“少數人連接廣泛、多數人連接有限”的長尾分佈特徵。

上圖清晰展示了行業分佈、董事角色分佈、董事會規模分佈與網絡大小分佈四大核心特徵,為後續網絡構建提供了數據基礎支撐。

3. 網絡構建與代碼實現

3.1 核心代碼(修改後版本)

以下代碼實現了網絡構建、中心性計算與行業對比的核心邏輯,關鍵部分已省略(用…替代),完整代碼可通過社羣獲取:

#!/usr/bin/env python3# -*- coding: utf-8 -*-"""公司董事行業網絡對比分析工具功能:構建董事社交網絡、計算核心指標、生成行業對比可視化"""import pandas as pdimport numpy as npimport networkx as nximport matplotlib.pyplot as pltimport seaborn as snsfrom collections import defaultdict, Counterimport warningswarnings.filterwarnings('ignore')# 設置繪圖參數plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial Unicode MS']plt.rcParams['axes.unicode_minus'] = Falseplt.rcParams['figure.figsize'] = (14, 10)def build_sector_network(df_processed, sector_name): """ 構建單個行業的董事網絡 參數:預處理後的數據集、行業名稱 返回:網絡對象 """ net = nx.Graph() edge_counts = defaultdict(int)# 按企業分組獲取董事列表 company_director_map = df_processed.groupby('boardid')['directorid'].apply(list).to_dict()

3.2 代碼功能説明

上述代碼實現了三大核心功能:一是數據預處理與清洗,篩選有效任職記錄;二是行業網絡構建,以董事為節點、共同任職為邊建立無向網絡;三是核心指標計算,自動生成四大中心性指標與網絡結構參數;四是行業對比與跨行業節點識別,為後續分析提供數據支撐。


相關文章

相關文章

使用Python和SAS Viya分析社交網絡

全文鏈接:http://tecdat.cn/?p=7303


4. 核心分析結果

4.1 整體網絡結構特徵

構建的董事網絡包含15071個節點(董事)與63479條邊(共同任職關係),網絡密度為0.000559,最大連通分量佔比53.2%。這表明董事網絡是“低密度、高連通”的複雜網絡,且呈現典型的“小世界”特徵——平均聚類係數高達0.892,意味着董事傾向於與同行的關聯者建立連接,信息傳遞效率高。

上圖展示了四大中心性指標的分佈特徵與相關性:度中心性和特徵向量中心性高度相關(相關係數>0.8),説明“朋友圈廣”的董事往往連接的也是行業內重要人物;中介中心性分佈極不均衡,少數董事掌握着不同羣體間的連接權。

4.2 關鍵董事識別

通過綜合四大中心性指標得分,識別出排名前十的核心董事(示例前5名):

  1. Barry O’Dwyer(綜合得分0.1045)
  2. Moni Mannings(綜合得分0.1045)
  3. Claudia Arney(綜合得分0.1039)
  4. Elisabeth Scott(綜合得分0.1034)
  5. Susan Kilsby(綜合得分0.1010)
    這些董事普遍具備跨行業任職經歷,平均連接董事數量是普通董事的7倍以上,在信息傳遞與資源整合中發揮着關鍵作用。

4.3 網絡可視化結果


可視化結果清晰呈現了網絡的“核心-邊緣”結構:核心區域由高中心性董事構成,邊緣區域為普通董事;網絡中存在多個緊密連接的“小圈子”(可能對應行業集羣或企業聯盟),部分董事作為“橋接節點”連接不同圈子,這些節點正是中介中心性較高的核心人物。

5. 行業對比與跨行業分析

5.1 行業對比結果

選取數據量最大的兩個行業(專業金融、商業服務)進行深度對比,核心指標如下:

指標 專業金融行業 商業服務行業
董事總數 1882 1491
連接總數 7110 4910
網絡密度 0.004 0.004
平均聚類係數 0.952 0.965
平均度數 10.514 6.703
最大度數 21 32
最大連通分量佔比 3.9% 2.5%


對比發現:專業金融行業網絡規模更大,連接更廣泛;商業服務行業聚類係數更高,內部凝聚力更強;兩個行業的網絡均呈現“碎片化”特徵,最大連通分量佔比均不足4%,説明行業內董事主要活躍於小規模圈子。

5.2 跨行業橋接董事識別

共識別出39名同時任職於兩個行業的跨行業董事,他們成為行業間信息傳遞與資源流動的關鍵橋樑。其中排名前五的核心橋接董事:

  1. Penny Judd(專業金融2家+商業服務2家)
  2. Sarah Ing(專業金融3家+商業服務1家)
  3. Tim Bunting(專業金融2家+商業服務1家)
  4. Libby Chambers(專業金融2家+商業服務1家)
  5. Mandy Donald(專業金融2家+商業服務1家)
    這些董事的存在打破了行業壁壘,為企業跨界合作、風險分散提供了天然渠道,其網絡價值遠超單一行業內的董事。

6. 實踐應用建議

6.1 對投資者的建議

優先關注核心董事任職的企業,這類企業往往具備信息優勢與資源整合能力;通過網絡分析識別企業間的隱性關聯,規避系統性風險;將董事網絡位置作為評估企業治理質量的重要指標。

6.2 對監管機構的建議

重點監控核心橋接董事的任職行為,防範風險跨行業傳導;要求企業披露董事跨企業任職信息,提升治理透明度;基於行業網絡特徵制定差異化監管政策。

6.3 對企業的建議

招聘董事時關注其網絡位置與連接質量,通過核心董事引入外部資源;利用董事網絡獲取行業最佳實踐,優化治理結構;藉助跨行業董事拓展業務邊界,實現戰略升級。

7. 總結與服務支持

本文通過社交網絡分析技術,完整拆解了董事網絡的結構特徵、行業差異與核心價值,創新點在於融合多維度中心性指標實現關鍵節點精準識別,同時挖掘跨行業橋接董事的獨特價值,為相關方提供了數據驅動的決策支撐。
我們始終堅持“買代碼不如買明白”的服務理念,人工創作比例超90%,有效規避查重風險與代碼漏洞;24小時響應“代碼運行異常”應急修復服務,效率較自行調試提升40%。項目完整代碼、數據與詳細解析已分享至交流社羣,進羣可與600+行業人士交流成長,獲取人工答疑與代碼調試支持,真正做到既懂“怎麼做”,也懂“為什麼這麼做”。
無論是學術研究、課程設計還是企業實際項目,我們都能提供定製化的數據分析解決方案,助力快速落地技術應用、提升成果質量。

封面

關於分析師

在此對 Song Yang 對本文所作的貢獻表示誠摯感謝,他在蘭卡斯特大學完成了商業分析專業的碩士學位,專注數據相關領域研究。擅長 R 語言、Python,在數據處理與分析、機器學習、實證研究以及學術與商業報告撰寫方面具備紮實能力。

user avatar zhidechaomian_detxs7 頭像
點贊 1 用戶, 點贊了這篇動態!
點贊

Add a new 評論

Some HTML is okay.