tag Python

標籤
貢獻867
1082
06:37 AM · Oct 27 ,2025

@Python / 博客 RSS 訂閱

fangpin - 從0到1:揭秘LLM預訓練前的海量數據清洗全流程

讀完這篇文章,你將用監督微調(SFT)把一個 1.5B 規模的數學模型在 GSM8K 上的零樣本推理正確率從 1.56% → 62.9%,同時把輸出格式遵循率從 18.9% → 100%。我們將完整走通數據集下載、Prompt 架構、訓練配置和評估方法,所有代碼均來自本倉庫 alignment 文件夾,保證可復現與透明。 本文將深入剖析 llm-from-scratch

lua , 人工智能 , 深度學習 , Json , Python

收藏 評論

微芒不朽 - python 格式化、set類型和class類基礎知識練習

原創:叫我詹躲躲 來源:思否 鏈接:https://segmentfault.com/a/11... 1.輸出 %佔位符 lastname = 'hello' firstname = 'world' print('我的名字是%s %s' %(lastname,firstname)) 2.常用的格式化字符 %c 字符 %s 通過str來格式化 %i 有符號十進制整數 %d 有符號十進制整

python3.x , python3.5 , pythonic , Python

收藏 評論

level - python models 上傳文件 定義 屬性類型合適

方法1:   1.安裝requests_toolbelt依賴庫 #代碼實現 def upload(self): login_token = self.token.loadTokenList() for token in login_token: tempPassword_url = self.confi

字段 , 字符串 , 後端開發 , 代碼實現 , Python

收藏 評論

技術極客 - 一鍵導出 / 備份「有道雲筆記」工具

🔥 如何一鍵備份有道雲筆記?這款Python神器讓數據安全無憂! 你是否曾擔心過有道雲筆記的數據安全?想不想擁有一份本地備份卻苦於手動操作繁瑣?今天為大家推薦一款終極有道雲筆記備份工具——youdaonote-pull,這是一個用Python編寫的開源腳本,能幫助你輕鬆導出所有有道雲筆記,讓珍貴筆記數據永不丟失! 📌 為什

API , 有道 , Css , 前端開發 , HTML , Python

收藏 評論

梓源 - python如何做性能測試自動化

深入理解《節奏規劃:Python 自動化 + 性能壓力測試的 3 階段學習進度安排》 在現代軟件開發中,自動化和性能測試顯得尤為重要。本文將解析《節奏規劃:Python 自動化 + 性能壓力測試的 3 階段學習進度安排》一文的核心理念,旨在幫助讀者更高效地掌握所需技能,並通過階段性的學習策略來提升學習效果。 學習指導的核心理念 該文章強調了學習過程中的系統性和階段性,以下是三個主

性能測試 , Python

收藏 評論

夢裏憂鬱 - Rust的內存安全三原則:所有權、借用及生命週期

引言 Rust 作為一門現代系統編程語言,以其內存安全、併發安全和高性能著稱。其中,所有權(Ownership)和借用(Borrowing)機制是 Rust 的核心特性之一,它們在編譯時強制執行內存管理規則,避免了常見的內存錯誤如空指針、數據競爭和內存泄漏,而無需依賴垃圾回收機制。這使得 Rust 在系統編程、Web 開發和嵌入式領域廣受歡迎。 所有權機制確保每個值在

作用域 , 生命週期 , rust , 後端開發 , Python

收藏 評論

網絡安全守衞 - redmine異構環境遷移並升級到最新版本_linuxiou

版本差異概覽 PokemonRedExperiments項目從baselines到v2版本的升級帶來了顯著的技術改進,主要集中在強化學習環境優化、依賴管理升級和地圖探索機制重構。以下是核心變化對比: 依賴版本更新 關鍵依賴

強化學習 , CUDA , 前端開發 , Javascript , Python

收藏 評論

deephub - 別隻會One-Hot了!20種分類編碼技巧讓你的特徵工程更專業

機器學習模型處理不了原始文本。無論是線性迴歸、XGBoost還是神經網絡,遇到 "red" 、 "medium" 、 "CA" 這類分類變量都沒法直接處理。所以必須把它們轉成數字這個過程就是分類編碼。 大家入門時肯定都學過獨熱編碼或序數編碼,

機器學習 , 數據挖掘 , 分類 , 人工智能 , 前端開發 , Javascript , Python

收藏 評論

mob64ca13f937ae - AI 開發不僅僅是算法訓練,六節課幫你快速瞭解地平線 AI 軟硬件產品開發全過程 - 極術社區

隨着人工智能技術的快速發展,AI玩具已經從簡單的語音交互升級為具備情感識別、自適應學習、多模態交互等能力的智能夥伴。本文將從核心技術、系統架構、開發挑戰等方面,深入分析AI玩具開發技術。 一、AI玩具的核心技術組成 AI玩具的開發涉及多個技術領域,主要包括: 1. 語音交互技術 自動語音識別(ASR) 用

架構 , 後端開發 , 系統架構 , 人工智能 , 解決方案 , 語音識別 , Python

收藏 評論

mob64ca14079fb3 - 不容錯過!這三個堪稱神級的 Python 網站真香啊!

常用並且免費的,可直接在線運行【Python】代碼的平台 Repl.it Repl.it - 提供實時交互式環境,適合快速實驗代碼:https://repl.it/languages/python Jupyter Notebook Jupyter Notebook (Google Colab) - 可以通過 Google 賬户在線

開發語言 , google , 後端開發 , Python

收藏 評論

week - Pycharm 配置 virtualenv

1. virtualenv 説明 在開發Python應用程序時,系統默認的Python版本可能會不兼容這個應用程序, 如果同時開發多個應用程序, 可能會用到好幾個版本的python環境, 這種情況下,每個應用可能需要各自擁有一套"獨立"的Python運行環境。virtualenv就是用來為一個應用創建一套"隔離"的Python運行環境的工具。virtualenv是python的一個虛擬化環境工具,

virtualenv , pycharm , Python

收藏 評論

不愛吃香菜 - Python 的內置函數 complex

Python 的內置函數 complex() 用於創建複數對象,其完整語法為: complex(real=0, imag=0) complex(string) # 字符串形式 詳細功能説明 數值參數構造 第一個參數 real 表示實部(默認為0) 第二個參數 imag 表示虛部(默認為0) 示例: complex(3, 4) # 返回 (3+

知識 , Python

收藏 評論

網絡安全俠 - clickhouse 表引擎相關 - 夜中孤影的個人空間 -

ClickHouse 中至關重要的兩類複製表引擎:ReplicatedMergeTree 和 ReplicatedReplacingMergeTree。它們是構建 ClickHouse 高可用、高可靠分佈式集羣的基石。 核心概念:複製與複製表引擎 首先,要理解 “Replicated” 前綴的含義。它指的是 表級別的複製,基於 ZooKeep

hive , hadoop , 後端開發 , clickhouse , SQL , hbase , Python

收藏 評論

藍色憂鬱花 - 【Flutter 問題系列第 73 篇】如何在 Flutter 應用中進行屏幕適配(含使用教程、原理解析)_flutter 屏幕和字體適配

鴻蒙Flutter三方庫適配指南:插件適配原理 大家好,歡迎來到鴻蒙Flutter三方庫適配指南系列教程。今天我們將會深入探討鴻蒙系統中Flutter插件的適配原理。這部分內容對於想要將現有的Flutter插件移植到鴻蒙平台或者為鴻蒙平台開發新插件的開發者來説非常重要。 什麼是Flutter插件? 在開始講解適配原理之前,我們先簡單回顧

華為 , dart , API , 後端開發 , flutter , harmonyos , Python

收藏 評論

mob64ca13f96cda - Kubernetes Pod篇:帶你輕鬆玩轉Pod

一、Pod 基礎核心概念 1. 什麼是 Pod? Pod 是 Kubernetes 中最小部署單元,代表集羣中的一個運行進程,可包含一個或多個緊密耦合的容器,這些容器共享網絡、存儲資源和 Linux 命名空間。 不是直接管理容器,而是通過 Pod 封裝容器; 其他控制器(Deployment、StatefulSet 等

容器 , Pod , kubernetes , 後端開發 , 重啓 , 雲原生 , Python

收藏 評論

deephub - 機器學習超參數調優:十個實用的貝葉斯優化(Bayesian Optimization)進階技巧

貝葉斯優化(Bayesian Optimization, BO)雖然是超參數調優的利器,但在實際落地中往往會出現收斂慢、計算開銷大等問題。很多時候直接“裸跑”標準庫裏的 BO,效果甚至不如多跑幾次 Random Search。 所以要想真正發揮 BO 的威力,必須在搜索策略、先驗知識注入以及計算成本控制上做文章。本文整理了十個經過實戰驗證的技巧,能幫助優化器搜索得更“聰明”,收斂更快,顯著提升模型

機器學習 , 貝葉斯 , 人工智能 , 深度學習 , Python

收藏 評論

DontLetMeDown - 使用 Spire.XLS for Python 高效讀取 Excel 數據

在當今數據驅動的世界中,Python 已成為數據處理和分析的首選工具。而 Excel 文件作為最常見的數據存儲格式之一,如何高效、準確地在 Python 中讀取和處理 Excel 數據,成為了許多開發者和數據分析師面臨的挑戰。傳統的 Python Excel 庫在處理複雜 Excel 文件(如包含公式、樣式、合併單元格等)時,有時會顯得力不從心,甚至性能不佳。 本文將向您介

辦公效率 , excel , Python

收藏 評論

lingyuli - java大文件上傳解決方案_51CTO博客

文章目錄 前言 一、前後端大文件上傳 1.方案描述 2.後端代碼 3.驗證 預處理文件 接口調用 二、純後端大文件處理 1.方案描述 2.後端代碼 3.驗證 三、java文

初始化 , 上傳 , 後端開發 , springboot , JAVA , 唯一標識 , Python

收藏 評論

mob64ca14017c37 - defineModel的值為什麼TS推斷可能是undefined

# 編寫一個求平均值的函數 def f(*m): s = 0 lst = [] for i in m: while str(i).isnumeric(): s += i lst.append(i) else: print('輸入端內的內容包含有

機器學習 , 字符串 , 時間戳 , 人工智能 , Python

收藏 評論

小拍Piper - 併發和並行 | Python中實現多線程 threading 和多進程 multiprocessing

併發和並行 | Python中實現多線程 threading 和多進程 multiprocessing 昨天晚上組會輪到我彙報技術內容,最近正在和 ray 以及 spark 打交道,索性講一下併發和並行。反正大家都是管理學院的,平時很少接觸這種,因此這個選題不大可能因為內容基礎而貽笑大方。 本文擺一擺併發和並行。附上很簡單的 Python 代碼,涉及到自帶庫 threading 和 multipr

多線程 , 多進程 , Python

收藏 評論

柚子 - python包管理神器Poetry

一、起因 最近在逛一些當下比較熱的python開源代碼(fastapi、langchain、redash)的時候,發現項目根目錄都很難見到requirments.txt這個包依賴文件了,取而代之的是pyproject.toml文件和poetry.lock文件。而我,還只會使用requirments.txt,來自程序員的直覺是,我已經落伍了,不由得一陣危機感,隨之而來的是幾個問題: pyproj

conda , 包管理 , pip , 後端 , Python

收藏 評論

TANKING - Python寫一個GUI界面,這個界面實時跟隨微信窗口移動

Python寫一些簡單的GUI界面也是非常簡單的,並且Python有着豐富的庫,這些庫可以很方便我們去操作Windows系統,搭配界面,可以做出很多精美的小工具。本文的案例寫一個簡單的實例,使用Python創建一個窗口,這個窗口實時監聽微信PC版客户端窗口的狀態,並且實時跟隨在微信電腦版的右側。 代碼 import tkinter as tk import win32gui import win3

gui , tkinter , win32gui , win32api , Python

收藏 評論

mob64ca14082604 - 最新Python學習路線發佈,值得收藏 - 編程叫獸的個人空間 -

假設你是一個外賣騎手,每天穿梭在城市的大街小巷,風吹日曬,收入卻並不穩定。2025年的外賣行業競爭激烈,平台算法不斷優化,騎手的接單效率直接影響收入。你意識到,掌握編程技能不僅能提升工作效率,還可能打開新的職業機會。於是,你決定利用業餘時間學習Python,從零開始轉型。 一、學習動機:為什麼外賣騎手要學Python? 優化配送效率

實踐項目 , 人工智能 , 前端開發 , Javascript , Python , Web

收藏 評論