狀態轉移

標籤

貢獻3

112

01:40 AM · Nov 17 ,2025

@狀態轉移 / 博客 RSS 訂閱

Nov 19 2025

落花流水人家 - 機器學習蒙特卡洛模擬因子組合最優 spss蒙特卡洛方法結果

在很多應用場景中，馬爾可夫決策過程的狀態轉移概率 \(p(s^ {\prime}|s,a)\) 和獎勵函數 \(r\left( {s,a,s^{\prime}} \right)\) 都是未知的。這種情況一般需要智能體與環境交互，然後收集一些樣本，然後再根據這些樣本來求解最優策略，這種基於採樣的學習方法稱為模型無關的強化學習 \([1]\). 1 蒙特卡羅預

機器學習 , 狀態轉移 , 強化學習 , 機器學習蒙特卡洛模擬因子組合最優 , 人工智能 , 迭代

收藏評論

Nov 17 2025

sangwu - 70. 爬樓梯

70. 爬樓梯假設你正在爬樓梯。需要n階你才能到達樓頂。每次你可以爬1或2個台階。你有多少種不同的方法可以爬到樓頂呢？示例 1：輸入：n = 2 輸出：2 解釋：有兩種方法可以爬到樓頂。 1. 1 階 + 1 階 2. 2 階示例 2：輸入：n = 3 輸出：3 解釋：有三種方法可以爬到樓頂。 1

狀態轉移 , 數組 , yyds乾貨盤點 , i++ , 後端開發 , JAVA

收藏評論

Dec 21 2025

愛吃飯的程序媛 - 1235. Maximum Profit in Job Scheduling

題目 We havenjobs, where every jobis scheduled to be done fromstartTime[i]toendTime[i], obtaining a profitofprofit[i]. You're given thestartTime,endTimeandprofitarrays,you need to output

狀態轉移 , yyds乾貨盤點 , i++ , Time , 代碼人生

收藏評論

狀態轉移

@狀態轉移 / 博客 RSS 訂閱

落花流水人家 - 機器學習蒙特卡洛模擬因子組合最優 spss蒙特卡洛方法結果

sangwu - 70. 爬樓梯

愛吃飯的程序媛 - 1235. Maximum Profit in Job Scheduling

Product

Company

Support

Company

狀態轉移

@狀態轉移 / 博客 RSS 訂閱

落花流水人家 - 機器學習 蒙特卡洛模擬因子組合最優 spss蒙特卡洛方法結果

sangwu - 70. 爬樓梯

愛吃飯的程序媛 - 1235. Maximum Profit in Job Scheduling

落花流水人家 - 機器學習蒙特卡洛模擬因子組合最優 spss蒙特卡洛方法結果