博客 / 列表

小怪獸會微笑 - Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models(超長文本模型論文HSA)

Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models(超長文本模型論文HSA) 這篇論文介紹了 HSA-UltraLong,這是一個基於 分層稀疏注意力(Hierarchical Sparse Attention, HSA) 機制的模

分塊 , redis , 語言模型 , 自然語言處理 , 點積 , 數據庫 , 人工智能

小怪獸會微笑 - 自動駕駛強化學習Reward設計代表方法和示例demo

10個與獎勵函數設計相關的關鍵概念、技術或方法,併為每個提供一個簡化的Python代碼片段來幫助理解其思路。 碰撞懲罰 (Collision Penalty) 思路: 最基礎的安全獎勵。如果發生碰撞,則給予一個大的負獎勵。 創新點: 直接且易於實現,強制代理避免事故。 d

sed , 機器學習 , 優先級 , 自動駕駛 , 人工智能 , Css , 前端開發 , HTML