tag 相似度

標籤
貢獻19
63
06:36 PM · Nov 16 ,2025

@相似度 / 博客 RSS 訂閱

軟件求生 - 震撼!SpringAI 扛起多模態大旗:Google Vertex AI 嵌入模型太強了!

大家好,我是小米。 今天我一定要和你們分享一個我最近“玩到停不下來”的東西: Google Vertex AI 的多模態向量模型(Multimodal Embedding)整合進 SpringAI。 你有沒有這種感覺: 明明我們已經用文本向量模型玩得飛起,做語義搜索、做相似度匹配、做推薦算法……結果這時候突然有人告訴你:

機器學習 , yyds乾貨盤點 , google , 相似度 , 人工智能 , 模態

收藏 評論

mob64ca12e9cad4 - aigc疑似度檢測工具

在現代信息技術的發展中,“aigc疑似度檢測工具”作為一種智能輔助工具越來越被廣泛應用。在內容生成、語義理解等領域,通過其強大的檢測能力,能夠識別出生成內容與真實內容之間的相似性,進而提高信息的準確性和可靠性。然而,伴隨着這一技術的進步,我們也面臨着一系列的挑戰,比如如何有效運行和優化這一類工具。 背景定位 當前,aigc技術的推廣已成為整個行業的趨勢。然而,在構建aigc疑似度

配置文件 , 相似度 , aigc , ci

收藏 評論

mob64ca140e76c8 - 帶有Python的AI –自然語言處理

在使用Python實現之前,我們先理解AI的運作模式,假如你面前有一個非常聰明,但完全不識字的“外星大腦”(AI)。它的記憶力超強,算得飛快,但它一開始完全不懂“蘋果”、“愛”、“運行”這些詞是什麼意思。你的任務就是教會它理解人類説的話。 這個過程我們可以分為幾個關鍵的步驟: 第一步:把話拆成“零件” —— 分詞 你對着外星人説:“我今天吃了一個大蘋果。

相似度 , 詞向量 , Css , 前端開發 , HTML , Python

收藏 評論

lu952450497 - 基於信任的協同過濾算法解析與 Python 實現(一)

一、為什麼需要“信任” 傳統 User-CF 的核心假設是: 相似用户 = 好的推薦來源 但在真實系統中存在明顯問題: 數據稀疏下,相似度極不穩定 相似 ≠ 可靠(刷單、噪聲用户) 用户行為具有明顯的“圈層”效應 在很多產品中(社交、社區、電商): 用户之間存在 顯式或隱式關係 朋友 / 關注 / 專家 的行為

顯式 , 相似度 , 權重 , 人工智能 , 數據結構與算法

收藏 評論

全棧技術開發者 - 聚類和降維有什麼區別與聯繫?譜聚類與K-Means有什麼本質異同?密度聚類如何處理噪聲數據和異常點?降維是否總能提升聚類效果?

在現代數據科學與人工智能研究中,數據的規模與複雜性呈指數增長。每一個高維數據集不僅包含大量觀測值,還藴含着潛在的結構信息,這些結構可能體現為樣本之間的相似性、變量之間的相關性,或更高階的非線性模式。面對這樣的數據,人類直覺和簡單統計方法往往難以捕捉其內在規律。無監督學習因此成為理解複雜數據的核心工具,其中聚類與降維是最基礎也是最重要的兩類方法。 聚類強調在無標籤條件下發現樣

機器學習 , 聚類 , yyds乾貨盤點 , 數據 , 相似度 , 人工智能

收藏 評論

lu952450497 - KNN算法實現

一、KNN 算法是什麼 KNN(k-Nearest Neighbors) 是最近鄰類算法中最經典的一種,用於: 分類問題(多數投票) 迴歸問題(均值 / 加權均值) 核心思想一句話: 一個樣本屬於哪一類,由“離它最近的 K 個樣本”決定。 KNN 沒有訓練過程,本質是 基於距離的搜索算法。 二、算法數學定義 給定:

相似度 , 人工智能 , 數據結構與算法 , ide , Python

收藏 評論

码海舵手之心 - Elasticsearch: 基於Text Embedding的文本相似性搜索

語義檢索學習 1. 基礎概念篇 1.1 什麼是語義搜索? **語義搜索是一種解讀單詞和短語含義的搜索引擎技術。**語義搜索的結果將返回與查詢含義相匹配的內容,而不是與查詢字面意思相匹配的內容。 語義搜索是一系列的搜索引擎功能,包括從搜索者的意圖及其搜索上下文中理解單詞。 這種類型的搜索旨在根據上下文更準確地解讀自然語言來提高搜索結果的質量。語義搜索藉

System , 搜索 , 相似度 , 後端開發 , Python

收藏 評論

mb694a37feede5d - 掌握降低論文重複率的這5個策略,再也不用擔心重複率不合格了!

畢業論文是完成學業的關鍵環節,過高的重複率往往會引起學術不端的疑慮。因此,在提交論文之前,不少學生會採取“降重”措施,即通過各種方法減少論文與已有文獻之間的文字相似度。 以下提供 5 個實用策略,幫助你有效降低論文重複率。 策略一:調整句式與表達 最常用也最基礎的方法是改寫。通過調整語序、替換近義詞或更換表達方式,可以使相同的意思以不同的語言形式呈現

數據 , 相似度 , AI寫作 , aigc , 人工智能

收藏 評論

GhostLover - 高德地圖首席科學家任小楓:視覺智能在高德地圖的應用

類比理解: DINOv3 就像一位博物學家。他看到一張街景照片會説:“這是一個城市街道,有柏油路、紅磚建築和落葉喬木。” 他看到另一張不同地點的照片,如果語義相似,他也會給出類似的描述。 CosPlace 就像一位偵探。他的任務是:“忽略掉現在是冬天還是夏天,忽略掉那輛

關鍵幀 , 相似度 , 嵌入式硬件 , Css , 前端開發 , HTML

收藏 評論

DeepSeaAI - 金融行業大模型微調

針對銀行和金融行業專有詞彙標準化系統 注意:在醫療領域,由於涉及隱私,我們需要確保使用公開數據或合成數據。 一、大模型微調方案選擇 推薦方案:混合策略微調 1. 監督微調(SFT) + 檢索增強(RAG)結合 - SFT微調:增強基礎理解能力 - RAG檢索:確保標準化準確性 2. 多階段微調流程: ├── 第一階段:領域預訓練 ├── 第二階段:任

數據 , 神經網絡 , 相似度 , 人工智能 , Python

收藏 評論

Zilliz - 向量數據庫入坑指南:初識 Faiss,如何將數據轉換為向量(一)

我們日常使用的各種 APP 中的許多功能,都離不開相似度檢索技術。比如一個接一個的新聞和視頻推薦、各種常見的對話機器人、保護我們日常賬號安全的風控系統、能夠用哼唱來找到歌曲的聽歌識曲,甚至就連外賣配送的最佳路線選擇也都有着它的身影。 相信很多同學是第一次聽説它,或者只知道它的大名,而不知該如何使用它。本篇文章,我們就來聊聊 faiss,分享這個“黑科技”是如何發揮神奇的“魔法”的。 寫在前面 fa

相似度 , 向量 , 相似度檢測 , 數據庫 , meta

收藏 評論

Zilliz - 向量數據庫入坑指南:使用 Faiss 實現一個最簡單的向量檢索功能 (二)

上一篇內容中,我們瞭解了什麼是 Faiss,以及如何將文本內容轉換為向量數據。本篇文章中,我們來使用 Faiss 實現向量檢索功能。 使用 Faiss 實現最簡單的向量檢索功能 接下來,我們將使用 Faiss 實現一個小功能,針對哈利波特小説全集內容,接觸向量檢索技術,完成相似內容搜索的功能。與我們使用 “CTRL+F” 或者把數據倒入 MySQL,使用 “%LIKE%” 去進行全文匹配不同,我們

相似度 , 向量 , 相似度檢測 , 數據庫 , meta

收藏 評論

未聞花名AI - 構建AI智能體:十六、構建本地化AI應用:基於ModelScope與向量數據庫的文本向量化

將文本轉換為向量(文本嵌入)是自然語言處理中的核心任務,有許多大模型可以完成這項工作。上一篇文章《構建AI智能體:十五、超越關鍵詞搜索:向量數據庫如何解鎖語義理解新紀元》我們是通過阿里雲的api調用的text-embedding-v4模型,同樣還有很多其他輕量級的模型可以很好的完成這個任務,我們今天找兩個結合前期講到的本地化部署來嘗試一下。 一、核心組件回顧

yyds乾貨盤點 , 搜索 , NLP , 相似度 , 加載 , 人工智能

收藏 評論

karen - 近似最近鄰搜索算法

在大規模向量檢索的應用場景中,往往既需要衡量向量間的相似度,又要對數據點施加額外的屬性過濾。傳統的近似最近鄰(ANNS)方法只關注向量相似度,對“向量 + 屬性”混合查詢(hybrid query)的支持能力不足。5月發佈在 arXiv 的 Lin 等人最新綜述《Survey of Filtered Approximate Nearest Neighbor Search over

數據集 , 類方法 , 相似度 , 後端開發 , Python

收藏 評論

藍色憂鬱花 - 基於激光雷達點雲的3D檢測方法彙總(LiDAR only)_51CTO博客

本文是《激光點雲障礙物檢測》系列的第三篇,前文已經介紹了 ROI 區域裁剪、地面點雲分割、體素濾波以及聚類提取。本篇將重點講解如何利用 匈牙利算法(Hungarian Algorithm) 在多幀點雲之間進行 障礙物匹配與跟蹤(Object Association Tracking),實現穩定的障礙物ID跟蹤效果。 在連續幀點雲數據中,每一幀通過

匈牙利算法 , 點雲 , 相似度 , Css , 前端開發 , HTML

收藏 評論

我是數據分析師 - 軟件工程學習筆記

一、核心知識點梳理 聚類算法:K-means(無監督學習的典型代表) • 基本思想: 將數據集劃分為K個簇,使得同一簇內的數據點儘可能相似,而不同簇間的數據點儘可能不同。 • 偽代碼與流程: 1. 輸入: 數據集 D,預設的簇數量 K。 2. 初始化: 隨機選擇K個數據點作為初始質心。 3. 迭代優化: a. 分配

隨機森林 , 聚類 , 相似度 , 前端開發 , Javascript

收藏 評論

mob64ca1409970a - pytorch 餘弦相似度與mseloss結果對比

聚類分析之K-means算法 文章目錄 聚類分析之K-means算法 一.距離度量和相似度度量方法 1.距離度量 2.相似度 二.K-means算法原理 1.選取度量方法 2.定義損失函數 3.初始化質心 4.按照樣本到質心的距離進

聚類 , 相似度 , pytorch , 聚類分析 , 人工智能

收藏 評論

mb65950ac695995 - 十六、插幀質量評估:客觀指標與主觀體驗

評估插幀需要客觀與主觀結合。客觀指標包括: 結構相似度(SSIM)、峯值信噪比(PSNR):度量與“真實中間幀”的接近程度(離線評估)。 光流一致性與遮擋錯誤率:檢測運動估計質量。 邊緣保真度、細節保持率:衡量清晰度。 主觀評估關注:運動平滑度、拖影感、閃爍、響應延遲、文字與 HUD 可讀性。不同類型遊戲的容忍度不同:敍事類可接受更高

光流 , 相似度 , c++ , 後端開發 , 運動估計 , c

收藏 評論

虎斑嘟嘟 - 多模態對齊的表示學習:統一對比散度框架詳解

多模態對齊的表示學習:統一對比散度框架詳解 1. 引言:多模態對齊的核心挑戰 多模態表示學習作為人工智能領域的前沿方向,旨在使機器能夠像人類一樣理解和處理文本、圖像、音頻等不同模態的信息。其核心挑戰在於如何構建一個共享的語義空間,使得異構數據在這個空間中可以相互對齊和理解。 不同模態數據之間存在三大根本矛盾:符號系統的異構性(自然語言基於離散符號系統,而視覺、聽

yyds乾貨盤點 , 錨點 , 相似度 , 後端開發 , JAVA , 模態

收藏 評論

mob64ca13fb6939 - Python的字符串匹配詳細介紹-Python教程

Python中的模式匹配與模糊匹配:從精確到容錯的智能識別 在日常編程中,我們常常需要判斷一段文本是否符合某種“格式”或“規則”,或者在一堆數據中找出“看起來差不多”的內容。這兩種需求分別對應着模式匹配(Pattern Matching)和模糊匹配(Fuzzy Matching)。它們看似相似,實則服務於不同場景,背後也藴含着不同的邏輯哲學。 本文將用通俗語言結合Py

數據 , 相似度 , 模式匹配 , Css , 前端開發 , HTML

收藏 評論