@美團

Stories List
@meituanjishutuandui

OR算法+ML模型混合推理框架架構演進

本文介紹了OR算法+ML模型混合推理能力建設思路及業務背景,此場景相比常規模型推理更具特殊性和複雜性,在工程實現上面臨多維挑戰,因此本文分別從性能、穩定性和擴展性三個維度分析問題和解法,並以推理框架架構演進為線總結了過去兩年的分期迭代實踐歷程和收益,其中有一些較為通用的經驗,希望能夠給大家帶來一些幫助或啓發。 1 背景 調度系統主要職責是需要在合適的時間以合適的方式將合適的運單分給合適的騎手,承載

meituanjishutuandui Avatar

@meituanjishutuandui

Nickname 美團技術團隊

@meituanjishutuandui

MTGR:美團外賣生成式推薦Scaling Law落地實踐

美團外賣推薦算法團隊基於HSTU提出了MTGR框架以探索推薦系統中Scaling Law。MTGR對齊傳統模型特徵體系,並對多條序列利用Transformer架構進行統一建模。通過極致的性能優化,樣本前向推理FLOPs提升65倍,推理成本降低12%,訓練成本持平。MTGR離在線均取得近2年迭代最大收益,且於2025年4月底在外賣推薦場景全量。本文系相關工作的實踐與經驗總結,希望能給從事相關方向研究

meituanjishutuandui Avatar

@meituanjishutuandui

Nickname 美團技術團隊

@meituanjishutuandui

LongCat-Flash-Omni正式發佈並開源:開啓全模態實時交互時代

自9月1日,美團正式發佈 LongCat-Flash 系列模型,現已開源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 兩大版本,獲得了開發者的關注。今天 LongCat-Flash 系列再升級,正式發佈全新家族成員——LongCat-Flash-Omni。 LongCat-Flash-Omni 以 LongCat-Flash 系列的高效架構設計為基礎(

meituanjishutuandui Avatar

@meituanjishutuandui

Nickname 美團技術團隊

@meituanjishutuandui

基本功 | 一文講清多線程和多線程同步

多線程編程是現代軟件開發中的一項關鍵技術,在多線程編程中,開發者可以將複雜的任務分解為多個獨立的線程,使其並行執行,從而充分利用多核處理器的優勢。然而,多線程編程也帶來了挑戰,例如線程同步、死鎖和競態條件等問題。本篇文章將深入探討多線程編程的基本概念(原子操作、CAS、Lock-free、內存屏障、偽共享、亂序執行等)、常見模式和最佳實踐。通過具體的代碼示例,希望能夠幫助大家掌握多線程編程的核心技

meituanjishutuandui Avatar

@meituanjishutuandui

Nickname 美團技術團隊

@meituanjishutuandui

端智能在大眾點評搜索重排序的應用實踐

端智能,是指在移動端設備運行人工智能(AI)應用的技術。本文主要講述大眾點評搜索場景下,在端側部署大規模深度學習模型進行搜索重排序任務的實踐方案,包括端上特徵工程、模型迭代思路,以及具體部署優化的過程,希望能對從事相關領域開發的同學有所幫助或者啓發。 1 引言 隨着大數據、人工智能等信息技術的快速發展,雲計算已經無法滿足特定場景對數據隱私、高實時性的要求。借鑑邊緣計算的思想,在終端部署 AI 能力

meituanjishutuandui Avatar

@meituanjishutuandui

Nickname 美團技術團隊