跳至內容

討論:Mamba2

頁面內容不支援其他語言。
新增話題
維基百科,自由的百科全書
由Tisscherry在話題同行評審上作出的最新留言:7 個月前
條目里程碑
日期事項結果
2015年8月3日同行評審已評審
同行評審本條目已經由維基百科社群同行評審並已存檔,當中或有可以改善此條目的資訊。
          本條目依照頁面評級標準評為初級
本條目屬於下列維基專題範疇:
建立條目專題 (獲評初級
條目由條目建立專題審閱者審閱。該專題旨在允許使用者向百科全書提供高品質的條目和媒體文件,並在創作過程中跟蹤他們的進度。要參與,請訪問專題頁面以獲取更多資訊。
 初級  根據專題品質評級標準,本條目已評為初級
Note icon
這一條目在2025年7月28日由審閱者Pathfinbird討論 | 貢獻)從這一草稿接受。
計算機和資訊科技專題 (獲評初級未知重要度
本條目屬於計算機和資訊科技專題範疇,該專題旨在改善中文維基百科資訊科技相關條目類內容。如果您有意參與,請瀏覽專題主頁、參與討論,並完成相應的開放性任務。
 初級  根據專題品質評級標準,本條目已評為初級
 未知  根據專題重要度評級標準,本條目尚未接受評級。

同行評審

[編輯]
== Mamba2 ==

Mamba2編輯 | 討論 | 歷史 | 連結 | 監視 | 日誌

評審期:2025年7月4日 (五) 14:57 (UTC)至2025年8月3日 (日) 14:57 (UTC)
下次可評審時間:2025年8月10日 (日) 14:58 (UTC)起

新人寫的第一個條目,在此徵求外部意見,以供改進,謝謝。Vertin,do you want to be the timekeeper?留言2025年7月4日 (五) 14:57 (UTC)回覆

沒有分類。--Allervous花冷列車 2025年7月5日 (六) 08:56 (UTC)回覆
已經添加--Vertin,do you want to be the timekeeper?留言2025年7月5日 (六) 09:07 (UTC)回覆
@MilkyDefer我看到你好像把他的文章移回草稿去了,理由似乎和arXiv的來源以及複述手法有關。arXiv我懂,但複述手法可能要問一下你的想法。
@Linxingjun:說一下,引用最佳的論文來源,應當為經過同行評審的期刊論文。arXiv似乎有未經同行評審的論文,這大概是他「表示擔憂」的原因。可能的話試試看 ACM, IEEE Xplore, JSTOR, Scopus 看看吧。有論文需要查找的話可以找WP:維基圖書館。--Saimmx留言2025年7月5日 (六) 18:01 (UTC)回覆
我剛才看到了,等我到時候有空了改一下
至於複述手法我並不是很理解,因為mamba乃至很多的深度學習模型都是一種發明創造,他肯定是來源於作者所發表的某個論文,論文複述我想不通為什麼這是理由,事實上除了複述之外我沒想到別的方式,我總不能搞原創研究吧--Vertin,do you want to be the timekeeper?留言2025年7月5日 (六) 18:06 (UTC)回覆
arxiv作為預印本平台,確實大多數都沒有經過同行評審,這個是我的問題--Vertin,do you want to be the timekeeper?留言2025年7月5日 (六) 18:07 (UTC)回覆
我幫你了找兩份應該與Mamba2有關的論文,你讀一下。我不太確定會議論文是否會經過同行評審就是了。--Saimmx留言2025年7月5日 (六) 18:19 (UTC)回覆
會議論文一般來說會經過,你把論文放在哪裏了--Vertin,do you want to be the timekeeper?留言2025年7月5日 (六) 18:26 (UTC)回覆
我已看到--Vertin,do you want to be the timekeeper?留言2025年7月5日 (六) 18:28 (UTC)回覆
把這個條目想像成一篇論文。「架構」一章很像正常論文的section 3 (method);「性能優勢」像section 4 (experiments);「未來方向」更是section 5 (conclusion)。我不能接受如此簡單地量產條目。我推薦將它合併到Mamba裏面。--MilkyDefer 2025年7月6日 (日) 10:17 (UTC)回覆
並且Mamba-2並不能視作「跟cnn,mamba,gan一模一樣」。雖然都是來源於論文但是並非突破性。好像yolo都v12了,但是肯定不能說從v1到v12每個都建一個條目吧?--MilkyDefer 2025年7月6日 (日) 10:20 (UTC)回覆
這個是我的寫法問題,我在此道歉
但是我並不認同合併的做法,正如大家不能把同一個系列的不同作品全部合併到一個條目中,除非這個系列的每個作品都不知名又或者不同作品本質上是相同的,你說的yolo這是不成立的因為它的創新點並沒有mamba1/2顯著,你可以去看看他的發展史,你能說他每一個相較於前作他所創新的部分每一個都是獨特的嗎,k-means是yolo2作者所提出的算法嗎,FPN是yolo3作者所提出的算法嗎,可mamba2相較於mamba之間的創新是確確實實獨特的,在mamba2提出之前,你能找到任何一個對mamba的改進到可以允許在現代加速器上使用矩陣乘法單元嗎
另外,顯然的,mamba2對mamba改進到顯著到已經可以投出一篇期刊論文而不觸及一稿多投的問題了,並且這種改進並不像其他的改進,那個時候有多少篇mambaXvision的。?--Vertin,do you want to be the timekeeper?留言2025年7月6日 (日) 10:27 (UTC)回覆
我後面我也會專門寫一個小標題說明一下mamba2到底是怎麼改進的--Vertin,do you want to be the timekeeper?留言2025年7月6日 (日) 10:28 (UTC)回覆
Mamba-2的改進:提出了狀態空間對偶(SSD)框架,連接了狀態空間模型、結構化矩陣和注意力機制。SSD可以從三個方面來理解:SSD Model是一個 DNN 模型層,可以用來組合以構建模型;SSD Framework是一個分析框架,可以分析各種生成式模型特點;SSD algorithm是更加適合GPU計算的高效算法,比 SSM 有更高的計算效率。最後,基於SSD還可以進行系統層面的優化,充分利用針對Transformers開發的優化,例如張量並行,序列並行,可變長序列的訓練和推理等。
如果說這些創新性都是其他人論文上面有的只是mamba2作者單純的排列組合,那麼我贊同你的觀點,但是很可惜並不是--Vertin,do you want to be the timekeeper?留言2025年7月6日 (日) 10:36 (UTC)回覆
我認為我的缺點就是把這玩意寫的太像論文了,並沒有考慮到非專業讀者的問題,but
method和架構像是很正常的因為他們都是在說明同一樣東西,但我不贊同你的一樣觀點
mamba2他不僅是單單純純的做實驗來證明自己的性能優勢,他還有時間複雜度的分析,硬件性能的優化等等,而這些並不是光憑實驗就能得出來的
未來方向這個確實是我的問題,因為我是直接從論文上面直接複述一遍的--Vertin,do you want to be the timekeeper?留言2025年7月6日 (日) 10:40 (UTC)回覆
回看了一下,性能優勢那一欄我確實忘記寫時間複雜度的分析以及它是怎麼樣優化硬件加速的了,這個我在此道歉--Vertin,do you want to be the timekeeper?留言2025年7月6日 (日) 10:41 (UTC)回覆
已經修改完畢。--Vertin,do you want to be the timekeeper?留言2025年7月11日 (五) 11:02 (UTC)回覆
目前草稿已審核通過--Vertin,do you want to be the timekeeper?留言2025年7月28日 (一) 07:10 (UTC)回覆