階躍星辰(Stepfun)近日正式發(fā)布了其最新一代開源基座模型——Step3.5Flash。該模型專為智能體(Agent)場景打造,憑借強大的推理能力與極致的響應(yīng)速度,旨在為開發(fā)者提供一個更聰明、更穩(wěn)定且成本可控的“Agent 大腦”。

作為一款針對性極強的輕量化模型,Step3.5Flash 在多個維度實現(xiàn)了突破:
極致速度:推理速度最高可達350TPS(每秒生成的詞數(shù)),尤其在代碼類任務(wù)中表現(xiàn)卓越。
性能比肩閉源:在 Agent 核心應(yīng)用場景和數(shù)學(xué)邏輯任務(wù)上,其表現(xiàn)足以媲美主流閉源大模型。
長鏈條任務(wù)保障:具備處理復(fù)雜、長邏輯鏈條任務(wù)的穩(wěn)定性,能夠高效應(yīng)對256K 的超長上下文。
技術(shù)架構(gòu):兼顧效率與深度
Step3.5Flash 采用了先進的稀疏 MoE(混合專家)架構(gòu),總參數(shù)量達到1960億,但每個 Token 激活的參數(shù)量僅約為110億。 為了進一步提升效率,模型引入了 MTP-3 技術(shù),實現(xiàn)一次預(yù)測3個 Token,效率直接翻倍。 此外,通過滑動窗口與全局注意力的混合架構(gòu),模型能夠精準捕捉長文本中的“重點”,大幅降低了計算開銷。
多場景實測:從代碼到端云協(xié)同
在實際應(yīng)用演示中,Step3.5Flash 展現(xiàn)了多樣化的才華:
智能編程:僅憑一段文字描述,即可自動編寫并輸出基于 WebGL2.0引擎的高性能可視化平臺。
復(fù)雜計算:在不使用外部工具的情況下,能夠快速完成等差數(shù)列求和、階乘累加等高難度數(shù)學(xué)運算。
端云協(xié)同:作為“云端大腦”,它能將用戶模糊的需求(如對比各平臺價格)拆解為具體的搜索與抓取子任務(wù),極大地簡化了本地執(zhí)行端的難度,確保結(jié)果的可靠性。
目前,Step3.5Flash 已在主流平臺全量上線,包括 GitHub、HuggingFace 以及 OpenRouter。 為了降低本地部署門檻,階躍星辰專門優(yōu)化了模型在個人工作站(如 NVIDIA DGX、Apple M4Max 等)上的運行性能。 此外,公司宣布已經(jīng)啟動 Step4 模型的訓(xùn)練,并邀請全球開發(fā)者共同定義下一代 Agent 基礎(chǔ)模型。
OpenRouter 限免中,0成本升級你的 Agent:https://openrouter.ai/stepfun/step-3.5-flash
GitHub 下載快速部署,打造專屬 Agent:https://github.com/stepfun-ai/Step-3.5-Flash/tree/main
HuggingFace 獲取模型權(quán)重:https://huggingface.co/stepfun-ai/Step-3.5-Flash
