动漫AV一级免费观看,中文天堂在线二区,成人动作电影A区

階躍星辰宣布開源語音模型Step-Audio-R1.1

楊亮 2026-01-16 08:41:07

466685

分享到

DoNews1月16日消息，據(jù)報(bào)道，全球知名權(quán)威大模型評(píng)測(cè)榜單 Artificial Analysis Speech Reasoning 更新，階躍星辰原生語音推理模型 Step-Audio-R1.1 登頂榜首。

該榜單是目前業(yè)界評(píng)估“原生語音模型”（Native Audio Models）最權(quán)威的第三方基準(zhǔn)之一。核心考量模型直接處理音頻并進(jìn)行復(fù)雜邏輯推理的能力，主要考察維度包括準(zhǔn)確率、首包延遲等。

和大語言模型同理，語音模型同樣需要具備強(qiáng)大推理能力，才能提供更高階智能、更自然交互。Step-Audio-R1.1 以 96.4% 準(zhǔn)確率，超越 Grok、Gemini、GPT-Realtime 等主流一線模型，刷新歷史最好成績(jī)。

在性能與速度的綜合權(quán)衡上，Step-Audio-R1.1 全面碾壓同類語音模型。Step-Audio-R1 是由階躍星辰發(fā)布的全球首個(gè)開源原生語音推理模型。它可以在不增加額外時(shí)延的情況下，端到端理解語音內(nèi)容，“像人類一樣聽到對(duì)話即可思考”。

據(jù)悉，其核心能力包括：深度語音推理、實(shí)時(shí)響應(yīng)能力、音頻領(lǐng)域的可擴(kuò)展 CoT。Step-Audio-R1.1 是最新升級(jí)版本，兼顧更強(qiáng)實(shí)時(shí)對(duì)話和復(fù)雜語音推理能力。

完整的實(shí)時(shí)語音 API 將在 2 月上線，目前開放的chat模式已搭載 R1.1 核心，支持邊想邊說的流式推理。目前，Step-Audio-R1.1 權(quán)重已上傳至 HuggingFace。

網(wǎng)站信息