zh-CN ZH-CN en EN
English
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻
没有结果
查看所有结果
SKY ECONOMY NEWS
没有结果
查看所有结果
您當前的位置 : 科技 > 文章内容 返回
OpenAI推出gpt-realtime語音對話模型:支持情感感知、多語言無縫切換
发布:2025-08-29

8 月 29 日消息,OpenAI 已將其“Realtime API”正式投入生產環境,將其移出測試階段(Beta)。

據記者瞭解,這款 API 主要面向企業與開發者群體,旨在助力他們開發適用於實際場景的語音助手,覆蓋客戶支持、教育、個人效率提升等領域。其核心組件“gpt-realtime”模型採用端到端 Speech-to-Speech 架構,可直接生成並處理語音,省去了常規的文本轉換步驟。據 OpenAI 介紹,相比前代版本,該模型回應速度更快、語音更自然,對複雜指令的處理能力也更強。

OpenAI 表示,目前 gpt-realtime 模型能夠捕捉笑聲等非語言信號,支持對話過程中中途切換語言,還可調整語音語氣 —— 例如實現“帶法國口音的友好語調”或“語速較快的專業語調”。此外,該模型新增了“Cedar”和“Marin”兩種語音,並對現有的 8 種語音效果進行了優化。

在性能基準測試中,gpt-realtime 模型表現顯著提升:在 Big Bench Audio 基準測試中準確率從 65.6% 升至 82.8%,在 MultiChallenge 基準測試中從 20.6% 升至 30.5%,在 ComplexFuncBench 基準測試中則從 49.7% 提升至 66.5%。

此次 API 升級優化了工具集成流程。OpenAI 稱,該模型能更精准地選擇適用工具、在恰當時機觸發工具,並正確配置工具參數,大幅提升了函數調用的可靠性。開發者可通過會話初始協議(SIP)與遠程媒體控制協議(MCP)伺服器,連接外部工具與服務。同時,可複用的提示詞功能支持保存不同使用場景下的配置與工具設置,進一步提升開發效率。

該 API 現已支持圖像輸入功能。用戶在對話過程中可發送截圖或照片,模型能參考圖像內容進行交互 —— 例如讀取圖像中的文字,或回答與圖像內容相關的問題。開發者可自主控制模型能夠獲取的圖像範圍。

此外,API 新增了兩項實用功能:開發者可設置 token 使用上限,並對多輪對話內容進行精簡處理。這兩項功能有助於在較長會話中更好地控制成本。價格方面,gpt-realtime 模型的使用成本降低 20%,當前定價為:音頻輸入 token 每百萬個 32 美元(注:現匯率約合 229 元人民幣),音頻輸出 token 每百萬個 64 美元(現匯率約合 457.9 元人民幣),緩存輸入 token 每百萬個 0.40 美元(現匯率約合 2.9 元人民幣)。

OpenAI 表示,該 API 具備檢測問題內容的能力,若對話違反平臺政策,可自動終止會話。不過,從語言模型的安全發展歷程來看,這不應是唯一的安全保障手段,開發者仍需自行添加專屬安全要求。

針對歐盟用戶,該 API 提供了數據本地化存儲選項,並為企業用戶制定了特殊隱私規則,以符合歐盟地區的數據保護法規。

 

來源:中國鳳凰網科技

上一篇:戴爾Q2營收達298億美元同比增長19%,創歷史新高
下一篇:2025Q2全球智能手錶出貨量:華為首超蘋果成第一,同比增長52%
相關推荐
  • 中國核聚變裝置BEST專案建設取得關鍵突破
    链接阅读
  • 特斯拉2025年底推出第三代人形機器人 2026年開始量產
    链接阅读
  • 極米科技向港交所提交上市申請書,上半年淨利潤暴增2062%
    链接阅读
  • DeepSeek新模型降價:優化推理效率,API價格降超50%
    链接阅读
  • AI眼鏡元年:下一個智能終端,變得比手機更貼身
    链接阅读
  • 高德發佈鷹眼守護預警系統,實測重大異常事件預警準確率達90%
    链接阅读
  • 全球容量最大!中國超重力場大科學裝置核心設備正式啟動,可實現“時空壓縮”效應
    链接阅读
  • AI重構供應鏈:京東宣佈未來三年持續投入,構建萬億人工智慧生態
    链接阅读

歡迎瀏覽閱讀星空經濟新聞華文網

投稿郵件:
news@skyeconomymedia.com

法國政府上任數小時後辭職,加劇政治危機

2025-10-06

特朗普施壓結束加沙戰爭 納坦亞胡面臨極右翼反彈

右翼高市早苗有望成為日本首位女首相

隨著美聯儲重啟寬鬆政策,外國投資者可利用更便宜的美元對沖工具

特朗普干預後,加沙戰爭距離結束還有多遠?

2025-10-05

比特幣突破 12.5 萬美元創歷史新高

關於我們

星空經濟新聞華文網是一家專注於提供英中兩國最新資訊的新聞媒體,作為英中新聞分享的領導者,我們致力於打造一個全球化、多元化的新聞環境,旨在搭建東西方文化橋樑,連接同一星空下的每一處角落。

聯絡我們

編 輯 部:KINGTON UNITED KINGDOM HR5 3DJ
電子郵箱:skyeconomyandmediagroup@gmail.com

總编寄语

穿越天際,照亮世界,星空新聞,不負每一份關注。
友情:英國駐中國大使館 中國駐英國大使館 新華網 中國日報 鳳凰網 中國僑網 歐洲時報 俄羅斯龍報
没有结果
查看所有结果
  • 首頁
  • 頭條新聞
  • 聚焦英國
  • 經濟觀察
    • 金融
    • 证券
    • 商业市场
    • 公司
    • 能源
    • 汽車
    • 科技
    • 醫藥
  • 全球連線
    • 軍事
    • 政治
    • 文体
  • 中國視野
  • 全球精英連線
  • 電子報紙
  • 新聞資訊
  • 旅遊
  • 英中投资
  • 深度· 言論
  • 視頻

© 2023 SEMG.