OpenAI正式推出的高級語音模式,已支持50多種語言交流,此外新增五種全新的語音風格供用戶選擇。值得注意的是,此次更新中並未包含名為“Sky”的語音風格。此前,該語音曾被指與女演員斯嘉麗·詹森聲音高度相似。
9月25日,OpenAI在X平臺上宣佈,將為ChatGPT的付費用戶推出全新的高級語音模式(Advanced Voice Mode,AVM),這一更新旨在使用戶與ChatGPT的交互更加自然流暢。OpenAI將在本周向Plus和Teams套餐用戶全量推送該新模式,企業版和教育版用戶則將於下周開始獲得訪問許可權。
OpenAI CEO山姆·奧特曼(Sam Altman)轉發推文並表示:“希望你覺得等待是值得的。”
在此次更新中,語音模式的設計從外觀上得到了改進。現在,語音功能由一個藍色的動畫球體代表,取代了此前OpenAI在5月展示時使用的黑色動態點。當用戶在ChatGPT應用中獲得高級語音許可權後,會在語音圖示旁看到一個彈出提示,方便用戶快速啟用。
為了提升用戶體驗,ChatGPT新增了五種全新的語音風格供用戶選擇:Arbor(隨和且多才多藝)、Maple(開朗且坦率)、Sol(精明且輕鬆)、Spruce(冷靜且確信)和Vale(聰明且好奇),使得語音總數達到九種。此前的語音包括Breeze(生動且認真)、Juniper(開放且樂觀)、Cove(沉著且直率)和Ember(自信且樂觀)。這些語音名稱均以自然元素為靈感,旨在提供多樣化的語氣和特徵。
值得注意的是,此次更新中沒有包含名為Sky的語音。此前,OpenAI在春季更新中展示了Sky的語音,但由於被指與女演員斯嘉麗·詹森高度相似,引發了法律糾紛。儘管OpenAI表示並非有意模仿詹森的聲音,但為了避免爭議,仍選擇了移除。
ChatGPT高級語音模式現已支持50多種語言,拓展了用戶的溝通範圍。
官方提供了一個演示視頻,視頻裏有用戶問ChatGPT:如何真誠地向只會說普通話的奶奶道歉時,ChatGPT可以用標準的普通話說出:“奶奶,對不起,我遲到了,我不是故意讓您等這麼久的,我可以怎麼補償您呢?”
高級語音模式還支持自定義指令功能。OpenAI的技術專案經理夏洛特(Charlotte)在演示視頻中表示,語音交流包含許多在文本對話中無法體現的元素,如口音、語調、節奏等。OpenAI的研究工程師邁克(Mike)表示,現在用戶可以通過設置輸入個人資訊,定制屬於自己的AI模型。
夏洛特在演示中,輸入了自己的姓名和居住地,然後詢問ChatGPT週末可以做些什麼有趣的事情。ChatGPT高級語音模式根據天氣和用戶所在的地區,提供徒步旅行、野餐或沿著加州1號公路駕車等建議。當夏洛特表示對駕車感興趣並詢問具體路線時,ChatGPT也提供了更為詳細的計畫。
OpenAI的模型設計師德魯(Drew)也分享了他的使用體驗:“當我在忙其他事情或不需要與ChatGPT交談時,它會保持安靜。當我有問題時,可以直接提出展開深入的對話。”在此過程中,ChatGPT的聲音會根據談話的語氣進行調整。他表示,ChatGPT就像是坐在身旁的朋友,不僅提供資訊,還能進行思想交流。德魯認為在日常使用中,用戶可以使用高級語音模式來創造面試、講故事等場景,而且無需擔心延遲問題。他強調:“這種延遲非常低,就像和另一個人交談一樣。”
需要注意的是,該高級語音模式目前還沒有向歐盟、英國、瑞士、冰島、挪威和列支敦士登等地區開放使用。OpenAI尚未公佈這些地區的開放時間。
澎湃科技注意到,OpenAI原計畫在6月底推出該語音功能的Alpha版本,但在6月25日表示需要再一個月的時間才能實現。當時該公司表示:“我們正在改進模型能力,使模型能更好地檢測內容並拒絕輸出某些內容,我們也還在努力改善用戶體驗,並優化我們的基礎設施準備工作,以便能在保持即時回應的情況下,(將新模式)擴展至數百萬用戶。”
來源:中國澎湃新聞