ChatGPT可以自主調用電腦資源執行任務了。
當地時間7月17日,人工智慧(AI)巨頭OpenAI推出ChatGPT智能體(Agent)系統,OpenAI CEO山姆·奧特曼(Sam Altman)和四位負責人進行了25分鐘的直播。
據介紹,這是一套融合Operator遠程流覽器執行能力、Deep Research網路資訊整合技術以及ChatGPT對話優勢的統一智能體平臺,“可以思考和行動,能夠主動從代理技能工具箱中進行選擇,使用自己的電腦為您完成任務”。
奧特曼表示,智能體代表了AI系統能力的新高度。
此前,Operator和Deep Research各有優勢:Operator可以在網頁上處理內容,而Deep Research則擅長分析和匯總資訊。但Operator無法深入分析或撰寫詳細報告,而Deep Research無法與網站互動以優化結果或訪問需要用戶身份驗證的內容。此次,OpenAI直接將兩者的優勢進行了結合。
ChatGPT在Agent模式中會使用自己的“虛擬電腦”執行任務,基於用戶指令處理複雜的工作,用戶可以主動與網站互動,或在同一聊天中直接從對話過渡到直接請求操作。
在發佈會上,OpenAI演示了用ChatGPT Agent同時進行買西裝、做貼紙、訂酒店等任務,Agent使用數秒啟動虛擬電腦後便會詢問用戶明確需求,再進行衣服的挑選,Agent會滑動網頁、點開商品詳情,並留下相應的建議文字。此外,Agent也可以代替用戶進行下單操作。
在“虛擬電腦”中,即使ChatGPT使用多種工具,也能保留任務所需的上下文,模型可以選擇使用文本流覽器或可視化流覽器打開頁面,從網路下載檔,通過在終端中運行命令進行操作,然後在可視化流覽器中查看輸出。
同時,ChatGPT在執行重要操作之前會請求許可權,用戶可以隨時中斷、控制流覽器或停止任務。用戶也可以安排已完成的任務自動重複,比如每週一早上生成每週報告。
在“人類最後一次考試”評估中,ChatGPT agent模型的SOTA(State of the arts,領域內最高水準)得分達到了41.6,當採用簡單的並行部署策略(一次最多運行八次嘗試,並選擇自評置信度最高的一次)進行擴展時,得分提升至44.4。
此外,在FrontierMath等基準測試中,ChatGPT Agent的準確率也遠超之前的模型。
Pro、Plus和Team用戶可以使用Agent模式。企業版和教育版用戶將在未來幾周內獲得訪問許可權。目前Pro用戶每月有400次使用次數,其他付費用戶每月有40次使用次數,也可以付費獲得更多使用量。
來源:中國央視新聞