10 月 15 日消息,SEO 公司 Graphite 的報告分析了 2020 年 1 月至 2025 年 5 月間發佈的 65000 篇英文文章。報告使用名為 Surfer 的 AI 檢測工具,凡是內容中有不少於 50% 由大語言模型生成的文章,都被認定為 AI 文章。
分析結果顯示,AI 文章在 ChatGPT 發佈後迅速激增,從 2022 年末的約 10%,到 2024 年超過 40%,隨後增速趨於平緩。
當前,AI 文章的增長已近似接近穩定期。2024 年 11 月 AI 文章達到峰值後,新發佈的 AI 與人類創作內容基本各占一半。截至今年 5 月,新的 AI 文章占比為 52%,相比上個月,人類創作文章曾短暫占多數。
人類創作內容的比例可能還被低估。研究人員使用的 Common Crawl 數據集包含數千億網頁。Axios 指出,由於 AI 公司利用這些數據訓練大語言模型,許多付費網站已阻止 Common Crawl 索引頁面,因此幾乎可以確定由人類創作的文章未被 Graphite 統計在內。
记者從報導中獲悉,AI 檢測工具的判斷“並非百分百可靠”。Graphite 測試 Surfer 時分析了一組 AI 文章和一組人類文章,結果顯示,Surfer 將人類文章誤判為 AI 的比例為 4.2%,而將 AI 文章誤判為人類的比例僅 0.6%。
至於 AI 文章為何出現“平臺期”,目前尚無定論。外媒 Axios 引用 Graphite 的另一份報告認為,AI 內容工廠發現低質量內容在搜索引擎和聊天機器人中不再被重視,報告顯示穀歌搜索中 86% 的文章由人類創作,僅 14% 由 AI 創作。
與此同時,越來越多作者在創作過程中借助 AI 工具,使 AI 與人類創作的界限愈發模糊。
UCLA 電腦科學教授、亞馬遜雲服務副總裁 Stefano Soatto 對 Axios 表示:“目前,這更像是一種共生關係,而不是簡單的二分對立。”
來源:中國IT之家