從產品交互層面,還無法取代搜索引擎,從技術角度稍微改造一下,取代傳統搜索引擎是可行的。
但目前ChatGPT的交互形態,還不能取代搜索引擎。
比如ChatGPT對于不少知識類型的問題,會給出看似很有道理的答案,但有時這些答案可能是錯的,但很多問題他又可以回答的很好,這就會給用戶產生困擾,到底該不該相信它的答案呢?
此時這種判斷就需要交給用戶自己,而搜索引擎會給出好幾頁的可能的答案,用戶在其中選擇的成本相較于ChatGPT交互帶來的成本就會低很多。
ChatGPT基于GPT模型標注訓練得來,對于新知識的吸納并不友好,新知識總會不斷出現,但如果一有新知識就去重新預訓練GPT模型是不現實的,無論是金錢還是時間都不可接受。
如果對新知識采用Fine-tune的方式,看起來成本會低一些,但很容易出現新數據引入導致的知識遺忘。
總結來說,如何將新知識融入到大模型體系下是非常有挑戰的問題。
谷歌和微軟的搜索,也只大模型和搜索結合起來,而不是完全替掉了搜索。
我們都知道,大模型的在線推理成本太高,搜索引擎都是面向數以十一記的用戶請求,如果延續目前搜索的免費策略,世界上的任何一家公司都是難以維系的。
要么限制用戶使用,要么采取收費策略,不管哪一種方式,對于有規模效應的搜索業務來說,都不是一個最好的選擇。
似乎只能寄希望于OpenAI自己將訓練成本大幅下降才能解決了。
接下來再說下從技術角度取代搜索引擎的思路。
其實new bing的方案基本上提供了一種思路。
在ChatGPT基礎之上,引入搜索引擎,解決新知識引入的問題,做好生成內容可信性驗證,吐給用戶。
ChatGPT是主要的生成引擎,傳統搜索引擎首先會對ChatGPT生成的知識類問題進行回答,進行結果可信性驗證和展示。
比如ChatGPT給出了一份答案,同時傳統搜索引擎也按照這份答案文字搜索到相關鏈接,一通展示給用戶,讓用戶判斷兩份結果是否都是真實可信的。
當然,并不是所有的類型的答案都需要做可信性校驗,有些問題可以自由發揮。
因為ChatGPT很多內容不具有時效性,所以通過傳統搜索引擎,可以隨時將新知識引入到大模型中,這就當ChatGPT發現一些時效性問題回答不了時,就可以轉向采用搜索引擎的答案了。
ChatGPT和傳統搜索引擎,各有所長,所以整個方案看起來是吸取大家各自技術的所長。
未來的搜索引擎大概率是以人工語音作為入口的,用戶通過自然語言的方式和一個AI小助理溝通,小助理的回答可能是大模型生成的,也可能是搜索引擎抓取的。
所以短期看技術上是可行的,產品交互層面長期看也是可行的。