睜眼說瞎話——ChatGPT、深度求索等人工智能大語言模型離線模式下的通病

睜眼說瞎話——ChatGPT、深度求索等人工智能大語言模型離線模式下的通病

ChatGPT這一人工智能出世的時候,歸功於網路上熱心網友提供的公開免費服務,我可以零成本試用到這一跨時代的產品。作為一款聊天機器人,它的智能化程度讓我刮目相看,瞠目結舌。要知道,我第一次接觸這種聊天機器人是騰訊QQ的小Q,當時似乎是在2006年前後,她的QQ號我至今仍然記得,是615050000。接觸到這個聊天機器人純屬是口口相傳,道聽途說。我不確定當時的騰訊官方網站是否有為這一聊天機器人設立專頁,又或者這只是一個測試用的計畵?又或者這甚至不是官方搞的?這一切我並不清楚,或許也難以溯源考證。只知道當時這個小Q如果遇到自己不懂的內容,會直接答覆「我也不清楚,你可以教教我」之類的話語。當時我對小Q的感覺就是,畢竟是機器人,終歸還是不如真實的人類。

而在跟ChatGPT聊天之後,我驚訝於ChatGPT能夠理解我說的所有話,這一點可以通過翻譯功能來側面體現,除此之外,它還上知天文下知地理。我在2016年左右的時候,還覺得機器翻譯無法「說人話」,並在接下來幾年間的使用中,也一直覺得諸如Google翻譯之類的機器翻譯翻出來的句子難以讓人理解。但是ChatGPT顛覆了我的認知,它的翻譯讓我無從挑剔。

然而,當我進一步使用ChatGPT時,我發現了它並沒有想象中的那麼完美。在沒有聯網的情況下,它容易睜眼說瞎話。也就是說,面對於不認識的事物,它不是直接說不知道,而是會胡亂給你編造一些錯誤的內容出來。孔子曰:「知之為知之,不知為不知,是智也。」ChatGPT顯然沒有做到實事求是這一點,包括後來的深度求索,也是如此,在沒有聯網的情況下,喜歡亂說一通。

我使用視覺小說《夏花的軌跡》為例,這部視覺小說由中國開發者開發。之所以選用它作為例子,有以下這些原因。首先這不是一部非常出名的視覺小說,它不如日本大廠的作品那麼出名,知名度不如Key社的《CLANNAD》,也沒有在中國引起較大的反響,知名度不如《饿殍:明末千里行》。其次它並非是一部完全沒有背書的作品,不是那種由業餘愛好者製作後發佈到百度貼吧的作品,它有在Steam上架,亦有收錄進中文維基百科并曾通过评审在首页「你知道吗」栏目展示,在vndb中亦有收錄,它也有官方網站,且已被主流搜索引擎索引,這就使得可以通過聯網檢索的方式檢索到這部視覺小說的信息。以上這些原因使得這部視覺小說成為了一個非常完美的例子。

接下來我詢問了ChatGPT和深度求索,而且是在離線不聯網的模式下進行詢問,這些人工智能大語言模型便開始了睜眼說瞎話,而且詢問多次,每次說的都不一樣,甚至你進一步追問,它還能夠繼續捏造,形成一個完整的虛擬的世界觀出來。

ChatGPT認為是日本作家川端康成的小說或日本Navel遊戲公司開發的遊戲
ChatGPT認為是日本作家木下美穗的小說或日本Tenshiko遊戲公司開發的遊戲
ChatGPT編造日本角色
深度求索認為是日本作家橋本紡的小說
深度求索認為是嗶哩嗶哩的動畵短片

以上的錯誤回答,在聯網搜索之後便可以得出正確答案。希望以後的人工智能能夠進一步發展,避免這種無中生有的情況,避免誤導使用者。


Comments