人肉搜索的技術趨勢:搜索的下一步
作為網民出沒的主要集散地,社區類網站不僅具有大浏覽量、較高的用戶黏度,同時,其互動自發的內容生產方式,也是其主要魅力。更重要的是,社區網民的需求,往往也蘊含著互聯網下一步的發展方向。搜索與社區的結合就是鮮明的例子,而無論是從搜索技術發展的趨勢,還是搜索技術主要競爭對手之間的提前布局,“人肉搜索”均成必爭之地。
在Google為何要創建“人肉搜索”引擎的理由闡述上,Google坦率地指出:“谷歌自進入中國市場以來,一直致力於根據本地需求改進用戶的搜索體驗。谷歌很早就意識到,自發的、分散的、有意或無意的‘人肉搜索’行為早在中國互聯網誕生之初就存在並茁壯成長著。中國互聯網界發生的幾乎每一起重大事件,尤其是娛樂性事件,都有可能成為‘人肉搜索’技術的試金石。為了豐富人民群眾的業余文化生活,為了使廣大網民在最短時間內趕超‘人肉搜索’的世界水平,谷歌決定投入巨資打造亞太地區最大的‘人肉搜索’引擎。”
這樣誠懇的自陳心跡,在Google愚人節的眾多經典玩笑中並不多見。
在Google那些為人津津樂道的創意中,諸如喝Google Gulp,能讓搜索者變得聰明、有更好的浏覽體驗、能搜到更准確的結果;通過Google Romance,上傳資料後可在網上找到和自己志趣相投的愛人等玩笑,沒多少網民會信以為真。但2004年愚人節Google推出的Gmail(Beta)測試版,則的的確確拉開了國內免費郵箱容量過1G的大幕。
目前看來,Google“人肉搜索”很可能成為“Gmail第二”——從愚人節的玩笑,盡快變成可以實現的互聯網應用。
“人肉搜索”是Google中國早就埋下的一步棋。Google今年的愚人節“玩笑”中,玩笑式提出了“人肉搜索”引擎志願者的招聘,但其順便推廣的天涯“問答”,卻早在2007年初Google入股天涯之時,已注定要成為百度“知道”的競爭對手。
4月中旬,國內另一大社區巨頭——騰訊公司董事長馬化騰在接受記者采訪時坦承,針對韓國互聯網注重結果編輯的搜索模式,騰訊也正在做一些嘗試。“已經有一點點模型出來了。車型、娛樂、電影方面,我們都會直接給出搜索結果。”
馬化騰比較國內發展“人肉搜索”環境與韓國的不同時指出:“韓國有它的歷史因素,韓國的網頁數量很少。如果中國一開始這麼做,可能可以;但現在用戶習慣已經形成了,能不能這樣做,要打一個很大的問號。比如一個電影、一個運動員的數據庫,網站需要用類似雜志的方式展現出來。但這些數據庫,已經結構化了嗎?其實搜索引擎是可以把它直接調用出來,而且網站的編輯可以更好用,可以直接調取這些資料。韓國80%的搜索量,是可以調取的。這樣比傳統搜索會更好。傳統搜索有的會有,沒有的會不斷的精細化。歐美的是不一樣的。兩者結合,會是一個比較好的體驗。規模上去的話,人力不是很大的問題。關鍵是這個資訊有沒有兩次的用法。”
馬所稱的“兩者結合”,正是機器搜索結合人工編輯的“人肉搜索”。而正是依靠著這種大量的人工編輯,韓國本土的搜索引擎打敗了Google韓國公司的機器搜索。
“以往我們過於誇大了技術的力量,實際上機器所能做的工作仍然有限。在下一代的人工智能搜索進展緩慢的情況下,把人的潛能調動起來,彌補機器搜索的不足,無疑是技術層面‘人肉搜索’能夠興起的內因。”中國社科院信息化研究中心秘書長姜奇平表示。
齊向東則從“人肉搜索”外部的宏觀環境分析認為,“人肉搜索”得以運行和發展的關鍵因素,是網民的需求和現有搜索引擎不足之間的巨大矛盾。
在齊向東看來,商業層面上,首先, 以Google為代表的搜索引擎,不能滿足人們的所有搜索需求。因為搜索引擎無法通過用戶輸入的少量的關鍵詞理解用戶的真正搜索意圖,也就無法准確地給出搜索結果;搜索引擎僅僅通過Pagerank(對網頁的評價算法)機器算法給出搜索結果存在很大的缺陷。其次,互聯網社區正以驚人的速度發展,尤其是像facebook、myspace等人際關系網絡平台受到人們的追捧,我們似乎看到了互聯網生活的雛形,人們通過這樣的人際關系網絡可以解決他們遇到的部分問題。
“人們期待通過人的參與,改善目前的搜索,於是誕生了各種各樣的‘人肉搜索’。這裡面有baidu知道、QQ問問、sina愛問、yahoo知識人等問答社區,也有通過人工挑選搜索結果chacha等網站,還有利用獨創peoplerank(對‘網民答案’的評價算法)社區搜索技術的qihoo創造的‘有問題問奇虎’的問答網站。這種‘人肉搜索’是廣義上的‘人肉搜索’。廣義的‘人肉搜索’具有極大的商業價值。”齊向東說。
“從社會層面看,人們的‘正義感’、‘洩憤欲’和‘窺私欲’,使得相當一部分人熱衷追求一些事件和人物的真相、隱私,互聯網社區為人們尋找知情人並通過知情人把這些真相、隱私公布於眾提供了可能。尤其是BBS成了人們發布追殺令、翻隱私的最佳平台。”但齊向東強調認為,這種“正義感”和“窺私欲”只是狹義上的“人肉搜索”,而“狹義上的‘人肉搜索’沒有商業價值”。