alexa
置頂

Mahalo用人腦攻進搜尋引擎戰場

人工智慧顛覆科技思維,Google棋逢敵手
文 / 彭慈然    
2007-11-01
瀏覽數 550+
Mahalo用人腦攻進搜尋引擎戰場
分享 Line分享分享 複製連結

Google靠程式設計的搜尋系統,衝出市值近兩千億美元的大企業,引來各種新的搜尋網站與方法如雨後春筍般冒出頭來。但是,最新也最瘋狂的,卻不是靠電腦,而是反璞歸真,用「人腦」幫你搜尋情報,推出此一新點子的人,居然還是一位靠網路創業而成名的鬼才。

他是傑森‧卡拉肯尼(Jason Calacanis),新推出的人工搜尋引擎「Mahalo」,直接利用人工,幫你瀏覽每一筆相關資訊,剔除各種垃圾郵件與無意義的連結後,再用人類的智慧,將網頁進行分類,務求所呈現出來的搜尋結果,是用戶最需要,同時也是最具組織化的條目。

電腦幫你搜尋,好壞統統抓

一般我們常用的搜尋引擎,是用自動的抓爬程式(web crawlers),把網頁資料蒐集起來並進行分析,等到用戶鍵入關鍵字之後,再依據所設定的參數進行篩選與排序。在最佳狀態下,前面幾條搜尋結果,將會是人氣最高、更新頻率高、被引用次數最多、內容最特殊的網站。

但實際使用經驗,卻不像搜尋引擎所描述的那樣美好,因為有絕招,就會有破解法。多項研究顯示,大部分的用戶會直接點選搜尋引擎所給的前幾條資訊,這種用戶行為模式,就讓網路高手可以藉著「搜尋引擎優化器」(searching energy optimizer/SEO)來擾亂搜尋引擎內的排列順序,提高特定網站的能見度。而一些搜尋引擎,也想到靠賣關鍵字刊登順序來賺錢。

最有名的例子,是國際汽車大廠BMW的德國網頁,去年曾經成功欺騙Google的抓爬程式,提升該網頁在搜尋引擎中的排名。Google工程師發現,BMW德國網站在某個點閱率與相關性不高的網頁中,寫入滿滿的關鍵字「neuwagen」(德文,新車之意),抓爬程式會以為這是個與新車資訊高度相關的網站,但當使用者連結該網址時,卻會自動轉址到BMW設定希望網友看到網頁。

人腦幫你分析,去蕪存菁

程式設計的搜尋引擎,最足以自豪的就是強大搜尋力與龐大資料庫,但隨著網路上的破解招數愈來愈多,使用者也開始慢慢發現,必須直接面對幾十萬筆重複率高,又充滿廣告的網頁。Mahalo就在這個時刻跳出來,回到人的需求角度,幫他們快速、準確地找到資訊。

如果在Google上打入「Chien-Ming Wang」(王建民),它可以在短短0.04秒內找到約78.2萬筆資料。第一頁中,有王建民的官網,第二頁、第三頁有一大堆相關出賽新聞,但這都是近期新聞的重複回顧。繼續往下看,第一頁曾經出現過的MLB和ESPN網站,在第六頁重複出現了。

為了消化電腦用0.04秒所跑出來的訊息,使用者可能得花上比機器運作還多出十萬倍以上的時間,才能從一堆網頁中完整地認識王建民。

然而,如果在Mahalo打入一樣的關鍵字「Chien-Ming Wang」,一樣在0.04秒之內,就會有一串搜尋結果呈現出來。但是,與Google不同的是,Mahalo上頭將王建民相關的資訊分成熱門、基本資料、新聞、照片、影片、商品、相關BLOG等等七大類,非常一目了然,就算完全不認識王建民的人,也能夠馬上了解王建民是來自台灣的棒球投手,身高有6呎3吋、體重225磅……

鬼才再下一城,人性化出發

在創辦Mahalo之前,卡拉肯尼這位網路鬼才最輝煌的戰役,是創辦知名的Weblog,然後重金賣掉。Weblog成功之處在於以酬勞留住高點閱率的Blog作者,以此透過Google AdSense賺錢。Google AdSense是將相關性高的廣告,刊登在自己網頁上的小程式,只要有人點選了網頁上的廣告,Google就會付獎金給網頁擁有者,把網頁流量轉化成實際的收入。

卡拉肯尼後來將Weblog賣給了美國線上(AOL),據傳,該交易案達到2500萬美元。離開美國線上之後,卡拉肯尼決心再創造一個驚天動地的網路事業,他計畫從e-mail、即時通訊,以及搜尋引擎等,人們每天所使用的三大網路工具中選擇一個,作為他東山再起的目標。

2006年底的某一天,卡拉肯尼看到太太依據他們去夏威夷度蜜月的經驗,把相關網站整理起來寄給眾家親朋好友。這個夏威夷旅遊清單不但經過精挑細選,節錄最實用的網站,同時也以組織化的形式呈現,絕對可以讓沒去過夏威夷的朋友,輕輕鬆鬆地就能規畫旅遊路線。

Mahalo因此在今年5月誕生,它是夏威夷方言,意思是「謝謝你」,是卡拉肯尼從旅遊清單中得到的靈感。最終極的目標就是幫討厭搜尋的用戶,找到所需要的資訊。它的方法是,只需要專注在最熱門的前30%,大約是1.5萬個關鍵字就可以了,其他符合長尾理論的冷門關鍵字,還是交給Google處理。

借助敵人之力,用人腦反攻

要想登上Mahalo,網頁必須是某個領域中的權威性網站、成立時間超過一年以上,網頁又得要擁有優質內容,並且廣告不可影響閱讀的流暢度。所以,在Mahalo上所搜尋到的網頁,不會出現利用關鍵字來拉抬點閱率的不相關網頁,也不會看到一堆火星文與不斷跳出來的色情廣告。

在加州聖塔莫尼卡的工作室當中,卡拉肯尼目前雇用了60位網頁篩選員,每天瀏覽一個接著一個的網頁,再把符合Mahalo規範的網頁匯總整理到Mahalo上面。每位網頁篩選員各自有自己的管區,他們必須定期回顧自己管區裡面的關鍵字,隨時進行更新。

這些網路嚮導年薪約3萬5千美元, 背景非常廣泛,從失意的小說家、劇作家,到演員、藝術家等等都有,因為來自各行各業,也有助於不同領域關鍵字的彙整,讓Mahalo所呈現的搜尋結果更加專業。

卡拉肯尼也具備著矽谷網路新貴的豪氣,他向員工承諾,未來,若是Mahalo上市,將會保留15%的股份給他們。

Mahalo最大的敵人雖然是Google,但是Mahalo作戰的方式卻不是正面攻擊,反倒是靠敵人之力來壯大自己。藉助Google強大的搜尋能力,來成就自己資料的豐富性。這並不是一場人與電腦的戰爭,反而是人類如能更加靈活運用高科技的智慧呈現。

目前Mahalo最強調的是即時新聞的收錄,卡拉肯尼組成一個小組,隨時監看RSS與突發新聞,可以在Google尚未將事件收錄進新聞欄目前,就刊登出來。這也是Mahalo認為,未來要挑戰Google的重要策略。

網羅聰明腦袋,力抗Google

在人工成本相當昂貴的美國,所有公司皆迫不及待地要將工作外包至人力成本低廉的地區,卡拉肯尼反而要在美國雇用人工,用最原始的方法來挑戰最新的科技,許多人認為這是非常愚蠢的一種做法,但鬼才卡拉肯尼,想法硬是跟別人不一樣。

譬如,有人質疑,如果Mahalo要發展成匯總世界即時新聞的網頁中心,勢必要像路透社、美聯社一樣,在世界各地灑出上千名記者來蒐集新聞。然而,在Web2.0的時代,這種直接調派記者的想法早已過時,卡拉肯尼是要用廣大群眾的力量來蒐集即時新聞。

卡拉肯尼運用過去在Weblog成功的經驗,以酬勞來留住專業、優質的網路寫手。只要網頁夠好、符合標準,Mahalo就會支付10美元給網頁擁有者。如果網頁的排列順序是在第五、第十、第五十……等里程碑的,還會加發1美元的獎勵,留在Mahalo上頭越久,領得就越多。如此一來,卡拉肯尼的人才庫中,就包含著全世界既聰明、又認真的網路玩家了,等於向全世界借來最聰明的腦袋。

雖然Google不願意證實,但外界猜測該公司在全球應擁有20萬台伺服器和1萬名員工,以應付繁雜的搜尋作業。卡拉肯尼認為,Mahalo只要20台伺服器與100名網頁嚮導,就可以維持順利營運,並且產生比Google還要好的效益。

在卡拉肯尼的推估中,Google每台伺服器一年就要花掉4000美元的維修成本,只要10台伺服器的維修經費,就足以讓卡拉肯尼雇用一名專職員工來處理關鍵字,這個員工一年可整理並更新約500個詞彙。如果Mahalo雇用100名員工來處理5萬個關鍵字,一年的開支也只需要400萬美元,遠低於Google 20萬台伺服器要花掉的8億美元,怎麼算都划算。

Mahalo未來的主要收入,還是鎖定廣告收益,他在Mahalo的介面上規畫了廣告專區。但是卡拉肯尼並不躁進,他不打算在Mahalo成立的頭兩年就販賣廣告,而是要等到品牌穩固了之後再說。

不管Mahalo是否將成為另一個網路泡沫,但Web2.0時代,人工搜尋引擎反而成了新趨勢,當Google有20萬台人工智慧,Mahalo卻有63億顆大腦,到底誰比較有利?Mahalo的發展,值得睜大眼睛看。

分享 Line分享分享 複製連結
職場學
您可能會喜歡