跳到主要內容

【特稿】戰勝李世石的Alpha go到底是什麼

南韓九段棋手李世石在人機大戰中連輸兩盤失利後。
南韓九段棋手李世石在人機大戰中連輸兩盤失利後。
【香港輕新聞】谷歌旗下人工智能Alpha go與南韓九段棋手李世石的「人機世紀大戰」,已完成四局,雖然在昨天的對弈中,李世石以「神之一手」扳回一局,但賽事以五局三勝定勝負,李世石已在「人機大戰」中敗北。
人工智能在被譽為最複雜的智力遊戲——圍棋競技中,戰勝人類智慧,但這並不代表人工智能已完胜人類。若要思考AI會不會終有一天發展出自我意識、從而統治人類?令《魔鬼終結者》在現實世界中上演,未免憂慮過早。不過我們不妨探究一下Alpha go究竟是什麼?其依據怎樣的運作系統?Alpha go的獲勝對人類有什麼借鑒意義?
有兩個「大腦」的Alpha go
據Alpha go的開發公司、谷歌旗下的人工智能公司DeepMind公開的資料,聰明絕頂的Alpha go並不是一台有超強計算能力的計算機,而是因為它擁有像人類一樣的神經網絡系統,換句話說,全因它擁有「大腦」,而且是兩個。
人腦由50至100億個神經元組成,而Alpha go是一个由许多个数据中心作为节点相连,每个节点内有着多台超级计算机的神经网络系统。这个系统的基础名叫卷积神经网络 (Convolutional Neural Network),这種系統经常被用于人工智能图像识别領域,比如谷歌的图片搜索、百度的识图功能。
DeepMind還為Alpha go還依據蒙特卡洛樹搜索(Monte Carlo Tree Search)的函數算法,用以建立判斷棋盤形式的價值神經網絡(Value Network),和決定下一步落子的策略神經網絡(Policy Network)。這兩個神經網絡就是上文提到的Alpha go的兩個「大腦」。
兩盤即成為大師 Alpha go超強的學習能力
此外,Alpha go還借鑒了一種名為深度強化學習(Deep Q- Learning)的技巧,深度強化學習源自心理學中行為主義理論,即有機體如何在環境給予的獎勵或懲罰的刺激下,逐漸形成對刺激的預期,產生能獲得最大利益的習慣性行為。在我們給狗狗用懲罰或食物,來訓練他們就是依據這一理論。
而Alpha go的深度強化學習能力,賦予它極強的學習能力,不僅在會下圍棋,也可以玩《太空侵略者》、《超級瑪麗》等電子遊戲。據DeepMind披露的資料,Alpha go已經「玩過」Pong、打磚塊、太空侵略者、海底救人、Beam Rider五款遊戲,並且在兩三局之後,它的操控能力就已遠超世界上任何一位已知的高手。這也就是李世石賽前觀看了Alpha go去年戰勝歐洲圍棋冠軍的比賽之後,仍認為自己勝算頗大——他實在低估了Alpha go的超強學習能力。
上棋局之前,工程師們還為 Alpha go上載了圍棋高手們逾3000萬步的棋步,並讓價值神經網絡進行了高達2000萬次自我對局的訓練,Alpha go才能一戰成名。
Alpha go的出現改寫圍棋思維方式
縱觀棋局,「人機世紀大戰」的五盤棋局,Alpha go不時出「怪招」,某些起初看來似是失誤,但最終被證明是致勝的關鍵,這種打破常規的落子招數,令職業棋手們驚訝。
據端傳媒報道,目前排名世界第一的中國棋手柯潔觀看「人機大戰」後,對李世石的失利「震驚得説不出話」,認為Alpha go的「實力遠超想象」,「下法簡明自然,整個思路非常清晰」,「看它下棋特別像人類的思維模式,而且計算能力很精準,越到後面越精準,失誤越少」。
南韓九段棋手趙惠連則指,人類和 Alpha go看待圍棋的方式截然不同,人類傾向以較大目數贏棋,但Alpha go的目標就只有贏棋,即使只贏半目。Alpha go將就此改寫圍棋,包括圍棋的範式和學習方式,重新定義何謂圍棋。

留言

這個網誌中的熱門文章

【旅遊】馬來西亞奇怪食材:青龍菜(四)

筆者在馬來西亞太平市的幾家餐廳發現一種從未見過的蔬菜——當地人稱「青龍菜」。聽說只有怡保附近的金馬侖山上才有栽種,是一名劉姓退休的農業科學家近年才新培育成功的。青龍菜顏色淺綠,外觀似韭菜,口味也接近韭菜或青蒜,不過氣味淡一點,口感更爽嫩。
此蔬在當地餐廳總是與綠豆芽同炒,不過,在太平的菜市場要轉一大圈,才看見一個攤檔有售。包裝很精致,300克一扎,賣4馬幣,若不加點豆芽還真炒不成一碟。上網才知道青龍菜屬於高貴菜,在馬來西亞其他地區要賣十元一扎,在當地是貴價蔬菜了。
青龍菜炒豆芽(筆者供圖)新鮮的青龍菜(筆者供圖)至於說搭配奇特的食物,筆者首推「豆芽雞」。初聞菜名,實在想不出究竟是怎樣的做法,在當地小有名氣的某餐廳點的豆芽雞:端上桌兩個盤子,一盤白切雞,一盤炒綠豆芽。雞自然是放養的走地雞,豆芽也長得矮胖喜人——但分明是兩碟菜,不明白它們之間有什麼巧妙和關聯。
還有一碟深色的食物,有人介紹是水果沙拉。滿腹狐疑地試上一口,果然是水果,但用醬油炒過了,還撒上花生碎,也算是個罕見的搭配。
值得一提的是,太平的菜市場乾淨整潔,菜場樓上設有大排檔,當地人在這裏解決早午晚三餐。至於這裡的小吃,品種融合了當地華人、馬來人、印度人的各類特色:肉骨茶、印度飛餅、炒貴刁,丸子湯、河粉條、珍多冰 ……與香港吃慣的口味都有少許不同,但不算太驚喜。
但是,有一款非常簡單的早餐「面包蛋」,令人印象深刻,做法也很簡單:生雞蛋兩個,破殼打在咖啡杯裏,連杯子一起蓋在滾水裏十分鐘,至蛋白半凝結,隨自己口味加胡椒粉和醬油,用烘脆的面包蘸蛋液吃。天天見慣見熟的面包和雞蛋,這樣配搭的吃法很有驚喜。
北馬當地特色菜『豆芽雞』。(筆者供圖)北馬特色小菜『炒水果』。(筆者供圖)北馬當地特色早餐『麵包蛋』。(筆者供圖)

澳洲代購奶粉華人女子疑涉接贓遭警方拘捕

因搜購嬰兒奶粉聞名澳洲的華人女子被警察鎖上手銬拘捕。


【香港輕新聞】華人在澳洲搶購嬰兒奶粉導致出現買奶粉難現象早已引起詬病,最近更被揭發有中國家庭專門偷竊奶粉轉售。一名在澳洲從事代購嬰兒奶粉的華人女子近日被墨爾本警方拘捕,有報道指這名女子涉嫌購買早前發生的華人家庭犯罪團伙「奶粉大盜」案的賊贓奶粉,據悉目前這位華人女子已經被警方釋放,但可能只是作為嫌疑人等候審理,而並非無罪釋放,目前此案仍在繼續調查之中。
今年1月澳洲警方偵破嬰幼兒奶粉盜竊家族
在今年1月份,一位名叫柯劍鋒(音譯,Jian Feng Ke)的華人剛剛從中國飛抵澳洲,就在機場被警方拘捕,他的父母和妹妹在他被捕前也已經被警方拘捕,警方一共逮捕了8名家庭成員,其中年紀最小的22歲,最大的53歲,各人被指控在澳洲盜竊嬰幼兒奶粉。

警方在被捕女子寓所發現大批奶粉,部分疑為賊贓。

疑犯房屋搜出4000罐奶粉、蜂蜜和保健品
澳洲警方從疑犯家庭位於悉尼的兩棟房屋中搜出了總價值超過100萬澳元、多達4000罐的嬰兒奶粉、麥盧卡蜂蜜和保健品,以及21.5萬澳元現金贓款。這些被盜的奶粉和保健品都正準備運往中國。從2018年開始,澳洲警方就一直在調查被盜奶粉的下落,之後順藤摸瓜找到這名做代購的華人女子,並人贓俱獲將她逮捕。

被捕女子被稱為「墨爾本夢幻」,曾被電視台跟蹤拍攝她搜購奶粉手法。

被捕女子外號「墨爾本夢幻」圈內十分知名
據知情華人透露,這名被捕的華人女子在澳洲代購圈內很出名,她就是「墨爾本夢幻」。在澳洲九號電視台的一檔名為《A Current Affair》的節目2018年曾播出的一個專題片《瘋狂的嬰幼兒配方奶粉》(Baby formula frenzy)中,她就是被拍到搶購奶粉的主角。
祖孫三代螞蟻搬家不斷到超市購買奶粉
在這個電視台的特別節目中,記者跟拍了這個住在墨爾本的華人家庭一整天,從背後看著「夢幻」女士一家人,她和母親還有孩子(祖孫三代),各自開車到不同的超市瘋狂購買奶粉,之後塞滿汽車後備箱,並囤積到自家車庫。這個節目還採訪了澳洲的年輕媽媽們。她們講述了由於這些華人代購無視4罐限量,以「螞蟻搬家」的方式不斷掃貨,以至於她們經常為買不到嬰幼兒配方奶粉而苦惱。



https://www.litenews.hk/?p=70068

【多方觀點】佔中案判刑輕重成爭議 反映社會撕裂難平復?

【香港輕新聞】佔中案昨日(24日)判刑,九名被告中,四人須即時入獄,四人獲判緩刑或社會服務,而陳淑莊因要接受手術,押後至6月10日宣判。針對判刑輕重言人人殊,有意見認為,此案政治意味濃厚,裁決非但不是和局,而且會造成社會進一步撕裂,對於政治事,僅強調法治是難以解決的;亦有意見表示,以普通法控告「九子」的疑似不公,法官的說詞也「十分礙耳」,然而卻證諸佔中事態的發展。
突顯修補撕裂的困難
《明報》社評表示,佔中案判刑輕重言人人殊,是「突顯社會撕裂從未真正癒合」,而「衡量判刑輕重需要視乎具體場景,避免引喻失義又或立場決定腦袋」。對於控罪是否適合、判刑是否過重,「應當本着法治精神,經由上訴程序處理,不應政治化」。社評認為,在支持者眼中是「從容就義」,可是在不滿者眼裏卻是「死不認錯」,「雙方對事情的認知和觀感存在鴻溝,突顯修補社會撕裂的困難」。
應避免政治立場先行
《明報》社評認為,佔中案只是根據法律觀點,決定九名被告罪名是否成立,「跟佔領運動的政治和歷史評價是兩碼子的事,看待量刑輕重,應該避免政治立場先行,亦要避免斷章取義式的直觀比較」。對於政治層面的撕裂,「只能透過政治對話接觸」收窄分歧;至於消弭人心撕裂,則「需要各方易地而處,換位思考,多去理解別人的感受」。
裁決令社會更撕裂?
《信報》「金針集」金箴文章引述民主派會議召集人毛孟靜表示,「判刑結果想帶出『打和』感覺」,文章卻認為「裁決非但不是和局,而且是社會進一步撕裂的助燃劑」,「佔中案的起因是政改,政制不改,社會不和」。「行政長官林鄭月娥一味強調法治,毫無疑問是捉錯用神」,政治問題必須政治解決。
難言對選舉的影響?
《信報》「金針集」金箴文章表示,邵家臻和陳淑莊即時喪失議員資格的機會不高,因為民主派議員人數在立法會佔三分之一以上,對於抵住「DQ」壓力,而立法會換屆選舉亦將在明年展開,「DQ完再補選差不多夠鐘落莊洗牌」,建制派也「犯不着逼人太甚」。文章認為,目前難言判刑對明年選舉的影響,「民主派理論上可以藉着有人坐監而得到同情票,奈何本土派從一開始就質疑佔中九子的理念,能否贏得他們的選票實屬懸念」。
不肯面對慘重代價?
《星島日報》社評表示,法官判詞指出大眾看清「故事的另一面」,「就是被告借『公民抗命』之名肆意違法,破壞秩序,讓眾多市民飽受佔領之苦,卻始終得不到他們的道歉」,「判刑前後,被告和支持者在法庭外製造激昂場面」,轉移大眾注意力。