微軟為何要押寶人工智能?納德拉想讓公司超越谷歌
微軟認為,經過近二十年在機器學習和自然語言處理方面的進展,該公司已經擁有最好的“大腦”,可以幫助該公司締造一個由人工智能支持的美好未來。微軟在打造能夠與用戶進行情感共鳴的智能設備方面已經取得領先地位,并率先在中國市場進行了視頻測試。...
美國科技博客The Verge近日發布了署名為凱西?牛頓(Casey Newton)的文章,文章對微軟為何將未來押寶在人工智能(AI)方面進行了闡述與分析。以下就是這篇文章的主要內容。
人工智能(AI)
薩蒂亞?納德拉(Satya Nadella)一踏進會議室,就開始急切地談論智能問題。我有幸到微軟總部,聽納德拉談論微軟公司在打造更多智能應用和服務等方面的進展情況。納德拉告訴我,每天早上,他都會戴上HoloLens全息眼鏡,這款眼鏡能夠讓他看到投影到自家墻壁上的虛擬現實、互動日歷等內容。納德拉在描述這些情況時,顯得眉飛色舞。這套系統是非常智能的、具有生產力的,也是未來派的,納德拉希望一切都將掌控在他的領導之下。
微軟CEO:納德拉
納德拉表示,無論我們將來在哪兒工作,微軟都將會在其中擁有一席之地。微軟公司于今年三月展現的“對話即平臺”(Conversation as a platform)戰略,就體現了該公司在豪賭一項業務——基于聊天的互動界面將取代應用作為我們使用互聯網的主要方式,未來用戶將使用新的聊天界面來查找信息、購物、使用其它服務。與此同時,由于微軟推廣的“認知APIs”的推動,應用也將更加智能。未來,微軟所使用的這種“認知APIs”將能夠識別照片和視頻中的人臉、表情以及包含的其它信息。
微軟認為,經過近二十年在機器學習和自然語言處理方面的進展,該公司已經擁有最好的“大腦”,可以幫助該公司締造一個由人工智能支持的美好未來。微軟在打造能夠與用戶進行情感共鳴的智能設備方面已經取得領先地位,并率先在中國市場進行了視頻測試。在科技行業各個大公司中,微軟是第一家針對文本聊天界面而發布真正平臺的公司,這也是微軟引以為豪的地方,特別是在智能手機的崛起導致多數此類業務下滑的情況之下。
移動業務受挫之后,微軟還能打贏下一場戰爭嗎?
今年1月,The Verge曾發布文章描述了科技行業尋找殺手級智能設備的消息。在之后的幾個月中,業界大小公司都加快在此方面的努力措施。Facebook啟動了自己的智能聊天設備研發平臺,搭載其具有人氣的Messenger聊天應用。谷歌(微博)也宣布了自己的新智能助手,代號為“Allo”,而且還將推出一款智能對話應用“Home”,與亞馬遜的Echo展開競爭。與此同時,Echo的語音輸入信息功能已經吸引了不少開發者,這款產品也已經入駐300多萬家庭,而且還通過其API增加了1200多個“技能”。
微軟對自身在API方面的工作感到非常滿意,并急切地希望表明該公司在這一方面的競爭中必將最終勝出。今年6月,微軟邀請我到該公司的園區,采訪納德拉的一些高級幕僚,這些高級幕僚正在幫助把人工智能融入到微軟業務的每一個角落。在之后的兩天中,微軟向我展示了在自然語言處理和機器學習方面取得進展的大量應用。
與以往一樣,微軟公司這次還是熱情洋溢地講述了該公司的進展和遠景目標。微軟此前在判斷科技行業的走向方面一直有著較高的水準,但是,在針對科技行業發展趨勢而采取行動方面,微軟則出現了一些失誤之處。例如,微軟要比業界同行更早地看到了智能手機和平板電腦的巨大潛力,但在最終的產品開方發,微軟卻在蘋果和谷歌面前一敗涂地。因此,面對微軟在人工智能方面所采取的積極措施,業界免不了產生了這樣一個疑問:微軟公司這次怎么不走尋常路了?
或許,與美國的任何一家公司相比,微軟在打造聊天機器和軟件方面已經取得了更多的成功。但是,人們可能對此毫不知情,因為微軟的這一成功始于中國市場。
2016年1月,微軟的一位人工智能產品出現在上海東方衛視的早間新聞當中。當時,東方衛視在播放天氣預報時,就利用微軟小冰提綱主持人,取得了較大的成功。
如果你想知道,微軟為何能夠在聊天機器人方面擁有如此驕人的成績,那么“小冰”就是最好的一個答案。微軟必應搜索工程業務主管德里克?康奈爾(Derrick Connell)表示,“現在我還不敢說我們已經研發出殺手級的聊天應用——但是,我們已經找到了一款聊天應用,這款應用以一種全新的方式工作,能夠實現諸多的對話潛力。”
2014年,微軟曾通過中國的消息應用“微信”推出了“小冰”。小冰能夠回答一些簡單的問題,這有點像微軟的虛擬現實助手Cortana。但是,小冰比Cortana更加出色的地方就是對話功能。這個智能聊天設備對情緒非常敏感,而且還能夠記住用戶此前的聊天情況,并主動與用戶進行互動聊天。
在使用了三天之后,小冰就得到了業界的廣泛關注,不僅成為微信用戶廣泛議論的話題之一,而且還吸引了中國大量微博用戶的關注。在中國市場,小冰也成了最具人氣的名人帳號。如今,這款智能聊天應用已經被4000多萬用戶使用,用戶與這款應用之間的平均每次對話約有26個回合。
對康奈爾而言,小冰也為推進下一代搜索服務指明了方向。傳統的網絡搜索會反饋一個網頁,給用戶提供所需的搜索結果,然而,這個更加完美的對話機器人應用可能會通過語音這種簡單的回答方式給用戶提供他們所需的答案。
當然,微軟智能聊天應用在中國市場的成功并不一定表明其也能在美國市場取得成功。例如,微軟在美國市場推出的首款英語聊天機器人“Tay”,在與用戶的聊天試驗中表現非常糟糕,并最終徹底失敗。如今,小冰距離最初亮相已有兩年的時間了,然而,這款智能聊天機器人卻仍不具備同等的英語聊天能力,而且近期可能也不會得到大幅改進。不過,微軟高管聲稱,小冰背后的基礎架構卻表明該公司在此方面有著大量的機會。
“我們想讓它成為一個生態系統”
康奈爾表示,“這是一個現代化的時代——用戶不需要成為演講和理解語言方面的專家。只要使用一款工具,用我們的工具打造自己的智能聊天設備,并將其放到相應的場景之中——可能在‘Slack’應用上,也可能在‘Facebook Messenger’應用上,我們還希望是在Skype或Windows之上,所有的這一切都依賴用戶自己的選擇。”
不過,開發者也越來越擔心,有關智能聊天機器人的標準之爭也將激烈展開,為此,微軟也非同尋常地開展了外交活動。今年6月,微軟在舊金山組織了一次會議,倡導智能聊天應用制造商之間開展更多的合作。微軟高級工程師程莉莉(Lili Cheng)幫助組織了此次為期兩天的會議,她表示,“我們對智能聊天設備的可互操作性非常感興趣,我們希望這是一個生態系統。今后極有可能的情況是,我們需要找到各方合作面臨的問題和挑戰,并齊心協力加以解決。”
通過主導智能聊天設備為主題的會議,微軟希望,在向智能聊天機器設備轉型的過程中,能夠以此來鞏固自身的核心地位。如果微軟取得成功的話,那么它將在移動領域擁有全新的開端。微軟技術所支持的智能聊天機器設備能夠從內部展現世界最具人氣的消息應用的各種情況,從而讓微軟在這個全新的領域獲得立足的堅實基礎。
戰略
當然,微軟單獨在嘗試打造下一代計算的限定性平臺——如果人機對話需要那樣的平臺。事實上,各家大科技公司以及大量的初創企業都創建了自己的人工智能部門,而且也都取得了令人印象深刻的結果。但是,值得指出的是,將各個公司的人工智能業務進行比較,還是非常困難的,甚至是不可能的。像谷歌、Facebook以及亞馬遜等公司仍在研發一些未發布的人工智能業務。相關公司的高管在被問及用戶什么標準來區分人工智能或者是他們的人工智能有什么顯著特點等 問題時,他們的回答總是含糊其辭。例如,谷歌首席執行官桑達?皮查伊(Sundar Pichai)只是簡單地表示,“很長一段時間以來,該公司一直在研發人工智能。”
風投公司Andreessen Horowitz的未來主義人物本尼迪克特?埃文斯(Benedict Evans)近期通過博客稱,人工智能的未來仍然非常模糊。埃文斯在博客中表示,“這一領域迅速發展,以致于很難弄清最強的領導者到底在哪兒,哪些產品會成為主流,以及各個產品的主要區別到底是在哪兒,目前也都很難說清楚。盡管與這些技能相關的主要計算機科學已經問世,而且也是開放源學科,但是,真正的執行卻遇到了不少問題,因此,事實上,這些技能仍然沒有真正地轉化為產品。”
負責公司應用與服務團隊的微軟高管陸奇(Qi Lu)表示,就微軟的競爭優勢而言,他感到非常滿意。陸奇也是一位計算機科學博士,名下已經擁有20多項專利。我從與他同行的對話中了解到,他也備受同行們的尊敬。在交流了一段時間之后,我終于發現其中的原因了——他是一個非常具有才智的人。我們會見時,他穿著涼鞋,配著襪子,身著短褲和T恤,T恤衫上寫著一句話——“做偉大的事情”。
陸奇開始總結第一波移動互聯網帶來的不利局面。他稱,來自移動設備的網絡流量比值一直沒有超過臺式設備,這反映了用戶對移動互聯網的一種失落感。陸奇表示,“我們知道網絡并非真正地是在手機上有效。”從很大程度上來說,用戶似乎不愿意下載應用。西雅圖的居民可能會被要求下載某一款應用,目的只是為了要檢查一下他們多次乘坐的渡輪的票價情況——當然,應用會有更好的模式。陸奇又表示,“我們的行業一直沒有發現一個能夠展示移動和云計算完整價值的體驗平臺。從根本上而言,應用并非正確的模式。”
應用只是以代替基于HTML的網絡的交互界面而崛起,因為應用是我們此時能夠做得好好的方式。你可能無法通過語音的方式將你從互聯網上獲得的內容輸入到手機當中,于是,開發者打造了成熟的隱藏式產品,從而讓你通過巨大的圖形按鈕來與手機進行互動。這種按鈕仍然是完成諸多任務的最有效途徑。但是,由于自然語言處理技術的進步,如今你們也真正能夠通過語音方式將從互聯網上獲得的內容輸入到手機之中。陸奇聲稱,下一代“體驗平臺”就將從那里起步,就通過人機對話開始。這將更加自然地與人類的一切行為方式相融合。而且,如果用戶做對的話,那他們就可以充分利用各種按鈕。陸奇還稱,“我們已經看到用戶在全方位地將語言當作一種基本方式來改善這種體驗,而且還以更加成熟的方式使用圖形互動功能。”
陸奇還表示,對企業而言,要想在這些領域取勝的話,還需要五大“關鍵要素”。第一大要素就是“對話場景”——在這里,用戶可以進行大量的對話和文本消息進行交流。在這方面,微軟擁有Office、Outlook、Skype以及Cortana等。第二個要素就是人工智能“大腦”——這是一種非常成熟的大腦模式,微軟聲稱其自己的人工智能措施可以追溯到20年之前。第三個要素就是要能利用社交圖譜——人們在互聯網上的活動往往涉及他們的好友和同事。并非巧合的是,在我會見了陸奇后的幾天,微軟宣布該公司將斥資262億美元收購LinkedIn及LinkedIn的4.33億注冊用戶。第四個要素就是能夠操作人工智能業務的平臺。微軟擁有Windows和一系列類似設備,特別是Xbox。最后一大要素就是渴望在你平臺上打造應用以及愿意為購買優先權而向你付費的開發者網絡。激發開發者在此方面的興趣也一直是今年三月份微軟Build開發者大會的主要目標。
單從其中的某一個要素來看,微軟也面臨著強勁的競爭對手。事實上,Facebook就擁有更加強大的人機對話場景,而且還具有自主研發的大量消息應用,同時該公司還擁有最大的社交圖譜。谷歌的“大腦”或許更加智能,而且谷歌還能夠接觸到數億部Android設備。不過,就總體情況而言,微軟似乎要樂觀得多。對此,陸奇表示,“把所有的要素加起來,我認為,我們完全擁有主導未來的實力。”
“大腦”
微軟全力支持人工智能早在兩年前的年度就已經開始了。在當時召開的Code Conference大會上,剛剛擔任微軟首席執行官三個月的納德拉登臺演講,闡述了微軟的未來遠景。納德拉在演講結束之際,展示了Skype的一些功能。隨后,另外兩名微軟員工也登臺演講,一位講英語,一位講德語,而Skype則實時翻譯他們的演講內容,從而讓他們無障礙地與聽眾互動。這樣的展示給業界留下了深刻的印象——就在當年底,納德拉宣布這將成為一件工作產品。
在返回微軟總部之后,納德拉就對Skype研發團隊下達了命令,要求盡快將此產品推向市場。負責微軟研究業務的企業副總裁彼得?李(Peter Lee)表示,“對我而言,這的確是一個大意外。薩蒂亞的確是用這個Skype Translator把我套牢了。”最初,研發團隊一直存在兩大擔憂。其一是,微軟研究團隊歷史上一直沒有將產品推向市場的任務,研究人員擔心,他們會因此而突然沒有什么自由來追尋科學上的突破與進展。其二是,在展示時,Skype Translator表現不太好。微軟公司的語言模式一直是使用大量正式的演講內容來測試——例如來自聯合國的演講內容等。但是,Skype需要用來翻譯的這種雙軌式交流卻大不相同。當然,Skype在翻譯時還存在更多的“不流暢”局面——特別是當發言者說錯某個詞時,或者重復某句話時。另外還會出現“編程混亂”的情況——當發言者在一個句子中使用多種語言時。此外,當人們相互對話出現嘈雜之音時,Skype Translator在翻譯時就顯得非常困難。
彼得?李還表示,“從根本上看,一切仍無濟于事。我們需要做的就是重新對各種模式進行訓練。”但是,李的團隊似乎受到了納德拉的鼓舞,于當年12月就推出了預覽版的產品。第二年,這款產品就廣泛的投放到市場,供用戶免費使用。彼得?李一度將納德拉稱為“激進人士”,他聲稱,此項目最終還是非常令人振奮。李表示,“試想一下,當你認為所有的一切都毫無作用的時候,你可能會士氣低落,而且感到恐懼,但是,你不得不讓人們相信這個產品。當你努力這樣做的時候,你就會看到令人振奮的新事物隨之而來。”
這種說法感覺上并不夸張。微軟如今能夠將八種不同語言之間的相互對話(相當于56組對話)翻譯出來,其背后的技術影響力已經超越了翻譯本身。你想聽聽一個具有令人難以置信的作用的智能聊天設備說話嗎?微軟正在測試記錄商業會議內容并能夠實時整理內容文稿的軟件。也就是說,同樣的軟件也能夠記錄兩人之間的采訪聲音內容,并整理出相關的文稿,或許,這將成為任何記者都非常向往的技術產品。
李表示,“無法向你們描述,當我們最初研發時發現Skype Translator的一切工作都無濟于事的,我們是何等悲傷。但如今,我們正在攀登高峰,我們正在發展這些演講和翻譯模型,特別演講模型——他們好得出奇。”
“Clippy的復仇”(編注:此理念源自《灣區日報》上一篇不錯的概述聊天應用發展前景以及以聊天應用為平臺的創業觀點的文章)
與此同時,微軟還將大量的人工智能資源注入公司旗下的一些重大產品之中,例如Windows和Office等。人工智能的一大潛力就是,它能夠預測用戶的需求——這也是Google Now的主要創意。Google Now能夠在用戶打開手機時向用戶提供交通、天氣、化育賽事的比分等信息。
微軟正在努力將類似的人工智能整合到臺式產品之中。負責Cortana研發的馬庫斯?阿什(Marcus Ash)向我展示了一款模仿版的Windows,此系統能夠在基于云的界面上繪制出我可能想要知道的東西。當阿什接觸啟動菜單之后,Cortana就顯示出一系列建議行動:對你有意義的姓名、你近期使用過的文檔、建議翻譯的普通法語單詞等。在用戶的許可之下,Cortana將整合用戶聯系人、網絡搜索歷史以及應用使用情況等相關的數據信息,并給出相應的建議。
而且這還會隨著每天的時間而變化——例如,應用開發者能夠預測這些應用是在上午還是在晚餐時間發揮作用。對此,阿什表示,“這種利用人機對話、以及在用戶許可下利用與用戶相關信息來讓用戶更加有效開展行動的創意,感覺就像是用戶被控制了一樣,然而這恰恰就是我們真正為之高興的東西。大量的用戶體驗工作日趨簡化,而且取消了各種限制,并能夠真正地向人們展示智力的力量。”
阿什最喜歡的一大事例就是所謂的“承諾”。在得到你的許可之后,Outlook就可以記錄你的老板要求你在周末之前給她送什么東西等之類的事實——而且,如果你未能及時做到的話,它還會自動提醒你。阿什表示,“我的生活非常忙亂,我總是健忘——特別是忘記處理電子郵件。”最近,他就忘記給他們自己的老板提出的要求進行回復,但幸好,Cortana及時通知他處理了這件事。
當我會見微軟負責Office營銷業務的企業副總裁科克?科尼格斯鮑爾(Kirk Koenigsbauer)時,我看到更多類似的情況。他向我展示了各種智能讓Office更加便于操作的方法。2014年9月,微軟推出了Delve,這是一款內置在Office 365中的便捷工具,有點類似于Fitbit的功能。這款應用能夠分析用戶花費在電子郵件上面的時長,以及開會的時長,而且還能夠在用戶的日歷上突出顯示用戶從事更加復雜更有意義工作的時間和加班時長,甚至是完成工作的速度。這款應用 將建議用戶與一段時間一直沒有電子郵件往來的同事們進行聯絡。此外,這款應用甚至還會向用戶顯示同事以及自己回復電子郵件的時間。
如果用戶組建群用戶共同使用谷歌應用,就像硅谷許多公司那樣,那么,瀏覽Delve時可能就會有意外的發現。你沒有必要再像一個數字書呆子那樣尋找這類有用的信息。如果你是一個經理,那么Delve就能夠提供你看一眼你過去一周花在每位員工身上的時間有多長。這種智能不一定像能夠預期用戶需求的那種人工智能那樣好,但是,它也能夠起到它應有的作用,通過比較,而且還會讓谷歌應用看上去就像是一個可以忽略的東西。
經過六個月的搜尋殺手級智能聊天設備之后,我仍然對這一概念持有非常樂觀的態度。這種智能設備所能進行的交互量非常大。不過,我一直對我們能夠在Facebook Messenger和Telegram等平臺上看到諸多內容感到失望:每次我總感覺到這可能是使用互聯網的最慢方式了。如今,圍繞智能聊天應用和人工智能的討論仍然受到業界打造可盈利新平臺的愿望所驅使,而不是這些服務到底能在多大程度上滿足消費者的需求。
一些公司目前為止針對這一問題的答復一直是,他們已經在研發滿足消費者需求的應用。Facebook首席技術官邁克?斯科洛普夫(Mike Schroepfer)表示,“與諸多先進的技術一樣,人們認為這種智能技術如今已經出現。事實上,還有許多的技術和工作需要研發。我認為,日復一日,年復一年,我們肯定能夠在這些方面取得進步。”