2017年,諸多創(chuàng)新在科技史上留下濃墨重彩的一筆。一些科幻電影中描繪的未來場景,已出現(xiàn)在現(xiàn)實(shí)生活當(dāng)中。
新的一年,哪些技術(shù)突破會(huì)給人們帶來新的驚喜?
人工智能:潤物細(xì)無聲
2017年堪稱“人工智能年”。2018年會(huì)怎樣?專家預(yù)言,得益于機(jī)器學(xué)習(xí)的不斷進(jìn)步,人工智能還將加速進(jìn)化,“潤物細(xì)無聲”般滲透到我們生活的方方面面。
美國億貝公司計(jì)算機(jī)視覺首席科學(xué)家魯濱遜·皮拉穆圖說,將會(huì)有越來越多智能手機(jī)能運(yùn)行深度神經(jīng)網(wǎng)絡(luò),家用機(jī)器人價(jià)格也會(huì)更實(shí)惠。美國高德納咨詢公司則預(yù)計(jì),算法將會(huì)在2018年改變?nèi)驍?shù)十億人的行為;到2019年,幾乎40%的企業(yè)將使用聊天機(jī)器人參與處理商務(wù)。
人工智能領(lǐng)域著名專家李飛飛認(rèn)為,人工智能已到了產(chǎn)業(yè)應(yīng)用的“歷史時(shí)刻”,未來潛力巨大。在制造業(yè)領(lǐng)域,人工智能將優(yōu)化整個(gè)生產(chǎn),推動(dòng)機(jī)器人智能制造發(fā)展;在資源和環(huán)境領(lǐng)域,大數(shù)據(jù)分析和計(jì)算機(jī)視覺都會(huì)發(fā)揮重要作用。
2018年,人工智能還將推動(dòng)自動(dòng)駕駛?cè)遮叜a(chǎn)業(yè)化。谷歌母公司“字母表”旗下的“出行新方式”(Waymo)公司最近實(shí)現(xiàn)了完全無人干預(yù)的自動(dòng)駕駛汽車上路,并開始自動(dòng)駕駛出租車試運(yùn)營。
不過,目前的人工智能還屬“弱人工智能”,僅能在某些特殊領(lǐng)域施展計(jì)算能力,與真正的人類智力還有較大差距。
量子計(jì)算:群雄逐鹿起
2018年,量子計(jì)算能力的競爭將拉開“群雄逐鹿”大幕。其中一個(gè)懸念就是誰能率先突破50量子位的“量子霸權(quán)”標(biāo)志。
“量子霸權(quán)”指量子計(jì)算機(jī)的計(jì)算能力超過傳統(tǒng)計(jì)算機(jī),實(shí)現(xiàn)相對(duì)于傳統(tǒng)計(jì)算機(jī)的“霸權(quán)”。有觀點(diǎn)認(rèn)為,50量子位的量子計(jì)算機(jī)就能實(shí)現(xiàn)“量子霸權(quán)”。
2017年底,美國國際商用機(jī)器公司(IBM)宣布成功研制一款50量子位處理器原型,并與三星、摩根大通等公司建立量子計(jì)算合作,有望在2021年前推出首個(gè)在金融領(lǐng)域的量子計(jì)算應(yīng)用。
而量子計(jì)算的另一領(lǐng)先者——谷歌正在開發(fā)有49個(gè)量子位的機(jī)器,英特爾和微軟在該領(lǐng)域也持續(xù)加大投入。中國科學(xué)技術(shù)大學(xué)的潘建偉與陸朝陽課題組也在向相關(guān)目標(biāo)努力,他們于2017年成功研制出世界首臺(tái)超越早期傳統(tǒng)計(jì)算機(jī)的量子計(jì)算機(jī)。潘建偉認(rèn)為中國的量子計(jì)算將如雨后春筍般發(fā)展。
“很顯然,建造量子計(jì)算機(jī)現(xiàn)在是一個(gè)世界范圍內(nèi)的競賽?!泵绹每怂_斯大學(xué)奧斯汀分校量子信息中心主任斯科特·阿倫森說。他認(rèn)為在未來一年左右將有人贏得這場競賽。
阿里云量子技術(shù)首席科學(xué)家、美國密歇根大學(xué)終身教授施堯耘也對(duì)2018年實(shí)現(xiàn)“量子霸權(quán)”表示樂觀,但他在接受新華社記者專訪時(shí)說,“量子霸權(quán)”可能會(huì)誤導(dǎo)一些科學(xué)家,這不應(yīng)是最終目標(biāo),真正的檢驗(yàn)標(biāo)準(zhǔn)應(yīng)是量子計(jì)算能否解決實(shí)際問題。
太空探索:攬?jiān)掠终?/strong>
2018年,清冷的月球?qū)ⅰ盁狒[”異常。
中國將發(fā)射嫦娥四號(hào)中繼星和探測器,實(shí)現(xiàn)地球與月球背面的通信,并探測月球背面區(qū)域;美國私人企業(yè)“月球捷運(yùn)公司”計(jì)劃發(fā)射探月著陸器,有望成為首個(gè)成功探月的私企;印度計(jì)劃實(shí)施“月船2號(hào)”探測器登月任務(wù),有望成為又一個(gè)登陸月球的國家;美國太空探索技術(shù)公司也計(jì)劃開啟商業(yè)太空旅行項(xiàng)目,幫助兩名太空游客繞月飛行……
同時(shí),人類前往其他行星的探索之旅也將繼續(xù)。
美國航天局“洞察”號(hào)火星無人著陸探測器將于5月發(fā)射,11月在火星赤道附近降落。探測器將使用機(jī)械臂將其搭載的兩臺(tái)主要儀器——地震測量儀和溫度測量裝置永久安置于火星表面。這將是首個(gè)研究火星地層內(nèi)部的探測使命。
歐洲和日本航天機(jī)構(gòu)合作研發(fā)的水星探測器將在10月開啟旅程,向太陽系中未知程度最高的行星之一進(jìn)發(fā)。
生物醫(yī)藥:更上一層樓
新的一年,生命科學(xué)也將持續(xù)升溫,為重病難病提供全新治療方案。
在新一代基因編輯工具尤其是CRISPR推動(dòng)下,新型基因療法將加速邁向臨床應(yīng)用。統(tǒng)計(jì)數(shù)據(jù)表明,全球迄今已開展約2400種基因療法的臨床試驗(yàn)。
在美國,2017年已有三種基因療法獲批準(zhǔn)上市,其中兩種治療癌癥,一種治療遺傳病,這為2018年基因療法市場的升溫拉開序幕。正如美國食品和藥物管理局局長斯科特·戈特利布所說,基因療法正處于一個(gè)“轉(zhuǎn)折點(diǎn)”,將成為治療甚至治愈許多重病難病的支柱。
中國科學(xué)家也已開展了利用CRISPR-Cas9基因編輯技術(shù)治療肺癌的臨床試驗(yàn)。據(jù)英國《新科學(xué)家》周刊預(yù)測,試驗(yàn)有望于2018年收官。
業(yè)內(nèi)人士還預(yù)言,基因編輯與免疫療法結(jié)合治療癌癥,短期內(nèi)有望進(jìn)入臨床應(yīng)用。2017年,美藥管局已批準(zhǔn)兩款基于改造患者自身免疫細(xì)胞的CAT-T(嵌合抗原受體T細(xì)胞)療法上市,讓科學(xué)界對(duì)免疫細(xì)胞療法信心大振。全球目前約有60家公司在開發(fā)治療癌癥的CAR-T療法,它們中很多都將于2018年獲批上市。
]]>說到BAT三家在AI方面的表現(xiàn),百度和阿里一直很高調(diào),比如李彥宏曾經(jīng)說百度的AI是中國的“國家隊(duì)”,而馬云前幾天立項(xiàng)NASA的新聞也鋪天蓋地,而相比較下,騰訊卻顯得比較低調(diào)和安靜。
但是近期騰訊的AI研究終于有了一個(gè)比較喜人的成績:在今年的UEC圍棋比賽中,騰訊的AI“絕藝”戰(zhàn)勝了日本DeepZenGO在內(nèi)的多只AI,奪得了冠軍。
絕藝奪冠了,馬總很開心
雖然這次比賽沒有AlphaGo參加,但這個(gè)新聞也著實(shí)讓很多人對(duì)于一直不顯山不露水的騰訊的AI水平有了新的認(rèn)知。
絕藝在UEC中奪冠比賽路徑(圖片來自全景網(wǎng)騰訊專訪)
要說“絕藝”這個(gè)名字并不是一開始就有的,一開始騰訊的下棋AI名字一直是Weigo,而“絕藝”這個(gè)詞第一次在人們的視野中出現(xiàn)還是去年11月1日,當(dāng)時(shí)weigo第一次以“絕藝”這個(gè)ID在野狐平臺(tái)對(duì)戰(zhàn),第二天就戰(zhàn)勝了世界冠軍江維杰,此后這個(gè)名稱被沿用。
“絕藝”在野狐平臺(tái)使用過的馬甲,每升級(jí)一次,挑戰(zhàn)對(duì)手實(shí)力更強(qiáng)一階(圖片來自全景網(wǎng))
有意思的是,在這之前,weigo在野狐平臺(tái)叫過各種“小名”,已知的第一次對(duì)戰(zhàn)在去年8月,它用“虎虎有生氣”這個(gè)ID開始在野狐下棋,8月23日第一次戰(zhàn)勝了職業(yè)選手。
接下來,不知是不是出于信心增長,改用“野狐掃地僧”ID,在9月4號(hào)和網(wǎng)友tby大戰(zhàn)8局,8局連勝,網(wǎng)友tby不是別人,正是棋圣聶衛(wèi)平的長子孔令文。
此后就是11月1日用“絕藝”這個(gè)ID戰(zhàn)勝江維杰,之后戰(zhàn)績恐怖:11月19日,對(duì)柯潔,一勝一負(fù);11月28日對(duì)陣韓國第一人樸廷桓5勝1敗,再之后的手下敗將有韓國的尹均相、范蘊(yùn)若、古力、黨毅飛、陳耀華、連笑、羋昱廷、胡耀宇、辜梓豪……
野狐平臺(tái)上“絕藝”的信息,明確標(biāo)識(shí)為“十段”
這一陣狂風(fēng)之后,根據(jù)野狐平臺(tái)的計(jì)算方式,“絕藝”榮升“十段”。
雖然當(dāng)時(shí)騰訊從來沒有出面認(rèn)領(lǐng)過,但是棋迷們大部分都已經(jīng)猜出“絕藝”就是騰訊當(dāng)年那個(gè)叫作“Weigo”的AI。
甚至有網(wǎng)友扒出去年騰訊報(bào)名UEC的時(shí)候,使用的名稱仍然是Weigo。然而,大概是由于“絕藝”這個(gè)馬甲早已深入人心,或者騰訊早有打算,總之,Weigo現(xiàn)在已經(jīng)改名“絕藝”混世了。
網(wǎng)友扒出的參賽報(bào)名名單(來自新浪微博)
很多人可能都知道DeepZenGo,但是沒有聽過“絕藝”,對(duì)普通人來說,可能直到今年UEC比賽,絕藝才算“一鳴驚人”。聯(lián)系此前騰訊在AI上的低調(diào),我們可以說一開始營造神秘感,之后一炮而紅的做法,似乎有著更好的宣傳效果,這個(gè)套路在江湖上人稱“憋大招”。
“憋大招”之所以讓人覺得很厲害,是因?yàn)樵诔聊斜l(fā),“屌絲逆襲”的故事總是震撼人心。但是說到這里,小編還是忍不住奶一口毒雞湯為大家:那就是并不是所有的屌絲都能在默默無聞中憋出大招,能憋出大招的屌絲很有可能早就有著得天獨(dú)厚的優(yōu)勢——
首先,騰訊從來不是屌絲,而是高富帥,與此同時(shí)直接導(dǎo)致絕藝不可能是個(gè)屌絲,至少是個(gè)富二代。
騰訊的AI實(shí)驗(yàn)室由13人團(tuán)隊(duì)組成
騰訊背景在本次絕藝獲勝中有關(guān)鍵作用:
UEC比賽每方出棋時(shí)間一共30分鐘,每一步大概就20秒左右,可以算得上快棋,而各家AI在本次比賽中是分別使用自家的服務(wù)器進(jìn)行計(jì)算的。計(jì)算時(shí)間有限,就對(duì)于計(jì)算速度提出了非常高的要求,而騰訊在調(diào)用計(jì)算資源上的優(yōu)勢相對(duì)于其他顯然是碾壓。即使DeepZenGO的背景是日本第一視頻網(wǎng)站,其服務(wù)器規(guī)模在騰訊面前仍是不值一提,更不要說中國已經(jīng)具備了世界領(lǐng)先的超級(jí)計(jì)算能力。
如果規(guī)定所有參賽者使用同等服務(wù)器,結(jié)果可能對(duì)絕藝不利。
不過,絕藝一路走來也不是一帆風(fēng)順的。騰訊從一開始就對(duì)于打造圍棋AI這件事說得很保守,對(duì)于為什么要做AI,就有“鍛煉說”和“檢閱說”兩個(gè)說法:當(dāng)時(shí)副總姚星的說weigo項(xiàng)目可以“鍛煉”團(tuán)隊(duì)的研發(fā)能力;研發(fā)團(tuán)隊(duì)說做圍棋機(jī)器人可以對(duì)團(tuán)隊(duì)的算法研究、大規(guī)模計(jì)算以及工程能力進(jìn)行一次“檢閱”。
這兩種說法都讓騰訊做圍棋機(jī)器人蒙上一層“玩票”的氣息,做成了,就是太厲害了,玩玩都能成;做不成也不丟人,畢竟只是玩玩而已。畢竟低調(diào)和默默無聞的一個(gè)好處就是,如果不能在沉默中爆發(fā),那也可以在沉默中滅亡,一個(gè)聰明的富帥總是能把握好裝逼的力度和節(jié)奏。
最后,值得遺憾的是,AlphaGo沒有應(yīng)邀參賽。有人說,現(xiàn)在的AlphaGo面對(duì)絕藝眾人,其俯視感仍是上神之于小仙。不過什么時(shí)候絕藝們成長到足夠階段,不排除AlphaGo也會(huì)走下神壇跟它們較量一把的可能。
AlphaGo對(duì)戰(zhàn)李世石
但是小編認(rèn)為,其實(shí)目前的絕藝距離去年和李世石對(duì)戰(zhàn)時(shí)的阿爾法狗的水平(AlphaGo之后又有重大突破),也許并沒有大家說的大得那么離譜的距離。因?yàn)椴荒軉渭儼驯敬蜺EC比賽的棋譜水平和當(dāng)時(shí)AlphaGo李世石棋譜水平進(jìn)行簡單比較,因?yàn)楸敬蜺EC下得是快棋,而李世石那場下得是慢棋,計(jì)算時(shí)間限制小,這樣比對(duì)絕藝、DeepZenGO它們不太公平。
目前世界冠軍在絕藝手下的勝率
小編想說,我們最好還是少糾結(jié)于AI圍棋比賽的勝負(fù),因?yàn)锳I對(duì)人類的終極意義不可能是下圍棋,圍棋只是大公司們最直觀的的AI水平競爭的一種娛樂化形式。而真正重要的總應(yīng)該是各家AI在今后無人駕駛、保險(xiǎn)金融、城市建設(shè)規(guī)劃、智能醫(yī)療這些本質(zhì)工作上的能力幾何,希望到時(shí)各家AI也能力爭上游,友善競爭,給人類創(chuàng)造更多價(jià)值。
來源:互聯(lián)網(wǎng)叫獸
作者:互聯(lián)網(wǎng)叫獸
]]>在確定這個(gè)話題之前,有必要先對(duì)群嘲做個(gè)限定:
現(xiàn)在:在“API困境”被解決之前(后詳)。
人工智能助理:這里指的是Intelligent personal assistant/agent?(IPA)?又稱為Virtual Personal Assistant/Agent(VPA)——幫助個(gè)人完成多項(xiàng)任務(wù)或多項(xiàng)服務(wù)的虛擬助理,當(dāng)前討論的核心驅(qū)動(dòng)力是人工智能。(什么你說用人來做處理單元?那是呼叫中心,也叫客服,最看不起掛羊頭賣狗肉的了。)
在座:不止是創(chuàng)業(yè)公司,大公司也搞不定,國內(nèi)國外無所謂。
都是坑:創(chuàng)業(yè)公司做消費(fèi)端的虛擬助理,一定無法實(shí)現(xiàn)消費(fèi)級(jí)產(chǎn)品效果。對(duì)于巨頭也是,我相信大部分的相關(guān)負(fù)責(zé)人都以“進(jìn)步”為目標(biāo),而不敢跟自家CEO擔(dān)保要以“搞定”為目標(biāo)。
【什么是智能助理?】
智能助理屬于對(duì)話式服務(wù)
兩者的邊界不是很清晰,智能助理的功能在前面解釋過了;而“對(duì)話式服務(wù)(conversational service/commerce)”——這是包含智能助理在內(nèi)的多個(gè)產(chǎn)品形態(tài)的統(tǒng)稱,核心特點(diǎn)是:
對(duì)話式:人機(jī)交互的方式由圖形化交互(GUI-Graphical User Interface)變?yōu)橐詫?duì)話作為交互方式(CUI-Conversational User Interface業(yè)界暫時(shí)還沒有定義,這是我自己瞎編的),就是用說話來代替觸摸或者鼠標(biāo),操作計(jì)算設(shè)備。
服務(wù):提供服務(wù),解決問題都算,如訂機(jī)票,購買禮物等。不包括信息查詢(如天氣)。
Facebook M, 真人和AI結(jié)合的服務(wù)
去年(2015)起來的這一波對(duì)話式服務(wù)在硅谷有多火?看看創(chuàng)業(yè)團(tuán)隊(duì)增長的數(shù)量就知道了:2015年的時(shí)候有129個(gè)類似的項(xiàng)目出現(xiàn),而14年的時(shí)候才42個(gè)。
Tracxn Report:Conversational Commerce
在各類科技博客上,對(duì)Conversational Commerce的討論也非常熱烈,尤其是在medium.com上有大量的探討。基本的觀點(diǎn)就是”對(duì)話式的交互將會(huì)成為下一個(gè)風(fēng)口,大家趕緊上啊!“。截止到2016年6月的時(shí)候,在Producthunt上標(biāo)記為對(duì)話式服務(wù)(ConvComm)的有一百多個(gè)創(chuàng)業(yè)項(xiàng)目。
除了智能助理以外,還有很多類似的概念如digital agent,bot,service bot, chatbot,P2P的電商。比如Operator現(xiàn)在用真人專家?guī)陀脩糇鱿M(fèi)決策,在過去嘗試過用bot/AI但可惜達(dá)不到效果,或者magic模式,完全是靠”真人幫懶人用APP“驅(qū)動(dòng)運(yùn)營。本文主要討論的是基于人工智能的智能助理——就像IBM提到的一樣,只有如此才能真正規(guī)?;?。
智能助理應(yīng)該解決服務(wù)需求
巨頭的人工智能助理基本都已亮相了:
Facebook M
Amazon Echo
Google Assistant, Allo
Apple Siri
IBM Watson
Microsoft Cortana
以上智能助理的服務(wù)范圍大都是在信息檢索,幫助用戶獲得資訊。絕大多數(shù)的內(nèi)容是不牽涉“推理”的查詢類信息服務(wù)。比如:
1)明天的天氣如何?
2)找附近的星巴克在哪兒?
3)蘋果的股價(jià)如何?
如果用戶問到在基礎(chǔ)信息以上,一旦牽涉推理的問題,就無能為力了。比如:
1)明天這個(gè)天氣狀況會(huì)會(huì)造成航班延誤么?
2)我只有支付寶,附近的星巴克可以用么?
3)我什么時(shí)候該買蘋果的股票?
使用體驗(yàn)方面,這些助理的服務(wù)范圍覆蓋面基本跟當(dāng)前的所有引擎一樣。在設(shè)計(jì)邏輯上,基本都是基于用命名實(shí)體識(shí)別來代替打字輸入關(guān)鍵詞然后返回檢索結(jié)果SERP。而信息檢索,離人們要完成的服務(wù)需求有很大的區(qū)別。就好像viv.ai的聯(lián)合創(chuàng)始人Dag Kittlaus?說的,當(dāng)初他創(chuàng)建siri的時(shí)候,是想要重新挑戰(zhàn)移動(dòng)服務(wù),而不是造一個(gè)chatbot。
Dag Kittlaus 中間
除此以外,巨頭的助理與其關(guān)聯(lián)的生態(tài)產(chǎn)生操作的關(guān)聯(lián)。比如SIRI對(duì)iOS和macOS的操作;Cortana對(duì)windows的操作;echo對(duì)關(guān)聯(lián)著的智能家居設(shè)備的操作等等。此類操作的一個(gè)特點(diǎn),是對(duì)結(jié)果非常的確定,出現(xiàn)個(gè)性化選擇范圍非常的少。
另一方面,對(duì)于創(chuàng)業(yè)項(xiàng)目而言,因?yàn)椴痪邆漕愃频纳鷳B(tài)和硬件入口的條件,大都定位在資訊和服務(wù)上。我們選擇Producthunt當(dāng)中排在最前150位的項(xiàng)目進(jìn)行分析,其中高達(dá)70%的項(xiàng)目定位都在2C的個(gè)人助理(agent)上,其中大部分都想做切入服務(wù),包括垂直類的和多任務(wù)的。
這些助理服務(wù)當(dāng)中有23.1%是專業(yè)類型的服務(wù),主要是在醫(yī)療和理財(cái)方面。而剩下來的76.9%的助理干的最多的活兒是生活上的綜合幫助,出行安排,日程管理,購物訂餐廳等等——這一類是坑最大的地方——特別是那些試圖把生活上的各種服務(wù)都打包進(jìn)去的產(chǎn)品。
Producthunt上面69.7%的對(duì)話式服務(wù)都是智能助理產(chǎn)品(但并非所有都具備AI)
【人工智能助理的潛力】
移動(dòng)紅利的結(jié)束,行業(yè)需要新的增長點(diǎn)
很多跡象都指向同一個(gè)結(jié)論:移動(dòng)互聯(lián)的高速增長已經(jīng)飽和。比如用戶已經(jīng)不再愿意下載新的APP。
qz?(based on comscore data) &?statista
2016年1月有超過5萬個(gè)新的APP被提交到了appstore,但是在美國市場有65%的智能手機(jī)用戶在一個(gè)月內(nèi)下載新APP的數(shù)量為0,下了1個(gè)新APP的人占8.4%。
2015年中到現(xiàn)在,在國內(nèi)2C市場中,幾乎找不到一款真正能爆發(fā)并留存的移動(dòng)產(chǎn)品。對(duì)于移動(dòng)開發(fā)者而言,能放首屏的高頻應(yīng)用早就擠不進(jìn)去了。而且很多中低頻的服務(wù),并不是最適合用app來承載的。比如訂生日蛋糕,作為商業(yè)其價(jià)值一直存在,能通過信息化的方式來解決獲客或者能效問題么?宏觀來講肯定可以,但是開發(fā)一個(gè)APP則會(huì)面臨用戶獲取和使用成本高,難留存,用戶難發(fā)現(xiàn)等等障礙——這些問題,都讓開發(fā)者懷疑要不要做APP,特別是在最開始的PMF核心邏輯還沒有被驗(yàn)證的時(shí)候。
但創(chuàng)業(yè)者的熱情和投資人基金里的錢都不能等!于是大家憋著這口氣四處找風(fēng)口,或者又有怎樣的產(chǎn)品形態(tài)可以把商業(yè)形態(tài)再顛覆一次,好比APP顛覆了網(wǎng)頁,宏觀上有沒有新的產(chǎn)品形態(tài)可以再來一次?甚至運(yùn)氣更好點(diǎn),甚至開拓出以前沒有被耕耘過的維度?
對(duì)話式服務(wù)具備新的增長點(diǎn)的潛質(zhì)
回顧過去,最大的幾次浪潮基本都伴隨著一個(gè)規(guī)律:核心技術(shù)(軟硬一堆)的出現(xiàn)和整合,帶來全新的人機(jī)交互方式 ,在此基礎(chǔ)上大量的商業(yè)應(yīng)用應(yīng)運(yùn)而生。
從90年代,人機(jī)交互的三種變化
比如2007年末移動(dòng)互聯(lián)開始,核心驅(qū)動(dòng)的硬件是觸摸技術(shù)、各種sensor的成熟以及整體計(jì)算能力的提升和小型化;軟件方面則是iOS&Android的顛覆式出現(xiàn)。軟硬結(jié)合創(chuàng)造出完全顛覆過去的觸摸操作的體驗(yàn),并使其稱為真正可用的人機(jī)交互方式——讓圖形化界面的輸入工具,從鍵鼠時(shí)代跨越到了更intuitive的觸摸,并完美的與后面開放的生態(tài)系統(tǒng)結(jié)合起來(不得不再次對(duì)喬大爺表示敬佩)。
人機(jī)交互越來越傾向于人
可以看到隨著技術(shù)的平民化(democratization),人機(jī)交互正不可逆轉(zhuǎn)地向人的方向靠近——不需要學(xué)習(xí)的人機(jī)交互。
將來越來越多的人都能更自然的通過計(jì)算設(shè)備來獲得價(jià)值。下一個(gè)超級(jí)增長點(diǎn)的交互方式,一定是交互更接近人的自然行為,更多人可以使用的。
因?yàn)檐浻布拗?,過去用上計(jì)算設(shè)備的人很少。一方面,當(dāng)時(shí)的人機(jī)交互是讓人來“將就”機(jī)器——人學(xué)習(xí)機(jī)器的語言——操作需要專業(yè)技術(shù),如打孔…(在個(gè)人電腦方面,當(dāng)年知道’cd 文件夾名’的命令行的人也都是高端人士);另一方面計(jì)算設(shè)備巨貴,還不屬于個(gè)人設(shè)備,大眾都買不起;再者,日常應(yīng)用和普通生產(chǎn)力應(yīng)用幾乎沒有,所以買來設(shè)備學(xué)會(huì)了UI也沒啥用。而移動(dòng)設(shè)備出現(xiàn)就讓更多的人從使用計(jì)算設(shè)備中獲利,更多不會(huì)鍵盤鼠標(biāo)的人,通過觸摸手機(jī)屏來操作。將來人們想要獲得服務(wù)的時(shí)候,或許不需要有“計(jì)算設(shè)備”這個(gè)中間載體的概念。直接提出需求,就能獲得結(jié)果。
下一代的交互方式,似計(jì)算設(shè)備能覆蓋更廣的商業(yè)。
Google Assistant Allo
看看過去app如何顛覆web的,在沒有移動(dòng)互聯(lián)之前,大眾點(diǎn)評(píng)只是一個(gè)不知道幾流的小眾產(chǎn)品,web也并非最合適這個(gè)商業(yè)模式的產(chǎn)品形態(tài)——比如大部分情況下,人們想要找餐廳的時(shí)候,身邊都沒有PC來獲得其他人的點(diǎn)評(píng)信息;而移動(dòng)互聯(lián)的APP解決了這個(gè)問題。
這并不是說app代替了web(比如PS還是在桌面端更好用),而是借由移動(dòng)設(shè)備,app開啟了過去沒有的維度,繼而大眾點(diǎn)評(píng)的商業(yè)模式有了更合適的產(chǎn)品形態(tài)。我相信APP顛覆web的歷史,也會(huì)同樣發(fā)生在下一代人機(jī)交互的形態(tài)來顛覆當(dāng)前app的時(shí)候。不僅很多商業(yè)模式和形態(tài)都可以被重新考慮一次,甚至幾乎可以肯定CUI會(huì)打開新的維度,解放更多的商業(yè)價(jià)值。
如果一個(gè)C端產(chǎn)品做得好,傳播不受硬件束縛,沒有用戶的使用成本的障礙,并且不需要下載新的APP,直接在熟悉的IM或者SNS里實(shí)現(xiàn)過去用app承載的服務(wù),甚至還能開拓新的形態(tài)…比起當(dāng)前的其他選擇AR/VR/IoT/區(qū)塊鏈,CUI帶來的想象空間更大。所以,就有很多人,巨頭小頭沒頭的都來嘗試。
【對(duì)CUI的特點(diǎn)的理解決定產(chǎn)品價(jià)值】
不可否認(rèn)的,真正的CUI產(chǎn)品一定是基于人工智能的自然語言處理的。如何深入利用CUI的特點(diǎn),是產(chǎn)品打造的關(guān)鍵。
話說當(dāng)前國內(nèi)有很多投資人認(rèn)為,只要是做人工智能的團(tuán)隊(duì),就必須是MIT,Caltech出來的機(jī)器學(xué)習(xí)博士或者是GOOGLE,F(xiàn)ACEBOOK的AI團(tuán)隊(duì)的人;如果團(tuán)隊(duì)不是頂級(jí)院校的學(xué)者或者是巨頭出來的項(xiàng)目帶頭人,就沒有什么好搞的——這是典型的誤區(qū),或者說對(duì)行業(yè)的理解太淺了。這種理解基本等于 “聽說你是計(jì)算機(jī)專業(yè)畢業(yè)的,幫我裝一下電腦吧”這樣的水平。很不幸國內(nèi)好多年輕點(diǎn)的投資經(jīng)理基本都是這種水平(為什么年紀(jì)大點(diǎn)的不是?因?yàn)樗麄兝斫?#8217;不懂就不要輕易判斷’這樣的人生道理)。看不懂本質(zhì),就看表面,也是不得已。
這里,我非常贊同順為資本的孟醒的幾個(gè)觀點(diǎn):1)所謂“做AI的”也有幾個(gè)類型,底層研發(fā)和做應(yīng)用的是兩碼事。2)人工智能的底層交給大公司,小創(chuàng)業(yè)公司可以做點(diǎn)小模塊。而應(yīng)用層則有大量的空間給創(chuàng)業(yè)公司來實(shí)現(xiàn)商業(yè)化。3)“這個(gè)行業(yè)缺AI的產(chǎn)品經(jīng)理,不缺一般意義上的明星,特別牛x的算法達(dá)人,牛x的北京的BAT出來的人。” 這方面吳恩達(dá)也有類似的觀點(diǎn),“人工智能社區(qū)是極其開放的,大多數(shù)頂級(jí)研究者會(huì)出版他們的著作/分享他們的想法身子開源代碼。因此,在這個(gè)技術(shù)開元環(huán)境下,數(shù)據(jù)和人才就是稀缺的資源。”
有點(diǎn)跑題了,在這里就強(qiáng)調(diào)一下,CUI的核心技術(shù)是AI(不僅限NLP后面會(huì)提到)。對(duì)CUI作為新一代顛覆性人機(jī)交互的理解,才在產(chǎn)品形態(tài)上能發(fā)揮底層技術(shù)的商業(yè)價(jià)值。最后,再舉個(gè)例子,GUI的核心突破是技術(shù)大牛(xerox)帶領(lǐng)的,而其商業(yè)應(yīng)用的發(fā)揚(yáng)光大則是產(chǎn)品經(jīng)理喬布斯從xerox那兒“偷來”的。
1973年,xerox推出第一款GUI技術(shù)個(gè)人電腦;
在1983年,蘋果也推出了他們首款GUI電腦Lisa(喬老爺“ 完美借鑒 ”)
年輕人不懂就要多看書。
CUI的不可延續(xù)GUI的特點(diǎn)
為了深入理解這個(gè)問題,我們可能要先分析一下,CUI和GUI究竟給用戶體驗(yàn)帶來什么影響?因?yàn)檫@絕不是現(xiàn)在主流的“把按鈕變成語言操控”那么簡單的事情。
當(dāng)移動(dòng)設(shè)備出現(xiàn)的時(shí)候,大家對(duì)如何在智能手機(jī)上開發(fā)產(chǎn)品還沒有來得及有深入的了解。所以當(dāng)時(shí)開發(fā)者基本都是從最明顯的地方起步,也就是觸摸代替鍵鼠操作。早期的大量應(yīng)用,都是從“如何把web縮小到手機(jī)屏幕”的思路出發(fā)來設(shè)計(jì)APP的?!@是典型的延續(xù)上一代交互的思路。
隨著開發(fā)者不斷思考和挖掘移動(dòng)端的潛力,慢慢有了對(duì)移動(dòng)端真正的核心特質(zhì)的理解——這些“圣杯屬性”才是真正讓移動(dòng)端產(chǎn)品設(shè)計(jì)出眾的要素。比如“碎片時(shí)間”、“個(gè)人身份綁定“、”LBS”等等,這些特質(zhì)才是真正讓移動(dòng)產(chǎn)品體現(xiàn)價(jià)值的——這些是完全顛覆上一代交互的屬性。而且我們發(fā)現(xiàn)這些屬性幾乎跟“觸摸”這個(gè)明顯的交互行為沒有直接關(guān)系。
現(xiàn)在CUI出現(xiàn)的時(shí)候,產(chǎn)品經(jīng)理也會(huì)面臨類似的問題。當(dāng)前大多數(shù)智能助理的設(shè)計(jì)思路都是“過去APP是怎么用的,我現(xiàn)在用語言來代替觸摸操作”。好比是用語言來代替手指去觸摸屏幕,或者是用說話來代替手指打字。而能讓用戶感覺真正智能的核心,我認(rèn)為依然藏在CUI的“圣杯屬性”里,有待大家發(fā)掘。
CUI的特點(diǎn):高度個(gè)性化
舉一個(gè)例子,根據(jù)實(shí)際研發(fā)和市場運(yùn)作的經(jīng)驗(yàn),我們發(fā)現(xiàn)有一個(gè)算得上“圣杯屬性”是特質(zhì)是:“高度個(gè)性化”。
在GUI時(shí)代,用戶使用產(chǎn)品時(shí),有一個(gè)可視化的界面,比如找餐廳,我們打開點(diǎn)評(píng)看上去是這樣:
這看上去是一個(gè)大家非常熟悉的界面,只是所有用戶能做的選擇范圍,都明確的顯示在界面上(所見即所選)。找美食,用戶能做的選擇基本就是:附近,類型,智能排序(不點(diǎn)開可能還不知道是什么意思)以及排序。當(dāng)用戶自己不知道該如何決策的時(shí)候,這些視覺化的框架,給了用戶提示該從這些方面根據(jù)自己的需求來做篩選和匹配。
但是在智能助理的界面,用戶看到的是這樣的:
用戶對(duì)可以做哪些選擇一無所知——在沒有可視化的參考下,面對(duì)如此開放的交互,當(dāng)用戶要找一個(gè)餐廳的時(shí)候,他們提出的要求,大都不在GUI設(shè)定的范圍以內(nèi)。
根據(jù)我們實(shí)際操作的經(jīng)驗(yàn),用戶提出的問題是這樣的:
只有“在外灘附近的”是之前GUI的查詢范圍當(dāng)中的,其他的需求都是過去GUI的類型當(dāng)中不存在的維度。但因?yàn)镃UI的開放性,用戶很容易給出上面這樣的高度個(gè)性化(非結(jié)構(gòu)化)的需求。
如果GUI的產(chǎn)品試圖在個(gè)性化同樣給用戶那么多選擇,就不得不面臨用戶使用成本的問題。一個(gè)界面可能會(huì)被大量的下拉列表,層級(jí)關(guān)系,各種填空和操作充滿。如此是加深了個(gè)性化程度了,但是操作的成本會(huì)讓用戶放棄使用。
如果在智能助理的產(chǎn)品設(shè)計(jì)上,不尊重用戶“高度個(gè)性化”的需求,只提供過去APP本身提供的個(gè)性化程度“在XX附近找個(gè)YY菜”,那么用戶在實(shí)際提需求的時(shí)候得靠運(yùn)氣撞到既定的條件上,不然就是無法識(shí)別的范圍,繼而失望。另一方面,如果CUI只是在做GUI范圍內(nèi)的事情,會(huì)遠(yuǎn)不足以顛覆APP。
除此之外,CUI還有一些專屬的特點(diǎn)。比如
使用流程非線性:比如GUI是線性的流程,界面引導(dǎo)用戶一步一步走到結(jié)果;而CUI則可以是完全無視先后順序的,用戶可以再最開始就提出本來到排在最后的條件當(dāng)中。
可避免信息過載:用戶打開GUI的一個(gè)界面,比如點(diǎn)評(píng)上找一個(gè)餐廳,用戶得在一個(gè)列表里去找尋自己最想要的選項(xiàng)(典型的案例是,GUI讓用戶選擇國家的時(shí)候那一長排的列表)。而CUI則可以規(guī)避用戶的信息過載,直接給出期望的結(jié)果。這個(gè)特點(diǎn)的另一面是,GUI因此是informative的,給不熟悉場景的用戶更多的提示,或者比較結(jié)果的機(jī)會(huì)。
復(fù)合動(dòng)作:“明天或后天,晚上最便宜的機(jī)票”——從用戶的操作和實(shí)際體驗(yàn)來看,GUI無法一次給出結(jié)果,只能用戶先查一次明天的機(jī)票,再查一次后天的機(jī)票,然后手動(dòng)來對(duì)比。CUI完勝——可以直接給出相關(guān)條件的檢索結(jié)果,前提是AI足夠優(yōu)秀。
這里只是拋磚引玉,詳細(xì)更多特質(zhì)會(huì)不斷被開發(fā)者發(fā)掘出來。在這里就不詳細(xì)展開了。在另一篇《人工智能時(shí)代的產(chǎn)品經(jīng)理》文章當(dāng)中,會(huì)做更多關(guān)于CUI的分析。
【什么樣的AI Agent能滿足C端的需求??】
為什么現(xiàn)在的助理產(chǎn)品都是坑?很多團(tuán)隊(duì)不是底層的算法差,而是團(tuán)隊(duì)對(duì)產(chǎn)品的理解有問題。
要滿足C端用戶的需求,確實(shí)非常難。10次使用,有一次因?yàn)槿我庠虻氖?,用戶心理就?huì)開始有疑慮。從體驗(yàn)上來看,在用戶熟悉的場景下得全面理解用戶提出的需求;在用戶自身不清楚場景下,得自然的協(xié)助用戶挖掘需求;獲得需求后得幫助用戶做決策,并最終呈現(xiàn)結(jié)果。以此來看,對(duì)話式的agent就得至少滿足以下功能:
具備基于上下文的對(duì)話能力 (contextual conversation)
具備理解口語中的邏輯 (logic understanding)
所有能理解的需求,都要有能力履行(full-fulfillment)
1、基于上下文的對(duì)話能力(contextual conversation)
在當(dāng)前,做助理的產(chǎn)品的底層技術(shù)基本都是圍繞NLU(自然語言理解)打造的,很多還沒有涉及到NLP。可是無論是大公司還是小公司的NLU都是讓人失望的。舉個(gè)簡單的例子,在大公司的幾個(gè)產(chǎn)品上提出需求:我下周五要去北京,幫我查一下航班。
需要識(shí)別意圖:查機(jī)票
需要識(shí)別entities:時(shí)間(下周五),目的地(北京),出發(fā)地(無/當(dāng)前地理位置)
我們看看結(jié)果,首先看三家的回復(fù),從左到右分別是蘋果的SIRI, 微軟的CORTANA, Google的ALLO。
沒有一個(gè)能識(shí)別出來意圖,全部做為用關(guān)鍵詞來檢索網(wǎng)頁(SERP)。沒有識(shí)別出意圖,繼而也就沒有可能識(shí)別entity所在的場景。對(duì)于C端用戶而言,這可能算是最基礎(chǔ)的服務(wù)之一,而三大巨頭提供的產(chǎn)品完全不能用。
不過當(dāng)我們看到國內(nèi)的創(chuàng)業(yè)公司,卻能按照需求識(shí)別出意圖,并且識(shí)別出對(duì)應(yīng)的entity,組合查詢出結(jié)果,看上去比幾個(gè)巨頭更強(qiáng)大。
我們繼續(xù)測試上下文的對(duì)話。比如,我是國航的會(huì)員,agent給出上面的結(jié)果里沒有國航的航班,我自然會(huì)問:”有沒有國航的?“
結(jié)果并沒有如期望那樣,在給出的列表里找到國航的航班。而是開始了重新的一次查詢。
換一句話來說,沒有結(jié)合上下文的對(duì)話。我并不是為了黑,事實(shí)上這個(gè)產(chǎn)品在國內(nèi)的創(chuàng)業(yè)公司中也算不錯(cuò)的技術(shù)了。但是不會(huì)結(jié)合上下文的對(duì)話,會(huì)造成的最嚴(yán)重的問題就是這個(gè)agent基本不能獨(dú)立完成服務(wù)。因?yàn)橛脩舨粫?huì)在一個(gè)句子里把所有的條件都列出來。
以上是基本要素,就當(dāng)前的產(chǎn)品形態(tài)來看,只有非常少的產(chǎn)品能真正做到第一點(diǎn)。大部分號(hào)稱能做到的,都是濫竽充數(shù),連續(xù)問問題而已。
不能真正理解上下文的對(duì)話(機(jī)票查詢):
AGENT: 從哪里出發(fā)?
用戶:上海虹橋機(jī)場
AGENT:到哪里?
用戶:還是從浦東走吧
AGENT:好的,從虹橋出發(fā)到浦東的航班是……
在上面的對(duì)話,AI Agent在問第二個(gè)問題的時(shí)候,不能理解用戶對(duì)前一個(gè)回答的修改(出發(fā)地從“虹橋”改為“浦東”),只是按照預(yù)先設(shè)計(jì)對(duì)話的順序,填上命名實(shí)體識(shí)別得來的entity。繼而查詢不到結(jié)果,給用戶的感覺就是笨。
真正理解上下文的對(duì)話(機(jī)票查詢):
AGENT:從哪里出發(fā)?
用戶:上海虹橋機(jī)場
AGENT:到哪里?
用戶:算了,從浦東走吧
AGENT:好的,出發(fā)改為浦東。那到達(dá)城市呢?
用戶:北京
AGENT:好的,從浦東到北京的航班是…(給出正確的結(jié)果)
而具備真正上下文理解的對(duì)話,agent可以正確理解用戶第二個(gè)回答的內(nèi)容(從浦東走),其實(shí)是在修改上一問題的回答(出發(fā)機(jī)場),而不是真的在回答第二個(gè)問題(到達(dá)地在哪里)。
這只是上下文的例子,而對(duì)于服務(wù)類agent而言,所有后續(xù)的NLP功能都基于上下文對(duì)話為前提。這些看上去其實(shí)都是非常簡單的需求,但是當(dāng)前沒有任何一個(gè)2C的agent可以做到。
可能有人會(huì)問,大部分用戶都應(yīng)該在第一時(shí)間把需求表達(dá)出來吧,為什么還需要對(duì)話?實(shí)際上,真正操作過大量案例的同學(xué)就會(huì)發(fā)現(xiàn),用戶不可能如此”貼心“地按照開發(fā)者的設(shè)計(jì)來提出需求。
幫我看看下個(gè)星期五去北京,下午3點(diǎn)多,從虹橋出發(fā),國航的航班?!啊@一類的表達(dá)方式在幾乎從來沒有出現(xiàn)過。哪怕是在用戶最熟悉的場景,也很難確保一個(gè)句子的表達(dá)里包含了所有必須的檢索條件。而且,用戶還會(huì)不停的補(bǔ)充更多的個(gè)性化需求。
對(duì)于用戶自己比較了解的場景,如:訂機(jī)票需要提供到達(dá)地,用戶提出的大多數(shù)需求,在最初都是非常簡單,然后逐漸開始細(xì)化的。所以需要當(dāng)用戶提出不完整需求的時(shí)候,根據(jù)其意圖,結(jié)合之前已經(jīng)給過的條件,通過對(duì)話,向用戶提出問題,再獲得答案來補(bǔ)全剩下還需要的條件,最后再完成服務(wù)。
對(duì)于用戶自己不熟悉的場景,用戶根本就不知道自己該提出哪些方面的需求。如:不懂酒的用戶,想買一瓶合適的威士忌。他就根本很難提出除了價(jià)格以外的需求,比如產(chǎn)地,年份,釀造原料,水源等等。因此,Agent得以合適的方式來提問,引導(dǎo)用戶給出偏好,并且用對(duì)話提出推薦。
而且對(duì)于agent而言,很難判斷哪些用戶對(duì)服務(wù)的認(rèn)知有多深。如果不做識(shí)別,就容易問”老手“一些”新手問題“,繼而讓老手覺得我還不如自己下單;而給新手又留下”你在說什么我都不懂“的印象,也是不聰明。
所以要有好的體驗(yàn),這是非常困難的。而基于上下文的對(duì)話,只是最基礎(chǔ)的用戶需求之一。
2、理解口語中的邏輯 (logic understanding)
在我們的實(shí)踐中,我們發(fā)現(xiàn)對(duì)”邏輯“的理解直觀重要。原因也是因?yàn)橛脩舻恼?duì)話,大部分都不是開發(fā)者預(yù)設(shè)那樣的。
再做一個(gè)簡單的測試,比如找餐廳,試試:幫我推薦一個(gè)附近的餐廳,不要日本菜。
這是一個(gè)簡單邏輯,但是你看所有的服務(wù),這次包括剛剛那個(gè)國內(nèi)創(chuàng)業(yè)公司C一樣,都會(huì)是一個(gè)結(jié)果:全部推薦日本菜。
也讓朋友測試了亞馬遜echo的alexa,結(jié)果也無法識(shí)別”不要“這個(gè)最簡單的邏輯
這次其實(shí)比剛剛好多了,至少4家里面除了google allo,都識(shí)別出來我的意圖是找餐廳——但是,當(dāng)我明確提出不要日本菜的時(shí)候,給出結(jié)果的三家全部都是日本菜……也就是說“不要” 兩個(gè)字被完全忽略了。
觀察大量的用戶案例表明,當(dāng)用戶越是個(gè)性化需求強(qiáng)烈的時(shí)候,對(duì)話中出現(xiàn)邏輯和指代關(guān)系的頻次越高。
“有沒有更便宜的?”
“除了大床房以外的房間有么?”
“后天會(huì)比今天更冷么?”
“就要?jiǎng)倓偟哪莻€(gè)2千多的吧?!?/p>
“除了廉價(jià)航空,其他的航班都可以。”
以上這些需求是提需求的時(shí)候,在對(duì)話中經(jīng)常出現(xiàn)的表達(dá)方式,而且看似簡單,但是目前沒有任何一個(gè)NLU的系統(tǒng)或產(chǎn)品能夠正確的理解。主要的阻礙就是對(duì)邏輯的理解,還有在基于上下文對(duì)話中的指代關(guān)系的理解失敗。
3、NLP不是全部,還要有能力履行(API困境)
NLU并不是智能助理發(fā)展的瓶頸,供給端的數(shù)據(jù)才是。
我們假設(shè)如果有一個(gè)黑科技出現(xiàn),使得NLP有了極大的進(jìn)步,以至于兩個(gè)條件:1)基于上下文場景的對(duì)話;2)口語邏輯,都能被理解了,甚至還能基于場景和上下文用NLG來生成各類問題——它能理解我們所有講出來的需求。
在用戶熟悉的范圍內(nèi),它能結(jié)合所有的過去的對(duì)話,歷史記錄等等內(nèi)部外部條件,幫助用戶盡可能的實(shí)現(xiàn)“不用開口,就知道我在這個(gè)的需求”。比如當(dāng)用戶提出“推薦餐廳的需求”:
用戶:“女朋友周日過生日,推薦一個(gè)餐廳,找有江景的,最好桌子旁邊有一個(gè)大落地窗戶,能看到外面的夜景。吃的不要太貴,環(huán)境好點(diǎn),有現(xiàn)場音樂的最好是爵士,不要太吵的?!?(btw,這是一個(gè)真實(shí)需求)
Agent:“菜系有偏好么?”
用戶:“意大利餐和法餐都可以,對(duì)了不要離外灘太遠(yuǎn)了”
agent解析出以下選擇餐廳的條件:
周日晚(營業(yè))
適合女朋友過生日
有江景
有大落地窗
不要太貴
環(huán)境好
有現(xiàn)場音樂,爵士
不能太吵
意大利餐或者法餐
距離外灘不能太遠(yuǎn)
然后它去哪里找到這樣的餐廳呢?在地圖服務(wù)提供商,或者點(diǎn)評(píng)的API提供的信息里只有8,9,兩項(xiàng)能找到數(shù)據(jù)。假設(shè)評(píng)論中有這樣的數(shù)據(jù),該用什么方式來傳遞呢?接口提供的都是結(jié)構(gòu)化的數(shù)據(jù),而“環(huán)境好”這樣的非結(jié)構(gòu)化數(shù)據(jù),最多以標(biāo)簽的方式來做,但是這樣的話,標(biāo)簽就會(huì)有無止境的多也不現(xiàn)實(shí)。
這就是我們所謂的“API困境”——當(dāng)前基于API的數(shù)據(jù)傳遞方式,只能1)承載結(jié)構(gòu)化數(shù)據(jù);2)承載數(shù)量非常有限的結(jié)構(gòu)化數(shù)據(jù)。
當(dāng)前基于GUI的產(chǎn)品,都是用API來傳遞結(jié)構(gòu)化數(shù)據(jù)。但大量個(gè)性化數(shù)據(jù)往往是非結(jié)構(gòu)化的,以當(dāng)前API的方式很難被處理。這還是在使用場景或者服務(wù)比較簡單的情況下。
在用戶不熟悉的場景下,agent面對(duì)稍微專業(yè)一點(diǎn)的服務(wù),就會(huì)遇到知識(shí)圖譜的問題。簡單來講,agent要做推薦的前提是對(duì)推薦的內(nèi)容得先有了解。好比,要向一位不懂酒的用戶推薦一款威士忌,那就不能依賴這位用戶自己提出的問題(很可能提不出要求),而得依賴“懂行”的自己對(duì)威士忌的理解的方方面面來引導(dǎo)用戶做合適他的選擇。一個(gè)助理顯然無法擁有所有服務(wù)所需的知識(shí)圖譜。
從知識(shí)圖譜的結(jié)構(gòu)來看,是相對(duì)可被結(jié)構(gòu)化。一個(gè)服務(wù)可以以各種方式被拆解成很多個(gè)方面,但大量的方面在當(dāng)前是沒有結(jié)構(gòu)化數(shù)據(jù)的(比如我們沒有每家餐廳的”營業(yè)面積“的數(shù)據(jù));甚至很多方面無法用結(jié)構(gòu)化數(shù)據(jù)來表達(dá)(比如每家餐廳有否”適合浪漫約會(huì)“的環(huán)境)。
因此,智能助理就算有了強(qiáng)大的NLP,還需要全面的知識(shí)圖譜(結(jié)構(gòu)化數(shù)據(jù))和處理并傳遞非結(jié)構(gòu)化數(shù)據(jù)的能力——而這兩點(diǎn),在目前是無解的。
總結(jié)
在“API困境”解決之前,再加上NLP本身還有很長的路要走,基于人工智能的多任務(wù)服務(wù)agent不大可能達(dá)到C端滿意的水平。
創(chuàng)業(yè)團(tuán)隊(duì)各自最基礎(chǔ)的認(rèn)知計(jì)算的能力不會(huì)有太大的區(qū)別,都是踩在世界頂尖大牛的肩膀上——在這個(gè)領(lǐng)域創(chuàng)業(yè)團(tuán)隊(duì)想和大公司鋼正面,不是很理性。
創(chuàng)業(yè)團(tuán)隊(duì)在垂直領(lǐng)域有些自己的技術(shù)突破可以創(chuàng)造一些階段性的優(yōu)勢,但面對(duì)教育市場的大山而言,這點(diǎn)差異遠(yuǎn)不足以make a difference。
在各自領(lǐng)域,開發(fā)者對(duì)人工智能相關(guān)技術(shù)的理解和其帶來的交互層面的有效應(yīng)用,可能會(huì)在垂直商業(yè)應(yīng)用上創(chuàng)造更大的差異——比較起”95% VS 98%的識(shí)別率“ 而言。
來源:雷鋒網(wǎng)
]]>